Algorithms and Tools for Processing Data on Scientific Organizations' Articles Uploaded to eLIBRARY.RU

Authors

  • Oleg S. Reznichenko Belgorod State National Research University

DOI:

https://doi.org/10.52575/2687-0932-2025-52-1-181-193

Keywords:

scientometrics, xml to Excel, xml parsing, Microsoft Excel, Pandas.DataFrame, Science Index, Python, list of articles, publication activity report

Abstract

Scientific organizations frequently generate various types of external and internal publication activity reports. Most of the reports are presented in a tabular dataset format and are based on content from the eLIBRARY.RU portal. After reviewing and analyzing existing software tools for automated export of articles data from eLIBRARY.RU into a spreadsheet format, it was found that there are no ready-made software tools or open-source solutions publicly available that can be easily modified to solve this problem. This research aims to develop such software tools. The paper designs an algorithm for exporting and converting articles' XML metadata using Microsoft Excel and an original Python script. The Python script is created using the Pandas.DataFrame class. This algorithm and the software tools will reduce the time specialists spend analyzing the publication activity of scientific organizations and their departments by eliminating manual data processing.

Downloads

Download data is not yet available.

Author Biography

Oleg S. Reznichenko, Belgorod State National Research University

Senior lecturer of the Department of Applied Informatics and Information Technology, Belgorod State National Research University, Belgorod, Russia

E-mail: oreznichenko@bsuedu.ru

References

Список литературы

Гуськов А.Е., Косяков Д.В. 2020. Национальный фракционный счет и оценка научной результативности организаций. Научные и технические библиотеки, 1(9):15–42. DOI:10.33186/1027-3689-2020-9-15-42

Желнов Павел. 2022. Средство экспорта библиографических записей из eLIBRARY.RU (СЕБЗЕР). GitHub. URL: https://github.com/p1m-ortho/xs-sebzer (дата обращения: 23.01.2025)

ИФЗ РАН. 2018. Инструкция по внесению списка публикаций из РИНЦ в систему ИСТИНА. Москва. URL: https://ifz.ru/documents/All/Instrukcija_po_dobavleniju_v_ISTINU_spiska_publikacii_iz_RINC_fin_03.pdf (дата обращения: 24.01.2025)

Кондратьев Андрей, Бондяков Алексей. 2024. Автоматизированный сбор и систематизация публикаций. Открытые системы архитекторам информационных систем, 2024(01). Москва, ООО «Издательство «Открытые системы». URL: https://www.osp.ru/os/2024/01/13058272 (дата обращения: 24.01.2025)

Маврин Владислав. 2020. Экспорт из РИНЦ в Гефест. URL: https://www.youtube.com/watch?v=rImH64dUpqo (дата обращения: 24.01.2025)

Научная электронная библиотека. 2024. Интерфейс программирования приложений API. 2024. URL: https://www.elibrary.ru/projects/api/api_info.asp (дата обращения: 24.01.2025)

Научная электронная библиотека. 2024. Научная электронная библиотека eLIBRARY.RU. URL: https://www.elibrary.ru/defaultx.asp (дата обращения: 24.01.2025)

Научная электронная библиотека. 2024. Science Index. URL: https://www.elibrary.ru/projects/science_index/info_org.pdf#page=24&zoom=100,53,508 (дата обращения: 24.01.2025)

НИИ механики МГУ. 2018. Импорт данных из системы eLibrary.ru. Москва. URL: https://istina.msu.ru/help/import/elibrary/ (дата обращения: 24.01.2025)

ПервыйБИТ. 2017. Импорт публикаций из портала научной электронной библиотеки. URL: http://www.almazovcentre.ru/wp-content/uploads/Импорт-публикаций-из-РИНЦ-в-БИТ-1.pdf (дата обращения: 24.01.2025)

Попов А.Ю., Ремез М.В., Жилина Е.В., Ожиганова М.И. 2022. Парсинг электронных ресурсов. Библиотека selenium или fake useragent? Информатизация в цифровой экономике, 3(4):197–210. DOI 10.18334/ide.3.4.115219

Резниченко О.С. 2025. Приложение к статье «Algorithms and tools for transformation of scientific organizations' articles data which downloading from the eLIBRARY.RU portal». GitHub. URL: https://github.com/leo-phoenix/elibrary_xml_to_xls (дата обращения: 24.01.2025)

Сахалинский государственный университет. 2024. Базовая инструкция по работе в системе 1С: Университет ПРОФ. Выгрузка из ELibrary. Южно-Сахалинск. URL: http://sakhgu.ru/wp-content/uploads/page/record_121377/2024_10/ELibrary_1С_Университет_ПРОФ.pdf (дата обращения: 24.01.2025)

Чуриков Д.В. 2018. Конвертация метаданных научных статей из файла XML стандарта РИНЦ для импорта записей в форматах «CrossRef» (DOI) и WordPress. Свидетельство о государственной регистрации программы для ЭВМ № 2018665773 от 11.12.2018. Москва: Федеральная служба по интеллектуальной собственности. URL: https://www.elibrary.ru/item.asp?edn=aoexus (дата обращения: 24.01.2025)

Шишкин Д.Н., Сибилева Н.С., Логунова О.С. 2021. Программа для импорта данных о публикационной активности из наукометрических систем. Свидетельство о государственной регистрации программы для ЭВМ № 2021663719 от 23.08.2021. Москва: Федеральная служба по интеллектуальной собственности. URL: https://www.elibrary.ru/item.asp?id=46602190 (дата обращения: 24.01.2025)

Biniok Jan. 2025. Tampermonkey. URL: https://www.tampermonkey.net (дата обращения: 24.01.2025)

JetBrain. 2025. PyCharm: The Python IDE for data and web professionals. URL: https://www.jetbrains.com/pycharm/ (дата обращения: 24.01.2025)

Microsoft. 2025. Explore Microsoft 365 for free. URL: https://www.microsoft.com/en-us/microsoft-365/try (дата обращения: 24.01.2025)

Microsoft. 2025. Import XML data. URL: https://support.microsoft.com/en-us/office/import-xml-data-6eca3906-d6c9-4f0d-b911-c736da817fa4 (дата обращения: 24.01.2025)

Van den Bossche Joris at al. 2024. pandas.DataFrame. URL: https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.html (дата обращения: 24.01.2025)

van Rossum Guido at al. 2025. Python. URL: https://www.python.org (дата обращения: 24.01.2025)

References

Guskov A.E., Kosyakov D.V. 2020. National Fractional Calculations and Evaluating Organization's Science Efficiency. Scientific and Technical Libraries, 1(9):15–42. (in Russian). DOI: 10.33186/1027-3689-2020-9-15-42

Zhelnov Pavel. 2022. Sredstvo e`ksporta bibliograficheskix zapisej iz eLIBRARY.RU (SEBZER) [Tool for exporting bibliographic records from eLIBRARY.RU (SEBZER)]. GitHub. Available at: https://github.com/p1m-ortho/xs-sebzer (accessed: 24 January 2025)

Schmidt Institute of physics of the earth of the Russian Academy of Sciences. 2018. Instrukciya po vneseniyu spiska publikacij iz RINCz v sistemu ISTINA [Manual for entering a list of articles from the Russian Science Citation Index into the “ISTINA” system]. Available at: https://ifz.ru/documents/All/Instrukcija_po_dobavleniju_v_ISTINU_spiska_publikacii_iz_RINC_fin_03.pdf (accessed: 24 January 2025)

Kondrat’ev Andrey, Bondyakov Aleksey. 2024. Avtomatizirovannyi sbor i sistematizatsiya publikatsii [Automated collection and systematization of articles]. Open Systems for Information Systems Architects, 2024(9) Available at: https://www.osp.ru/os/2024/01/13058272 (accessed: 24 January 2025)

Mavrin Vladislav. 2020. Ehksport iz RINTS v Gefest [Export from Russian Science Citation Index to "Gefest" system]. Available at: https://www.youtube.com/watch?v=rImH64dUpqo (accessed: 24 January 2025)

Scientific Electronic Library. 2024. Science Index. Interfeis dlya predstavitelya organizatsii [Science Index. Interface for a company representative]. Available at: https://www.elibrary.ru/projects/science_index/info_org.pdf#page=24&zoom=100,53,508 (accessed: 24 January 2025)

Scientific Electronic Library. 2024. Nauchnaya elektronnaya biblioteka eLIBRARY.RU [Scientific electronic library eLIBRARY.RU]. Available at: https://elibrary.ru/defaultx.asp (accessed: 24 January 2025)

Scientific Electronic Library. 2024. Interfeys programmirovaniya prilozheniy API [Application Programming Interface API]. Available at: https://www.elibrary.ru/projects/api/api_info.asp (accessed: 24 January 2025)

Institute of Mechanics. 2018. Import dannykh iz sistemy eLibrary.ru [Importing data from the eLibrary.ru system]. Available at: https://istina.msu.ru/help/import/elibrary/ (accessed: 23 January 2025)

Perviy Bit. 2017. Import publikatsii iz portala nauchnoi ehlektronnoi biblioteki [Importing articles from the scientific electronic library portal]. Available at: http://www.almazovcentre.ru/wp-content/uploads/Импорт-публикаций-из-РИНЦ-в-БИТ-1.pdf (accessed: 24 January 2025)

Popov A.Y., Remez M.V., Zhilina E.V., Ozhiganova M.I. 2022. Parsing of electronic resources. Selenium library or fake useragent? Informatization in the Digital Economy, 3(4): 197–210. (in Russian) DOI: 10.18334/ide.3.4.115219

Reznichenko Oleg. 2025. Appendix to article "Algorithms and tools for transformation of scientific organizations' articles data which downloading from the eLIBRARY.RU portal". GitHub. Available at: https://github.com/leo-phoenix/elibrary_xml_to_xls (accessed: 24 January 2025) (in Russian)

Sakhalin State University. 2024. Bazovaya instruktsiya po rabote v sisteme 1S: Universitet Prof. Vygruzka iz ELibrary [Basic manual for working with “1C: Univertitet Prof” system. Uploading from ELibrary]. Available at: http://sakhgu.ru/wp-content/uploads/page/record_121377/2024_10/ELibrary_1С_Университет_ПРОФ.pdf (accessed: 24 January 2025)

Churikov D.V. 2018. Konvertatsiya metadannykh nauchnykh statei iz faila XML standarta RINTS dlya importa zapisei v formatakh «CrossRef» (DOI) i WordPress [Converting scientific articles metadata from the XML file of the Russian Science Citation Index standard to import records in the CrossRef (DOI) and WordPress formats]. The Certificate on Official Registration of the Computer Program in Russia. No. 2018665773. Available at: https://www.elibrary.ru/item.asp?edn=aoexus (accessed: 24 January 2025)

Shishkin D.N., Sibileva N.S., Logunova O.S. 2021. Programma dlya importa dannykh o publikatsionnoi aktivnosti iz naukometricheskikh system [Software for importing publication activity data from scientometric systems]. The Certificate on Official Registration of the Computer Program in Russia. No. 2021663719. Available at: https://www.elibrary.ru/item.asp?id=46602190 (accessed: 24 January 2025)

Biniok Jan. 2025. Tampermonkey. Available at: https://www.tampermonkey.net (accessed: 24 January 2025)

JetBrain. 2025. PyCharm: The Python IDE for Professional Developers. Available at: https://www.jetbrains.com/pycharm/ (accessed: 24 January 2025)

Microsoft. 2025. Explore Microsoft 365 for free. Available at: https://www.microsoft.com/en-us/microsoft-365/try/ (accessed: 24 January 2025)

Microsoft. 2025. Import XML data. Available at: https://support.microsoft.com/en-us/office/import-xml-data-6eca3906-d6c9-4f0d-b911-c736da817fa4 (accessed: 24 January 2025)

Van den Bossche Joris at al. 2024. pandas.DataFrame. Available at: https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.html (accessed: 24 January 2025)

van Rossum Guido at al. 2025. Python. Available at: https://www.python.org (accessed: 23 January 2025)


Abstract views: 96

Share

Published

2025-03-28

How to Cite

Reznichenko, O. S. (2025). Algorithms and Tools for Processing Data on Scientific Organizations’ Articles Uploaded to eLIBRARY.RU. Economics. Information Technologies, 52(1), 181-193. https://doi.org/10.52575/2687-0932-2025-52-1-181-193

Issue

Section

SYSTEM ANALYSIS AND PROCESSING OF KNOWLEDGE