Using an Ontological Approach to Extract Expectations About the Data Quality of Enterprise Data Warehouses

Authors

  • Alexander A. Afanasiev Kursk State University
  • Vitaly A. Kudinov Kursk State University

DOI:

https://doi.org/10.52575/2687-0932-2022-49-3-566-574

Keywords:

enterprise ontology, ontological modeling, expert systems, knowledge extraction problem, data quality

Abstract

An important role in the processes of data mining, building corporate data warehouses and developing information and analytical systems is played by data quality. The article is devoted to the formulation and substantiation of the relevance of the problem of extracting expectations for the quality of corporate storage data. Despite the numerous publications devoted to the problem of extracting expert knowledge, in the field of data quality (Data quality) and data governance in general (Data governance), this problem is underdeveloped. The aim of the study is to determine the possibility of expanding the existing problem of extracting expert knowledge by the problem of extracting expectations for the quality of data of corporate storages, proposed for further research, as well as developing an ontological model for extracting expectations for the quality of data of corporate storages. The study was carried out on the basis of the ontological approach. As a result of the study, the need for a centralized collection of requirements for the quality of data of an organization was substantiated, the problem of extracting expectations for the quality of data of corporate storages was posed by expanding the existing problem of extracting expert knowledge, and an ontological model for extracting expectations for the quality of data of corporate storages was developed.

Downloads

Download data is not yet available.

Author Biographies

Alexander A. Afanasiev, Kursk State University

Postgraduate Student, Department of Software and Administration of Information Systems, Kursk State University,
Kursk, Russia

Vitaly A. Kudinov, Kursk State University

Doctor of Pedagogy, Professor, Professor of the Department of Software and Information Systems Administration, Kursk State University,
Kursk, Russia

References

Гаврилова Т.А., Червинская К.Р. 1992. Извлечение и структурирование знаний для экспертных систем / Т. А. Гаврилова, К. Р. Червинская. М.: Радио и связь, 1992. 199 с.: ил.; 22 см.

ГОСТ Р ИСО 8000-2-2019: Национальный стандарт Российской Федерации. Качество данных. Часть 2. Словарь [Электронный ресурс]. Стандартинформ. – Электронные данные. – Электронный текст документа подготовлен АО «Кодекс» и сверен по: М.: Стандартинформ, 2019. – режим доступа: https://docs.cntd.ru/document/1200169126 (дата обращения: 15.05.2022).

Загорулько Ю.А., Загорулько Г.Б. 2016. Инженерия знаний: учебное пособие. [Электронный ресурс] / Ю.А. Загорулько, Г.Б. Загорулько; Новосиб. гос. ун-т. – Новосибирск: РИЦ НГУ, 2016. 93 с. Режим доступа: http://e-lib.nsu.ru/dsweb/Get/Resource-1052/page001.pdf

Лидвелл У., Холден К., Батлер Дж. 2021. Универсальные принципы дизайна. Пер. А. Мороз. СПб.: Питер, 2021. 272 с.: ил.

Международные рекомендации по статистике промышленности. 2010. [Электронный ресурс] Организация Объединенных Наций. Серия «Статистические документы». – Электронные данные. – Нью-Йорк: Издательство Организации Объединенных Наций, 2010. Режим доступа: https://www.un-ilibrary.org/content/books/9789210563826/read (дата обращения: 05.11.2021).

Методология оценки и повышения качества данных. 2019. [Электронный ресурс] Аналитический центр при Правительстве Российской Федерации. – Электронные данные. – Режим доступа: https://digital.ac.gov.ru/upload/iblock/215/%D0%9A%D0%B0%D1%87%D0%B5%D1%81%D1%82%D0%B2%D0%BE%20%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85%20_f.pdf (дата обращения: 05.11.2021).

Цифровые технологии в российских компаниях. 2019. [Электронный ресурс] Результаты исследования КПМГ. Режим доступа: https://assets.kpmg/content/dam/kpmg/ru/pdf/2019/01/ru-ru-digital-technologies-in-russian-companies.pdf (Дата обращения: 21.04.2022)

DAMA-DMBOK: Свод знаний по управлению данными. Второе издание. 2020. Dama International [пер. с англ. Г. Агафонова]. М.: Олимп–Бизнес, 2020. 828 с.: ил.

Data Rules Program Strategy: International Petroleum Data Standards. 2018. [Электронный ресурс] The Professional Petroleum Data Management (PPDM) Association. – Электронные данные. – Калгари: Ассоциация профессионального управления нефтяными данными (PPDM), 2018. – Режим доступа: https://dl.ppdm.org/dl/2263 (дата обращения: 07.11.2021).

IBM Analytics Solutions Unified Method (ASUM) [Электронный ресурс] / IBM Analytics. Режим доступа: http://gforge.icesi.edu.co/ASUM-DM_External/index.htm#cognos.external.asum-DM_Teaser/tasks/sps_clean_data_F9A96B23.html?proc=_0eKIHlt6EeW_y7k3h2HTng&path=_0eKIHlt6EeW_y7k3h2HTng,_0eHEyVt6EeW_y7k3h2HTng,_0eIS8Vt6EeW_y7k3h2HTng,_0eIS51t6EeW_y7k3h2HTng (Дата обращения: 22.04.2022)

Loshin David. 2010. The Practitioner's Guide to Data Quality Improvement (1st. ed.). Morgan Kaufmann Publishers Inc., San Francisco, CA, USA.

Килимова А.Д. 2022. Потоки данных в легкой промышленности. Компетентность. № 3. [Электронный ресурс] URL: https://cyberleninka.ru/article/n/potoki-dannyh-v-legkoy-promyshlennosti (дата обращения: 11.05.2022).

Ларичев О.И., Моргоев В.К. 1991. Проблемы, методы и системы извлечения экспертных знаний. Автомат. и телемех., выпуск 6, 3–27. [Электронный ресурс]. Режим доступа: http://www.mathnet.ru/links/15765250a80252d52d362d9091115564/at4189.pdf (дата обращения: 04.07.2022).

Любицын В.Н. 2012. Повышение качества данных в контексте современных аналитических технологий. Вестник ЮУрГУ. Серия: Компьютерные технологии, управление, радиоэлектроника. № 23. [Электронный ресурс] URL: https://cyberleninka.ru/article/n/povyshenie-kachestva-dannyh-v-kontekste-sovremennyh-analiticheskih-tehnologiy (дата обращения: 11.05.2022).

Chapman P., Clinton J., Kerber R., Khabaza T., Reinartz T., Shearer C., Wirth R. 2000. CRISP-DM 1.0 step-by-step data mining guide. SPSS, 2000, 78 p.

Fayyad U., Piatetsky-Shapiro G., Smyth P. 1996. “The kdd process for extracting useful knowledge from volumes of data,” Commun. ACM, Nov. 1996. 39(11): 27–34.

Feigenbaum E. 1980. Knowledge engineering: the applied side of artificial intelligence. Computer Science Department of Stanford University. Stanford, [Электронный ресурс] – Режим доступа: https://stacks.stanford.edu/file/druid:cn981xh0967/cn981xh0967.pdf (дата обращения: 04.07.2022).

Martínez-Plumed F. et al. 2021. "CRISP-DM Twenty Years Later: From Data Mining Processes to Data Science Trajectories," in IEEE Transactions on Knowledge and Data Engineering, 33(8): 3048-3061, 1 Aug. 2021, doi: 10.1109/TKDE.2019.2962680.

Martinez-Plumed F., Ochando L.C., Ferri C., Flach P. A., Hernandez-Orallo J., Kull M., Lachiche N., Ramirez-Quintana M. J. 2017. “CASP-DM: context aware standard process for data mining,” CoRR, vol. abs/1709.09003, 2017. [Online]. Available: http://arxiv.org/abs/1709.09003

Moyle S., Jorge A. 2001. “Ramsys-a methodology for supporting rapid remote collaborative data mining projects,” in ECML/PKDD 2001 Workshop on Integrating Aspects of Data Mining, Decision Support and Meta-Learning: Internal SolEuNet Session, 2001, 20–31.


Abstract views: 114

Share

Published

2022-09-30

How to Cite

Afanasiev, A. A., & Kudinov, V. A. (2022). Using an Ontological Approach to Extract Expectations About the Data Quality of Enterprise Data Warehouses. Economics. Information Technologies, 49(3), 566-574. https://doi.org/10.52575/2687-0932-2022-49-3-566-574

Issue

Section

SYSTEM ANALYSIS AND PROCESSING OF KNOWLEDGE