Using an Ontological Approach to Extract Expectations About the Data Quality of Enterprise Data Warehouses
DOI:
https://doi.org/10.52575/2687-0932-2022-49-3-566-574Keywords:
enterprise ontology, ontological modeling, expert systems, knowledge extraction problem, data qualityAbstract
An important role in the processes of data mining, building corporate data warehouses and developing information and analytical systems is played by data quality. The article is devoted to the formulation and substantiation of the relevance of the problem of extracting expectations for the quality of corporate storage data. Despite the numerous publications devoted to the problem of extracting expert knowledge, in the field of data quality (Data quality) and data governance in general (Data governance), this problem is underdeveloped. The aim of the study is to determine the possibility of expanding the existing problem of extracting expert knowledge by the problem of extracting expectations for the quality of data of corporate storages, proposed for further research, as well as developing an ontological model for extracting expectations for the quality of data of corporate storages. The study was carried out on the basis of the ontological approach. As a result of the study, the need for a centralized collection of requirements for the quality of data of an organization was substantiated, the problem of extracting expectations for the quality of data of corporate storages was posed by expanding the existing problem of extracting expert knowledge, and an ontological model for extracting expectations for the quality of data of corporate storages was developed.
Downloads
References
Гаврилова Т.А., Червинская К.Р. 1992. Извлечение и структурирование знаний для экспертных систем / Т. А. Гаврилова, К. Р. Червинская. М.: Радио и связь, 1992. 199 с.: ил.; 22 см.
ГОСТ Р ИСО 8000-2-2019: Национальный стандарт Российской Федерации. Качество данных. Часть 2. Словарь [Электронный ресурс]. Стандартинформ. – Электронные данные. – Электронный текст документа подготовлен АО «Кодекс» и сверен по: М.: Стандартинформ, 2019. – режим доступа: https://docs.cntd.ru/document/1200169126 (дата обращения: 15.05.2022).
Загорулько Ю.А., Загорулько Г.Б. 2016. Инженерия знаний: учебное пособие. [Электронный ресурс] / Ю.А. Загорулько, Г.Б. Загорулько; Новосиб. гос. ун-т. – Новосибирск: РИЦ НГУ, 2016. 93 с. Режим доступа: http://e-lib.nsu.ru/dsweb/Get/Resource-1052/page001.pdf
Лидвелл У., Холден К., Батлер Дж. 2021. Универсальные принципы дизайна. Пер. А. Мороз. СПб.: Питер, 2021. 272 с.: ил.
Международные рекомендации по статистике промышленности. 2010. [Электронный ресурс] Организация Объединенных Наций. Серия «Статистические документы». – Электронные данные. – Нью-Йорк: Издательство Организации Объединенных Наций, 2010. Режим доступа: https://www.un-ilibrary.org/content/books/9789210563826/read (дата обращения: 05.11.2021).
Методология оценки и повышения качества данных. 2019. [Электронный ресурс] Аналитический центр при Правительстве Российской Федерации. – Электронные данные. – Режим доступа: https://digital.ac.gov.ru/upload/iblock/215/%D0%9A%D0%B0%D1%87%D0%B5%D1%81%D1%82%D0%B2%D0%BE%20%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85%20_f.pdf (дата обращения: 05.11.2021).
Цифровые технологии в российских компаниях. 2019. [Электронный ресурс] Результаты исследования КПМГ. Режим доступа: https://assets.kpmg/content/dam/kpmg/ru/pdf/2019/01/ru-ru-digital-technologies-in-russian-companies.pdf (Дата обращения: 21.04.2022)
DAMA-DMBOK: Свод знаний по управлению данными. Второе издание. 2020. Dama International [пер. с англ. Г. Агафонова]. М.: Олимп–Бизнес, 2020. 828 с.: ил.
Data Rules Program Strategy: International Petroleum Data Standards. 2018. [Электронный ресурс] The Professional Petroleum Data Management (PPDM) Association. – Электронные данные. – Калгари: Ассоциация профессионального управления нефтяными данными (PPDM), 2018. – Режим доступа: https://dl.ppdm.org/dl/2263 (дата обращения: 07.11.2021).
IBM Analytics Solutions Unified Method (ASUM) [Электронный ресурс] / IBM Analytics. Режим доступа: http://gforge.icesi.edu.co/ASUM-DM_External/index.htm#cognos.external.asum-DM_Teaser/tasks/sps_clean_data_F9A96B23.html?proc=_0eKIHlt6EeW_y7k3h2HTng&path=_0eKIHlt6EeW_y7k3h2HTng,_0eHEyVt6EeW_y7k3h2HTng,_0eIS8Vt6EeW_y7k3h2HTng,_0eIS51t6EeW_y7k3h2HTng (Дата обращения: 22.04.2022)
Loshin David. 2010. The Practitioner's Guide to Data Quality Improvement (1st. ed.). Morgan Kaufmann Publishers Inc., San Francisco, CA, USA.
Килимова А.Д. 2022. Потоки данных в легкой промышленности. Компетентность. № 3. [Электронный ресурс] URL: https://cyberleninka.ru/article/n/potoki-dannyh-v-legkoy-promyshlennosti (дата обращения: 11.05.2022).
Ларичев О.И., Моргоев В.К. 1991. Проблемы, методы и системы извлечения экспертных знаний. Автомат. и телемех., выпуск 6, 3–27. [Электронный ресурс]. Режим доступа: http://www.mathnet.ru/links/15765250a80252d52d362d9091115564/at4189.pdf (дата обращения: 04.07.2022).
Любицын В.Н. 2012. Повышение качества данных в контексте современных аналитических технологий. Вестник ЮУрГУ. Серия: Компьютерные технологии, управление, радиоэлектроника. № 23. [Электронный ресурс] URL: https://cyberleninka.ru/article/n/povyshenie-kachestva-dannyh-v-kontekste-sovremennyh-analiticheskih-tehnologiy (дата обращения: 11.05.2022).
Chapman P., Clinton J., Kerber R., Khabaza T., Reinartz T., Shearer C., Wirth R. 2000. CRISP-DM 1.0 step-by-step data mining guide. SPSS, 2000, 78 p.
Fayyad U., Piatetsky-Shapiro G., Smyth P. 1996. “The kdd process for extracting useful knowledge from volumes of data,” Commun. ACM, Nov. 1996. 39(11): 27–34.
Feigenbaum E. 1980. Knowledge engineering: the applied side of artificial intelligence. Computer Science Department of Stanford University. Stanford, [Электронный ресурс] – Режим доступа: https://stacks.stanford.edu/file/druid:cn981xh0967/cn981xh0967.pdf (дата обращения: 04.07.2022).
Martínez-Plumed F. et al. 2021. "CRISP-DM Twenty Years Later: From Data Mining Processes to Data Science Trajectories," in IEEE Transactions on Knowledge and Data Engineering, 33(8): 3048-3061, 1 Aug. 2021, doi: 10.1109/TKDE.2019.2962680.
Martinez-Plumed F., Ochando L.C., Ferri C., Flach P. A., Hernandez-Orallo J., Kull M., Lachiche N., Ramirez-Quintana M. J. 2017. “CASP-DM: context aware standard process for data mining,” CoRR, vol. abs/1709.09003, 2017. [Online]. Available: http://arxiv.org/abs/1709.09003
Moyle S., Jorge A. 2001. “Ramsys-a methodology for supporting rapid remote collaborative data mining projects,” in ECML/PKDD 2001 Workshop on Integrating Aspects of Data Mining, Decision Support and Meta-Learning: Internal SolEuNet Session, 2001, 20–31.
Abstract views: 135
Share
Published
How to Cite
Issue
Section
Copyright (c) 2022 ECONOMICS. INFORMATION TECHNOLOGIES
This work is licensed under a Creative Commons Attribution 4.0 International License.