Использование онтологического подхода для извлечения ожиданий к качеству данных корпоративных хранилищ
DOI:
https://doi.org/10.52575/2687-0932-2022-49-3-566-574Ключевые слова:
онтология предприятия, онтологическое моделирование, экспертные системы, проблема извлечения знаний, качество данныхАннотация
Важную роль в процессах интеллектуального анализа данных, построения корпоративных хранилищ данных и разработки информационно-аналитических систем играет качество данных. Статья посвящена постановке и обоснованию актуальности проблемы извлечения ожиданий к качеству данных корпоративных хранилищ. Несмотря на многочисленность публикаций, посвященных проблеме извлечения экспертных знаний, в области качества данных (Data quality) и управления данных в целом (Data governance) данная проблема слабо развита. Целью исследования является определение возможности расширения существующей проблемы извлечения экспертных знаний предлагаемой для дальнейших исследований проблемой извлечения ожиданий к качеству данных корпоративных хранилищ, а также разработка онтологической модели извлечения ожиданий к качеству данных корпоративных хранилищ. Исследование проводилось на основе онтологического подхода. В результате исследования была обоснована необходимость централизованного сбора требований к качеству данных организации, поставлена проблема извлечения ожиданий к качеству данных корпоративных хранилищ путем расширения существующей проблемы извлечения экспертных знаний, а также разработана онтологическая модель извлечения ожиданий к качеству данных корпоративных хранилищ.
Скачивания
Библиографические ссылки
Гаврилова Т.А., Червинская К.Р. 1992. Извлечение и структурирование знаний для экспертных систем / Т. А. Гаврилова, К. Р. Червинская. М.: Радио и связь, 1992. 199 с.: ил.; 22 см.
ГОСТ Р ИСО 8000-2-2019: Национальный стандарт Российской Федерации. Качество данных. Часть 2. Словарь [Электронный ресурс]. Стандартинформ. – Электронные данные. – Электронный текст документа подготовлен АО «Кодекс» и сверен по: М.: Стандартинформ, 2019. – режим доступа: https://docs.cntd.ru/document/1200169126 (дата обращения: 15.05.2022).
Загорулько Ю.А., Загорулько Г.Б. 2016. Инженерия знаний: учебное пособие. [Электронный ресурс] / Ю.А. Загорулько, Г.Б. Загорулько; Новосиб. гос. ун-т. – Новосибирск: РИЦ НГУ, 2016. 93 с. Режим доступа: http://e-lib.nsu.ru/dsweb/Get/Resource-1052/page001.pdf
Лидвелл У., Холден К., Батлер Дж. 2021. Универсальные принципы дизайна. Пер. А. Мороз. СПб.: Питер, 2021. 272 с.: ил.
Международные рекомендации по статистике промышленности. 2010. [Электронный ресурс] Организация Объединенных Наций. Серия «Статистические документы». – Электронные данные. – Нью-Йорк: Издательство Организации Объединенных Наций, 2010. Режим доступа: https://www.un-ilibrary.org/content/books/9789210563826/read (дата обращения: 05.11.2021).
Методология оценки и повышения качества данных. 2019. [Электронный ресурс] Аналитический центр при Правительстве Российской Федерации. – Электронные данные. – Режим доступа: https://digital.ac.gov.ru/upload/iblock/215/%D0%9A%D0%B0%D1%87%D0%B5%D1%81%D1%82%D0%B2%D0%BE%20%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85%20_f.pdf (дата обращения: 05.11.2021).
Цифровые технологии в российских компаниях. 2019. [Электронный ресурс] Результаты исследования КПМГ. Режим доступа: https://assets.kpmg/content/dam/kpmg/ru/pdf/2019/01/ru-ru-digital-technologies-in-russian-companies.pdf (Дата обращения: 21.04.2022)
DAMA-DMBOK: Свод знаний по управлению данными. Второе издание. 2020. Dama International [пер. с англ. Г. Агафонова]. М.: Олимп–Бизнес, 2020. 828 с.: ил.
Data Rules Program Strategy: International Petroleum Data Standards. 2018. [Электронный ресурс] The Professional Petroleum Data Management (PPDM) Association. – Электронные данные. – Калгари: Ассоциация профессионального управления нефтяными данными (PPDM), 2018. – Режим доступа: https://dl.ppdm.org/dl/2263 (дата обращения: 07.11.2021).
IBM Analytics Solutions Unified Method (ASUM) [Электронный ресурс] / IBM Analytics. Режим доступа: http://gforge.icesi.edu.co/ASUM-DM_External/index.htm#cognos.external.asum-DM_Teaser/tasks/sps_clean_data_F9A96B23.html?proc=_0eKIHlt6EeW_y7k3h2HTng&path=_0eKIHlt6EeW_y7k3h2HTng,_0eHEyVt6EeW_y7k3h2HTng,_0eIS8Vt6EeW_y7k3h2HTng,_0eIS51t6EeW_y7k3h2HTng (Дата обращения: 22.04.2022)
Loshin David. 2010. The Practitioner's Guide to Data Quality Improvement (1st. ed.). Morgan Kaufmann Publishers Inc., San Francisco, CA, USA.
Килимова А.Д. 2022. Потоки данных в легкой промышленности. Компетентность. № 3. [Электронный ресурс] URL: https://cyberleninka.ru/article/n/potoki-dannyh-v-legkoy-promyshlennosti (дата обращения: 11.05.2022).
Ларичев О.И., Моргоев В.К. 1991. Проблемы, методы и системы извлечения экспертных знаний. Автомат. и телемех., выпуск 6, 3–27. [Электронный ресурс]. Режим доступа: http://www.mathnet.ru/links/15765250a80252d52d362d9091115564/at4189.pdf (дата обращения: 04.07.2022).
Любицын В.Н. 2012. Повышение качества данных в контексте современных аналитических технологий. Вестник ЮУрГУ. Серия: Компьютерные технологии, управление, радиоэлектроника. № 23. [Электронный ресурс] URL: https://cyberleninka.ru/article/n/povyshenie-kachestva-dannyh-v-kontekste-sovremennyh-analiticheskih-tehnologiy (дата обращения: 11.05.2022).
Chapman P., Clinton J., Kerber R., Khabaza T., Reinartz T., Shearer C., Wirth R. 2000. CRISP-DM 1.0 step-by-step data mining guide. SPSS, 2000, 78 p.
Fayyad U., Piatetsky-Shapiro G., Smyth P. 1996. “The kdd process for extracting useful knowledge from volumes of data,” Commun. ACM, Nov. 1996. 39(11): 27–34.
Feigenbaum E. 1980. Knowledge engineering: the applied side of artificial intelligence. Computer Science Department of Stanford University. Stanford, [Электронный ресурс] – Режим доступа: https://stacks.stanford.edu/file/druid:cn981xh0967/cn981xh0967.pdf (дата обращения: 04.07.2022).
Martínez-Plumed F. et al. 2021. "CRISP-DM Twenty Years Later: From Data Mining Processes to Data Science Trajectories," in IEEE Transactions on Knowledge and Data Engineering, 33(8): 3048-3061, 1 Aug. 2021, doi: 10.1109/TKDE.2019.2962680.
Martinez-Plumed F., Ochando L.C., Ferri C., Flach P. A., Hernandez-Orallo J., Kull M., Lachiche N., Ramirez-Quintana M. J. 2017. “CASP-DM: context aware standard process for data mining,” CoRR, vol. abs/1709.09003, 2017. [Online]. Available: http://arxiv.org/abs/1709.09003
Moyle S., Jorge A. 2001. “Ramsys-a methodology for supporting rapid remote collaborative data mining projects,” in ECML/PKDD 2001 Workshop on Integrating Aspects of Data Mining, Decision Support and Meta-Learning: Internal SolEuNet Session, 2001, 20–31.
Просмотров аннотации: 142
Поделиться
Опубликован
Как цитировать
Выпуск
Раздел
Copyright (c) 2022 Экономика. Информатика
Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.