Использование онтологического подхода для извлечения ожиданий к качеству данных корпоративных хранилищ

Авторы

  • Александр Александрович Афанасьев Курский государственный университет
  • Виталий Алексеевич Кудинов Курский государственный университет

DOI:

https://doi.org/10.52575/2687-0932-2022-49-3-566-574

Ключевые слова:

онтология предприятия, онтологическое моделирование, экспертные системы, проблема извлечения знаний, качество данных

Аннотация

Важную роль в процессах интеллектуального анализа данных, построения корпоративных хранилищ данных и разработки информационно-аналитических систем играет качество данных. Статья посвящена постановке и обоснованию актуальности проблемы извлечения ожиданий к качеству данных корпоративных хранилищ. Несмотря на многочисленность публикаций, посвященных проблеме извлечения экспертных знаний, в области качества данных (Data quality) и управления данных в целом (Data governance) данная проблема слабо развита. Целью исследования является определение возможности расширения существующей проблемы извлечения экспертных знаний предлагаемой для дальнейших исследований проблемой извлечения ожиданий к качеству данных корпоративных хранилищ, а также разработка онтологической модели извлечения ожиданий к качеству данных корпоративных хранилищ. Исследование проводилось на основе онтологического подхода. В результате исследования была обоснована необходимость централизованного сбора требований к качеству данных организации, поставлена проблема извлечения ожиданий к качеству данных корпоративных хранилищ путем расширения существующей проблемы извлечения экспертных знаний, а также разработана онтологическая модель извлечения ожиданий к качеству данных корпоративных хранилищ.

Скачивания

Данные скачивания пока недоступны.

Биографии авторов

Александр Александрович Афанасьев, Курский государственный университет

аспирант кафедры программного обеспечения и администрирования информационных систем, Курский государственный университет,
г. Курск, Россия

Виталий Алексеевич Кудинов, Курский государственный университет

доктор педагогических наук, профессор, профессор кафедры программного обеспечения и администрирования информационных систем, Курский государственный университет,
г. Курск, Россия

Библиографические ссылки

Гаврилова Т.А., Червинская К.Р. 1992. Извлечение и структурирование знаний для экспертных систем / Т. А. Гаврилова, К. Р. Червинская. М.: Радио и связь, 1992. 199 с.: ил.; 22 см.

ГОСТ Р ИСО 8000-2-2019: Национальный стандарт Российской Федерации. Качество данных. Часть 2. Словарь [Электронный ресурс]. Стандартинформ. – Электронные данные. – Электронный текст документа подготовлен АО «Кодекс» и сверен по: М.: Стандартинформ, 2019. – режим доступа: https://docs.cntd.ru/document/1200169126 (дата обращения: 15.05.2022).

Загорулько Ю.А., Загорулько Г.Б. 2016. Инженерия знаний: учебное пособие. [Электронный ресурс] / Ю.А. Загорулько, Г.Б. Загорулько; Новосиб. гос. ун-т. – Новосибирск: РИЦ НГУ, 2016. 93 с. Режим доступа: http://e-lib.nsu.ru/dsweb/Get/Resource-1052/page001.pdf

Лидвелл У., Холден К., Батлер Дж. 2021. Универсальные принципы дизайна. Пер. А. Мороз. СПб.: Питер, 2021. 272 с.: ил.

Международные рекомендации по статистике промышленности. 2010. [Электронный ресурс] Организация Объединенных Наций. Серия «Статистические документы». – Электронные данные. – Нью-Йорк: Издательство Организации Объединенных Наций, 2010. Режим доступа: https://www.un-ilibrary.org/content/books/9789210563826/read (дата обращения: 05.11.2021).

Методология оценки и повышения качества данных. 2019. [Электронный ресурс] Аналитический центр при Правительстве Российской Федерации. – Электронные данные. – Режим доступа: https://digital.ac.gov.ru/upload/iblock/215/%D0%9A%D0%B0%D1%87%D0%B5%D1%81%D1%82%D0%B2%D0%BE%20%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85%20_f.pdf (дата обращения: 05.11.2021).

Цифровые технологии в российских компаниях. 2019. [Электронный ресурс] Результаты исследования КПМГ. Режим доступа: https://assets.kpmg/content/dam/kpmg/ru/pdf/2019/01/ru-ru-digital-technologies-in-russian-companies.pdf (Дата обращения: 21.04.2022)

DAMA-DMBOK: Свод знаний по управлению данными. Второе издание. 2020. Dama International [пер. с англ. Г. Агафонова]. М.: Олимп–Бизнес, 2020. 828 с.: ил.

Data Rules Program Strategy: International Petroleum Data Standards. 2018. [Электронный ресурс] The Professional Petroleum Data Management (PPDM) Association. – Электронные данные. – Калгари: Ассоциация профессионального управления нефтяными данными (PPDM), 2018. – Режим доступа: https://dl.ppdm.org/dl/2263 (дата обращения: 07.11.2021).

IBM Analytics Solutions Unified Method (ASUM) [Электронный ресурс] / IBM Analytics. Режим доступа: http://gforge.icesi.edu.co/ASUM-DM_External/index.htm#cognos.external.asum-DM_Teaser/tasks/sps_clean_data_F9A96B23.html?proc=_0eKIHlt6EeW_y7k3h2HTng&path=_0eKIHlt6EeW_y7k3h2HTng,_0eHEyVt6EeW_y7k3h2HTng,_0eIS8Vt6EeW_y7k3h2HTng,_0eIS51t6EeW_y7k3h2HTng (Дата обращения: 22.04.2022)

Loshin David. 2010. The Practitioner's Guide to Data Quality Improvement (1st. ed.). Morgan Kaufmann Publishers Inc., San Francisco, CA, USA.

Килимова А.Д. 2022. Потоки данных в легкой промышленности. Компетентность. № 3. [Электронный ресурс] URL: https://cyberleninka.ru/article/n/potoki-dannyh-v-legkoy-promyshlennosti (дата обращения: 11.05.2022).

Ларичев О.И., Моргоев В.К. 1991. Проблемы, методы и системы извлечения экспертных знаний. Автомат. и телемех., выпуск 6, 3–27. [Электронный ресурс]. Режим доступа: http://www.mathnet.ru/links/15765250a80252d52d362d9091115564/at4189.pdf (дата обращения: 04.07.2022).

Любицын В.Н. 2012. Повышение качества данных в контексте современных аналитических технологий. Вестник ЮУрГУ. Серия: Компьютерные технологии, управление, радиоэлектроника. № 23. [Электронный ресурс] URL: https://cyberleninka.ru/article/n/povyshenie-kachestva-dannyh-v-kontekste-sovremennyh-analiticheskih-tehnologiy (дата обращения: 11.05.2022).

Chapman P., Clinton J., Kerber R., Khabaza T., Reinartz T., Shearer C., Wirth R. 2000. CRISP-DM 1.0 step-by-step data mining guide. SPSS, 2000, 78 p.

Fayyad U., Piatetsky-Shapiro G., Smyth P. 1996. “The kdd process for extracting useful knowledge from volumes of data,” Commun. ACM, Nov. 1996. 39(11): 27–34.

Feigenbaum E. 1980. Knowledge engineering: the applied side of artificial intelligence. Computer Science Department of Stanford University. Stanford, [Электронный ресурс] – Режим доступа: https://stacks.stanford.edu/file/druid:cn981xh0967/cn981xh0967.pdf (дата обращения: 04.07.2022).

Martínez-Plumed F. et al. 2021. "CRISP-DM Twenty Years Later: From Data Mining Processes to Data Science Trajectories," in IEEE Transactions on Knowledge and Data Engineering, 33(8): 3048-3061, 1 Aug. 2021, doi: 10.1109/TKDE.2019.2962680.

Martinez-Plumed F., Ochando L.C., Ferri C., Flach P. A., Hernandez-Orallo J., Kull M., Lachiche N., Ramirez-Quintana M. J. 2017. “CASP-DM: context aware standard process for data mining,” CoRR, vol. abs/1709.09003, 2017. [Online]. Available: http://arxiv.org/abs/1709.09003

Moyle S., Jorge A. 2001. “Ramsys-a methodology for supporting rapid remote collaborative data mining projects,” in ECML/PKDD 2001 Workshop on Integrating Aspects of Data Mining, Decision Support and Meta-Learning: Internal SolEuNet Session, 2001, 20–31.


Просмотров аннотации: 142

Поделиться

Опубликован

2022-09-30

Как цитировать

Афанасьев, А. А., & Кудинов, В. А. (2022). Использование онтологического подхода для извлечения ожиданий к качеству данных корпоративных хранилищ. Экономика. Информатика, 49(3), 566-574. https://doi.org/10.52575/2687-0932-2022-49-3-566-574

Выпуск

Раздел

СИСТЕМНЫЙ АНАЛИЗ И УПРАВЛЕНИЕ