Сегментация сканированного рукописного текста на словные фрагменты

Авторы

  • Александр Николаевич Заливин Белгородский университет кооперации, экономики и права
  • Татьяна Николаевна Балабанова Белгородский государственный национальный исследовательский университет
  • Екатерина Ивановна Прохоренко Белгородский государственный национальный исследовательский университет
  • Надежда Владимировна Васильева Белгородский государственный национальный исследовательский университет

DOI:

https://doi.org/10.52575/2687-0932-2021-48-2-383-391

Ключевые слова:

изображения сканированных рукописей, сегментация на словные фрагменты

Аннотация

В настоящее время одной из основных тенденций документооборота является его реализация в электронном виде, что позволяет широко использовать компьютерные технологии. Достаточно часто хранящиеся документы представляют собой изображения сканированных текстов, которые либо полностью являются рукописными, либо частично (например, подписи под текстами). При этом часто наибольший интерес представляет именно рукописная часть. В качестве примера можно привести анализ частости употребления некоторых слов автором рукописи, задачу обнаружения фальсификации подписей и т. п. Важно отметить, что в большинстве случаев речь идет об идентификации словных фрагментов на основе отнесения их к классу, определяемому некоторым образцом (прецедентом). В данной работе рассматривается один из этапов решения такой задачи, в рамках которого определяются фрагменты изображений, не содержащие рукописных символов. В этом случае прецедентом служит фрагмент строки, заведомо не содержащий рукописных символов. Показано, что анализ рукописей в этом случае целесообразно проводить в рамках субполосных представлений. Получены основные соотношения для решающей функции и предложена процедура обучения, позволяющая построить критическую область на основе заданной вероятности ошибок первого рода.

Биографии авторов

Александр Николаевич Заливин, Белгородский университет кооперации, экономики и права

кандидат технических наук, доцент кафедры организации и технологии защиты информации

Татьяна Николаевна Балабанова, Белгородский государственный национальный исследовательский университет

кандидат технических наук, доцент кафедры информационно-телекоммуникационных систем и технологий

Екатерина Ивановна Прохоренко, Белгородский государственный национальный исследовательский университет

кандидат технических наук, доцент, доцент кафедры информационно-телекоммуникационных систем и технологий

Надежда Владимировна Васильева, Белгородский государственный национальный исследовательский университет

аспирант кафедры информационно-телекоммуникационных систем и технологий

Библиографические ссылки

Афонасенко А.В., Елизаров А.И. 2008 Обзор методов распознавания структурированных символов. В докл. ТУСУРа № 2 (18), часть 1.

Борисов Е. 2008 Сегментация изображения текста. [Электронный ресурс]. URL: http://mechanoid.kiev.ua/cv-text-image-segmentator.html (Дата обращения: 01.04.2019).

Гантмахер Ф.Р. 1971 Теория матриц. М., Наука, 576.

Гонсалес Р., Вудс Р. 2006. Цифровая обработка изображений. М., Техносфера, 1072.

Горский Н., Анисимов В., Горская Л. 1997. Распознавание рукописного текста: от теории к практике. СПб., Политехника, 126.

Грузман И.С., Киричук В.С., Косых В.П., Перетягин Г.И., Спектор А.А. 2002. Цифровая обработка изображений в информационных системах. Новосибирск: НГТУ, 352.

Демин А.А. 2012. Обзор интеллектуальных систем для оценки каллиграфии. Инженерный вестник, МГТУ им. Н.Э. Баумана, 77-48211/478895, 09: 1–25.

Жиляков Е.Г., Ефимов Н.О. 2018. Распознавание фрагментов рукописного текста. Характерные частотные интервалы. Информационные технологии. 7: 481–486.

Жиляков Е.Г., Черноморец А.А. 2009. Вариационные алгоритмы анализа и обработки изображений на основе частотных представлений. Монография. Белгород: Изд-во ГИК, 146.

Мозговой А.А. 2013 Проблемы извлечения рукописных слов из сканированного изображения. Моделирование, оптимизация и информационные технологии. Воронеж 1: 14–23.

Парлетт Б. 1983. Симметричная проблема собственных значений. М., Мир, 382.

Рабинер Л., Голд Б. 1978. Теория и методы цифровой обработки сигналов. М., Мир, 424.

Сорокин А. И., Запрягаев С.А. 2010. Сегментация рукописных и машинописных текстов методом диаграмм Вороного. Вестник Воронежского государственного университета. Серия: системный анализ и информационные технологии. Воронеж 1: 160–165.

Черноморец А.А. Голощапова В.А., Лысенко И.В., Болгова Е.В. 2011. О частотной концентрации энергии изображений. Научные ведомости БелГУ. Сер. История. Политология. Экономика. Информатика. Белгород 1: 103–108.

Zhilyakov E. G. 2015. Optimal sub-band methods for analysis and synthesis of finite-duration signals. Autom. Remote Control, 76:4.


Просмотров аннотации: 185

Опубликован

2021-06-30

Как цитировать

Заливин, А. Н., Балабанова, Т. Н., Прохоренко, Е. И., & Васильева, Н. В. (2021). Сегментация сканированного рукописного текста на словные фрагменты. Экономика. Информатика, 48(2), 383-391. https://doi.org/10.52575/2687-0932-2021-48-2-383-391

Выпуск

Раздел

СИСТЕМНЫЙ АНАЛИЗ И УПРАВЛЕНИЕ

Наиболее читаемые статьи этого автора (авторов)