Сегментация сканированного рукописного текста на словные фрагменты
DOI:
https://doi.org/10.52575/2687-0932-2021-48-2-383-391Ключевые слова:
изображения сканированных рукописей, сегментация на словные фрагментыАннотация
В настоящее время одной из основных тенденций документооборота является его реализация в электронном виде, что позволяет широко использовать компьютерные технологии. Достаточно часто хранящиеся документы представляют собой изображения сканированных текстов, которые либо полностью являются рукописными, либо частично (например, подписи под текстами). При этом часто наибольший интерес представляет именно рукописная часть. В качестве примера можно привести анализ частости употребления некоторых слов автором рукописи, задачу обнаружения фальсификации подписей и т. п. Важно отметить, что в большинстве случаев речь идет об идентификации словных фрагментов на основе отнесения их к классу, определяемому некоторым образцом (прецедентом). В данной работе рассматривается один из этапов решения такой задачи, в рамках которого определяются фрагменты изображений, не содержащие рукописных символов. В этом случае прецедентом служит фрагмент строки, заведомо не содержащий рукописных символов. Показано, что анализ рукописей в этом случае целесообразно проводить в рамках субполосных представлений. Получены основные соотношения для решающей функции и предложена процедура обучения, позволяющая построить критическую область на основе заданной вероятности ошибок первого рода.
Скачивания
Библиографические ссылки
Афонасенко А.В., Елизаров А.И. 2008 Обзор методов распознавания структурированных символов. В докл. ТУСУРа № 2 (18), часть 1.
Борисов Е. 2008 Сегментация изображения текста. [Электронный ресурс]. URL: http://mechanoid.kiev.ua/cv-text-image-segmentator.html (Дата обращения: 01.04.2019).
Гантмахер Ф.Р. 1971 Теория матриц. М., Наука, 576.
Гонсалес Р., Вудс Р. 2006. Цифровая обработка изображений. М., Техносфера, 1072.
Горский Н., Анисимов В., Горская Л. 1997. Распознавание рукописного текста: от теории к практике. СПб., Политехника, 126.
Грузман И.С., Киричук В.С., Косых В.П., Перетягин Г.И., Спектор А.А. 2002. Цифровая обработка изображений в информационных системах. Новосибирск: НГТУ, 352.
Демин А.А. 2012. Обзор интеллектуальных систем для оценки каллиграфии. Инженерный вестник, МГТУ им. Н.Э. Баумана, 77-48211/478895, 09: 1–25.
Жиляков Е.Г., Ефимов Н.О. 2018. Распознавание фрагментов рукописного текста. Характерные частотные интервалы. Информационные технологии. 7: 481–486.
Жиляков Е.Г., Черноморец А.А. 2009. Вариационные алгоритмы анализа и обработки изображений на основе частотных представлений. Монография. Белгород: Изд-во ГИК, 146.
Мозговой А.А. 2013 Проблемы извлечения рукописных слов из сканированного изображения. Моделирование, оптимизация и информационные технологии. Воронеж 1: 14–23.
Парлетт Б. 1983. Симметричная проблема собственных значений. М., Мир, 382.
Рабинер Л., Голд Б. 1978. Теория и методы цифровой обработки сигналов. М., Мир, 424.
Сорокин А. И., Запрягаев С.А. 2010. Сегментация рукописных и машинописных текстов методом диаграмм Вороного. Вестник Воронежского государственного университета. Серия: системный анализ и информационные технологии. Воронеж 1: 160–165.
Черноморец А.А. Голощапова В.А., Лысенко И.В., Болгова Е.В. 2011. О частотной концентрации энергии изображений. Научные ведомости БелГУ. Сер. История. Политология. Экономика. Информатика. Белгород 1: 103–108.
Zhilyakov E. G. 2015. Optimal sub-band methods for analysis and synthesis of finite-duration signals. Autom. Remote Control, 76:4.
Просмотров аннотации: 420
Поделиться
Опубликован
Как цитировать
Выпуск
Раздел
Copyright (c) 2021 Экономика. Информатика
Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.