Построение спектрограмм звуковых сигналов на основе субполосных представлений
DOI:
https://doi.org/10.52575/2712-746X-2024-51-1-250-260Ключевые слова:
спектрограмма, доля энергии, обработка звука, речевые сигналы, субполосные представления, субполосная матрицаАннотация
В работе описывается одно из направлений исследования звуковых сигналов – анализ звуков с использованием спектрограмм как средства визуализации динамического изменения интенсивности частотных составляющих сигнала. Ввиду того, что звук и, в частности, речевые сообщения, остается наиболее естественной формой обмена информацией, данное направление востребовано в различных технологиях, связанных с обработкой звуковых данных. Спектрограммы применяют студии звукозаписи для очистки от шумов музыкальных произведений, записанных на старые аналоговые носители. В технологиях распознавания речи человека спектрограммы являются перспективным источником данных для анализа формантного состава звуков речи с помощью нейронных сетей, ориентированных на анализ изображений. Поэтому получение изображения высокой четкости и контрастности, позволяющее устойчиво выделять форманты и в музыке, и в речи, представляется актуальной задачей. Известные алгоритмы построения спектрограмм основаны на применении дискретного преобразования Фурье, что обусловлено наличием алгоритма быстрого преобразования (БПФ), существенно сокращающего затраты на вычисления. В работе отмечаются недостатки алгоритма БПФ, которые могут возникать при исследовании свойств речевых сигналов, и представлен новый метод построения спектрограмм на основе субполосных представлений. В основе метода лежит использование субполосных матриц. В работе продемонстрирована эффективность предлагаемого подхода, которая заключается в более четком отображении областей сосредоточения энергии анализируемого звукового сигнала, по сравнению с известными методами.
Скачивания
Библиографические ссылки
Балабанова Т.Н., Трубицына Д.И., Болдышев А.В., Прохоренко Е.И., Гайворонский В.А. 2022. Обработка речевых данных в ИТС: Практикум лабораторный. Белгород: Изд-во НИУ «БелГУ», 62 с.
Белов С.П., Белов А.С., Прохоренко Е.И., Балабанова Т.Н. 2022. Субполосная идентификация словных фрагментов речевых сигналов по заданному образцу. Экономика. Информатика. 49(3): 589–596. DOI: 10.52575/2687-0932-2022-49-3-589-596.
Белов С.П., Жиляков Е.Г., Коськин А.В., Трубицына Д.И. 2019. Субполосный анализ и синтез сигналов в рамках косинусного преобразования. Информационные системы и технологии. 4(114): 13–22.
Болдышев А.В., Медведева А.А., Прохоренко Е.И. 2017. Параметрическое описание звуков речи в задаче распознавания. Научные ведомости Белгородского государственного университета. Серия: Экономика. Информатика. 23(272): 159–168.
Гантмахер Ф.Р. 2010. Теория матриц. 5-е изд., М.: ФИЗМАТЛИТ, 560 с.
Жиляков Е.Г. 2015. Оптимальные субполосные методы анализа и синтеза сигналов конечной длительности. Автоматика и телемеханика. 4: 51–66.
Жиляков Е.Г., Белов С.П., Олейник И.И., Трубицына Д.И. 2019. Обобщенный субполосный анализ и синтез сигналов. Инфокоммуникационные технологии. 17(2): 139–145. DOI: 10.18469/ikt.2019.17.2.01.
Жиляков Е.Г., Белов С.П., Прохоренко Е.И. 2007. Методы обработки речевых данных в информационно-телекоммуникационных системах на основе частотных представлений. Белгород: Изд-во БелГУ. 136 с.
Жиляков Е.Г., Трубицына Д.И., Прохоренко Е.И., Болдышев А.В. 2019. Об использовании субполосного анализа и синтеза сигналов в области определения косинус-преобразования при решении задач сжатия речевых сигналов. Научные ведомости Белгородского государственного университета. Серия: Экономика. Информатика. 46(4): 700–709. DOI: 10.18413/2411-3808-2019-46-4-700-709.
Жиляков Е.Г., Туяков С.В. 2011. О вычислении собственных функций субполосного ядра. Вопросы радиоэлектроники. Сер. Электронная вычислительная техника (ЭВТ). 1: 25–34.
Михайлов В.Г., Златоустова Л.В. 1987. Изменение параметров речи. Под. ред. М.А. Сапожникова. М.: Радио и связь, 168 с.: ил.
Сорокин В.Н. 1985. Теория речеобразования. М.: Радио и связь, 312 с.: ил.
Сергиенко А. 2011. Цифровая обработка сигналов 3-е изд. Санкт-Петербург.: БХВ-Петербург, 768 с. ISBN: 978-5-9775-0606-9.
Zhilyakov E.G., Belov S.P., Chernomorets A.A., Trubitsyna D.I., Balabanova T.N. 2019. Subband analysis and synthesis of signals. Compusoft. 8(6): 3206–3211.
Zhilyakov E.G., Belov S.P., Oleinik I.I., Babarinov S.L., Trubitsyna D.I. 2020. Generalized sub band analysis and signal synthesis. Bulletin of Electrical Engineering and Informatics. 9(3): 964–972. DOI: 10.11591/eei.v9i3.1709.
Просмотров аннотации: 83
Поделиться
Опубликован
Как цитировать
Выпуск
Раздел
Copyright (c) 2024 Экономика. Информатика
Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.