Построение спектрограмм звуковых сигналов на основе субполосных представлений

Авторы

  • Алексей Владимирович Болдышев ПАО «Ростелеком» Белгородский филиал
  • Александра Александровна Медведева Белгородский государственный национальный исследовательский университет
  • Екатерина Ивановна Прохоренко Белгородский государственный национальный исследовательский университет
  • Диана Игоревна Гайворонская Белгородский государственный национальный исследовательский университет

DOI:

https://doi.org/10.52575/2712-746X-2024-51-1-250-260

Ключевые слова:

спектрограмма, доля энергии, обработка звука, речевые сигналы, субполосные представления, субполосная матрица

Аннотация

В работе описывается одно из направлений исследования звуковых сигналов – анализ звуков с использованием спектрограмм как средства визуализации динамического изменения интенсивности частотных составляющих сигнала. Ввиду того, что звук и, в частности, речевые сообщения, остается наиболее естественной формой обмена информацией, данное направление востребовано в различных технологиях, связанных с обработкой звуковых данных. Спектрограммы применяют студии звукозаписи для очистки от шумов музыкальных произведений, записанных на старые аналоговые носители. В технологиях распознавания речи человека спектрограммы являются перспективным источником данных для анализа формантного состава звуков речи с помощью нейронных сетей, ориентированных на анализ изображений. Поэтому получение изображения высокой четкости и контрастности, позволяющее устойчиво выделять форманты и в музыке, и в речи, представляется актуальной задачей. Известные алгоритмы построения спектрограмм основаны на применении дискретного преобразования Фурье, что обусловлено наличием алгоритма быстрого преобразования (БПФ), существенно сокращающего затраты на вычисления. В работе отмечаются недостатки алгоритма БПФ, которые могут возникать при исследовании свойств речевых сигналов, и представлен новый метод построения спектрограмм на основе субполосных представлений. В основе метода лежит использование субполосных матриц. В работе продемонстрирована эффективность предлагаемого подхода, которая заключается в более четком отображении областей сосредоточения энергии анализируемого звукового сигнала, по сравнению с известными методами.

Скачивания

Данные скачивания пока недоступны.

Биографии авторов

Алексей Владимирович Болдышев, ПАО «Ростелеком» Белгородский филиал

кандидат технических наук, ведущий инженер Центра эксплуатации Белгородского филиала ПАО Ростелеком,
г. Белгород, Россия.

Александра Александровна Медведева, Белгородский государственный национальный исследовательский университет

кандидат технических наук, доцент кафедры информационно-телекоммуникационных cистем и технологий института инженерных и цифровых технологий, Белгородский государственный национальный исследовательский университет,
г. Белгород, Россия.

Екатерина Ивановна Прохоренко, Белгородский государственный национальный исследовательский университет

кандидат технических наук, доцент, доцент кафедры информационно-телекоммуникационных систем и технологий института инженерных и цифровых технологий, Белгородский государственный национальный исследовательский университет,
Белгород, Россия.

Диана Игоревна Гайворонская, Белгородский государственный национальный исследовательский университет

кандидат технических наук, доцент кафедры информационно-телекоммуникационных систем и технологий института инженерных и цифровых технологий, Белгородский государственный национальный исследовательский университет,
г. Белгород, Россия.

Библиографические ссылки

Балабанова Т.Н., Трубицына Д.И., Болдышев А.В., Прохоренко Е.И., Гайворонский В.А. 2022. Обработка речевых данных в ИТС: Практикум лабораторный. Белгород: Изд-во НИУ «БелГУ», 62 с.

Белов С.П., Белов А.С., Прохоренко Е.И., Балабанова Т.Н. 2022. Субполосная идентификация словных фрагментов речевых сигналов по заданному образцу. Экономика. Информатика. 49(3): 589–596. DOI: 10.52575/2687-0932-2022-49-3-589-596.

Белов С.П., Жиляков Е.Г., Коськин А.В., Трубицына Д.И. 2019. Субполосный анализ и синтез сигналов в рамках косинусного преобразования. Информационные системы и технологии. 4(114): 13–22.

Болдышев А.В., Медведева А.А., Прохоренко Е.И. 2017. Параметрическое описание звуков речи в задаче распознавания. Научные ведомости Белгородского государственного университета. Серия: Экономика. Информатика. 23(272): 159–168.

Гантмахер Ф.Р. 2010. Теория матриц. 5-е изд., М.: ФИЗМАТЛИТ, 560 с.

Жиляков Е.Г. 2015. Оптимальные субполосные методы анализа и синтеза сигналов конечной длительности. Автоматика и телемеханика. 4: 51–66.

Жиляков Е.Г., Белов С.П., Олейник И.И., Трубицына Д.И. 2019. Обобщенный субполосный анализ и синтез сигналов. Инфокоммуникационные технологии. 17(2): 139–145. DOI: 10.18469/ikt.2019.17.2.01.

Жиляков Е.Г., Белов С.П., Прохоренко Е.И. 2007. Методы обработки речевых данных в информационно-телекоммуникационных системах на основе частотных представлений. Белгород: Изд-во БелГУ. 136 с.

Жиляков Е.Г., Трубицына Д.И., Прохоренко Е.И., Болдышев А.В. 2019. Об использовании субполосного анализа и синтеза сигналов в области определения косинус-преобразования при решении задач сжатия речевых сигналов. Научные ведомости Белгородского государственного университета. Серия: Экономика. Информатика. 46(4): 700–709. DOI: 10.18413/2411-3808-2019-46-4-700-709.

Жиляков Е.Г., Туяков С.В. 2011. О вычислении собственных функций субполосного ядра. Вопросы радиоэлектроники. Сер. Электронная вычислительная техника (ЭВТ). 1: 25–34.

Михайлов В.Г., Златоустова Л.В. 1987. Изменение параметров речи. Под. ред. М.А. Сапожникова. М.: Радио и связь, 168 с.: ил.

Сорокин В.Н. 1985. Теория речеобразования. М.: Радио и связь, 312 с.: ил.

Сергиенко А. 2011. Цифровая обработка сигналов 3-е изд. Санкт-Петербург.: БХВ-Петербург, 768 с. ISBN: 978-5-9775-0606-9.

Zhilyakov E.G., Belov S.P., Chernomorets A.A., Trubitsyna D.I., Balabanova T.N. 2019. Subband analysis and synthesis of signals. Compusoft. 8(6): 3206–3211.

Zhilyakov E.G., Belov S.P., Oleinik I.I., Babarinov S.L., Trubitsyna D.I. 2020. Generalized sub band analysis and signal synthesis. Bulletin of Electrical Engineering and Informatics. 9(3): 964–972. DOI: 10.11591/eei.v9i3.1709.


Просмотров аннотации: 74

Поделиться

Опубликован

2024-03-30

Как цитировать

Болдышев, А. В., Медведева, А. А., Прохоренко, Е. И., & Гайворонская, Д. И. (2024). Построение спектрограмм звуковых сигналов на основе субполосных представлений. Экономика. Информатика, 51(1), 250-260. https://doi.org/10.52575/2712-746X-2024-51-1-250-260

Выпуск

Раздел

ИНФОКОММУНИКАЦИОННЫЕ ТЕХНОЛОГИИ

Наиболее читаемые статьи этого автора (авторов)