350 руб
Журнал «Нелинейный мир» №3 за 2023 г.
Статья в номере:
Алгоритмы кодирования и декодирования речевого сигнала на основе взаимозависимых кодовых книг
Тип статьи: научная статья
DOI: https://doi.org/10.18127/j20700970-202303-01
УДК: 621.395.01
Авторы:

А.П. Рыжков1, О.Н. Катков2, Н.А. Сафронова3

1−3 Академия Федеральной службы охраны Российской Федерации (г. Орел, Россия)

Аннотация:

Постановка проблемы. На сегодняшний день совершенствование систем кодирования/декодирования (кодеки) речевого сигнала (РС), основанных на методе предсказания с возбуждением от кода, является актуальной задачей, что обусловлено их активным использованием в сфере инфокоммуникаций, в частности, для низкоскоростной передачи речи. Характерные особенности таких кодеков − кодовые книги, содержащие элементы декомпозиции РС на этапе анализа. Поскольку существующий уровень развития систем не предполагает кодирования речи с учетом взаимной связи указанных элементов, это, в свою очередь, не позволяет реализовать преимущества векторного квантования при кодировании РС.

Цель. Разработать систему и алгоритмы кодирования/декодирования РС, учитывающие взаимозависимости сигналов возбуждения и параметров, описывающих передаточную функцию голосового тракта, а также представить реализацию кодовых книг на основе нейросетевых технологий с предварительной классификацией сегментов РС.

Результаты. Разработан алгоритм классификации сегментов активной речи, который обеспечивает возможность использования нейросетевого векторного квантования элементов декомпозиции при кодировании РС. Для обеспечения высокой скорости обучения и поиска в кодовых книгах элементов декомпозиции использованы нейронные сети радиальных базисных функций. Представлены алгоритмы кодирования/декодирования для постоянной скорости передачи уменьшение числа бит, назначаемых для представления вектора сигнала возбуждения, и снижение скорости передачи, что обуславливается учетом взаимосвязей элементов декомпозиции. Проверка разработанных алгоритмов подтвердила их соответствие предъявляемым к ним требованиям и возможность реализации на современной элементной базе при модернизации и разработке перспективных комплексов обработки РС.

Практическая значимость. Предложенные алгоритмы можно использовать в системах низкоскоростной передачи и обработки РС при достаточном качестве синтезированной речи.

Страницы: 5-15
Для цитирования

Рыжков А.П., Катков О.Н., Сафронова Н.А. Алгоритмы кодирования и декодирования речевого сигнала на основе взаимозависимых кодовых книг // Нелинейный мир. 2023. Т. 21. №3. С. 5-15. DOI: https://doi.org/10.18127/j20700970-202303-01

Список источников
  1. Маркел Дж.Д, Грей А.Х. Линейное предсказание речи. М.: Связь. 1980. 308 с.
  2. Шелухин О.И., Лукьянцев Н.Ф. Цифровая обработка и передача речи. М.: Радио и связь. 2000. 456 с.
  3. Хайкин С. Нейронные сети: полный курс. Изд. 2-е. М.: ИД «Вильямс». 2006. 1104 с.
  4. Быков С.Ф., Журавлев В.И., Шалимов И.А. Цифровая телефония: Учеб. пособие для вузов. М.: Радио и связь. 2003. 144 с.
  5. Афанасьев А.А., Власов Р.С. Параметрическая идентификация синтезирующей системы голосового тракта на выделяемых однородных сегментах анализа речевого сигнала // Информационные системы и технологии. 2020. № 2(118). С. 5–12.
  6. Афанасьев А.А. Непрерывная аутентификация диктора при ведении телефонных переговоров по низкоскоростным цифровым каналам // Вопросы кибербезопасности. 2016. № 3(16). С. 60–67.
  7. Рыжков А.П., Двилянский А.А., Сафронова Н.А. Математическая модель кодека для систем с речевым управлением // Промышленные АСУ и контроллеры. 2021. № 6. С. 17–25.
  8. Власов Р.С., Сиренький Е.И., Афанасьев А.А. Идентификация речевых пауз в условиях сложной помеховой обстановки //: Сб. науч. трудов II Междунар. науч.-практич. конф. «Инфокоммуникационные технологии: актуальные вопросы цифровой экономики». Екатеринбург: Уральский технический институт связи и информатики (филиал) ФГОБУ ВПО «Сибирский государственный университет телекоммуникаций и информатики». 2022. С. 27–32.
  9. Рыжков А.П., Новиков Д.А. Использование нейросетевых технологий создания кодовых книг и поиска в них при векторном квантовании данных в задачах низкоскоростного речевого кодирования // Нейрокомпьютеры: разработка, применение. 2015. № 3. С. 19–28.
  10. Афанасьев А.А., Рыжков А.П. Метод снижения скорости передачи в вокодерах с линейным предсказанием на основе применения нейронных сетей при переменной длине сегмента анализа // Информационные системы и технологии. 2012. № 6 (74). С. 20–28.
  11. Афанасьев А.А., Власов Р.С., Лисичкин В.Г., Питолин А.В. Алгоритмы обработки речевого сигнала при переменной длительности сегмента анализа // Вестник Воронежского государственного технического университета. 2019. Т. 15, № 4. С. 41–48.
Дата поступления: 14.06.2023
Одобрена после рецензирования: 03.07.2023
Принята к публикации: 28.07.2023