
А.К. Алимурадов1, П.П. Чураков2, А.Ю. Тычков3, С.Ю. Тверская4
1–4 Пензенский государственный университет (г. Пенза, Россия)
Постановка проблемы. Зашумленность речевых сигналов является наиболее важной проблемой в задачах распознавания, голосового управления, речевой аутентификации, преобразования речи в текст и пр. На практике все речевые сигналы в той или иной степени зашумлены и в зависимости от уровня шума могут существенно исказить результаты исследований.
Цель. Разработать новый метод оконной фильтрации речевых сигналов на основе улучшенной полной множественной декомпозиции с адаптивным шумом.
Результаты. Предложен новый метод оконной фильтрации речевых сигналов на основе улучшенной полной множественной декомпозиции на эмпирические моды с адаптивным шумом. Проведено исследование метода фильтрации на сигналах, зашумленных белым, розовым и коричневым шумами с отношением сигнал/шум от –5 до 15 дБ с шагом 5 дБ. Отмечено повышение разборчивости речи на 10,56, 7,12 и 10,96 дБ для белого, розового и коричневого шумов соответственно.
Практическая значимость. Предложенный метод оконной фильтрации может успешно применяться в системах оценки психоэмоционального состояния человека по речи.
Алимурадов А.К., Чураков П.П., Тычков А.Ю., Тверская С.Ю. Метод оконной фильтрации речевых сигналов на основе декомпозиции на эмпирические моды для систем оценки психоэмоционального состояния человека // Биомедицинская радиоэлектроника. 2023. T. 26. № 2. С. 32−37. DOI: https://doi.org/ 10.18127/j15604136-202302-05
- Huang X. et al. Spoken language processing: A guide to theory, algorithm, and system development. Prentice hall PTR, 2001.
- Schuller B., Batliner A. Computational paralinguistics: emotion, affect and personality in speech and language processing. John Wiley & Sons. 2013.
- Huang N. E., Attoh-Okine N. O. The Hilbert-Huang transform in engineering. CRC Press, 2005.
- Huang N.E., Zheng Sh., Steven R.L. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis. Proceedings of the Royal Society of London. 1998. A 454. P. 903–995.
- Touati H., Khaldi K. Speech denoising by adaptive filter LMS in the EMD framework. 2018 15th International Multi-Conference on Systems, Signals & Devices (SSD). IEEE. 2018. P. 1–4.
- Shen W., Yu Y., Ling L., Ren J., Zhu Q. Speech Noise Reduction by EMD-LMS. IEEE 7th International Conference on Computer Science and Network Technology (ICCSNT). Dalian. China. Oct. 19–20. 2019. P. 485–488.
- Bouchair A., Amrouche A., Selouani S.-A., Hamidia M. Empirical Mode Decomposition for Speech Enhancement. International Conference on Electrical Sciences and Technologies in Maghreb (CISTEM). Algiers. Algeria. Oct. 28–31. 2018. P. 1–4.
- Colominasa M.A., Schlotthauera G., Torres M. E. Improved complete ensemble EMD: a suitable tool for biomedical signal processing. Biomed. Signal Proces. 2014. V. 14. P. 19–29.
- Алимурадов А. К. и др. Способ определения формантной разборчивости речи для оценки психоэмоционального состояния операторов систем управления с высокой степенью ответственности // Измерение. Мониторинг. Управление. Контроль. 2019. № 4 (30). С. 58–69.
- Алимурадов А.К., Тычков А.Ю. Применение метода декомпозиции на эмпирические моды для исследования вокализованной речи в задаче обнаружения стрессовых эмоций человека // Вестник Пермского национального исследовательского политехнического университета. Электротехника, информационные технологии, системы управления. 2020. № 3 (35). С. 7–29.
- Свидетельство о государственной регистрации базы данных № 2016620597 (РФ). Верифицированная база речевых команд для систем голосового управления // Программы для ЭВМ, базы данных, топологии интегральных микросхем / А.К. Алимурадов. 2016.