Ю. Н. Липин – к.т.н., доцент, кафедра автоматики и телемеханики, Пермский национальный исследовательский политехнический университет
E-mail: y_lipinin@mail.ru
И. В. Максимова – доцент, кафедра актерского искусства, Пермский государственный институт культуры
E-mail: dialogs@list.ru
Ю. Л. Токарев – студент, кафедра автоматики и телемеханики, Пермский национальный исследовательский политехнический университет
А. И. Тур – аспирант, ассистент, кафедра автоматики и телемеханики, Пермский национальный исследовательский политехнический университет
А. А. Южаков – д.т.н., профессор, зав. кафедрой автоматики и телемеханики, Пермский национальный исследовательский политехнический университет
E-mail: uz@at.pstu.ru
Постановка проблемы. В настоящее время весьма актуальными являются проблемы определения по голосу человека эмоций с формированием математических моделей по результатам анализа оцифрованных голосов и проблемы морфинга голоса. Известны определенные подходы к решению задачи морфинга в части изменения голоса и применяемых алгоритмов для определения параметров эмоций голосов. Одним из возможных вариантов решения задачи изменения голоса является метод наименьших квадратов (МНК).
Цель. Исследовать возможность применения МНК для изменения и формирования эмоций голоса человека (робота).
Результаты. Определены оптимальные значения размерности порядка полинома и числа отсчетов в каждом окне звуковой записи по критерию совпадения заданных и полученных звуковых амплитуд голоса. Результаты можно прослушивать и сравнивать с исходными голосами. На основании созданной базы голосов эмоций рассчитаны коэффициенты МНК образца. Проведена проверка обратного расчета по этим коэффициентам. Далее, используя первую неэмоциональную запись, по коэффициентам восстановлены эмоции. По этим же коэффициентам восстановлены эмоции для другого диктора той же фразы эмоций. Оценка проведена на основании метода, разработанного авторами, как сумма делений для заданных и полученных образцов эмоций.
Практическая значимость. При использовании в качестве базы эталонные эмоции и разработанный алгоритм трансформации эмоций голосов предлагаемый метод обеспечивает восстановление исходной эмоции с допустимым качеством звучания. Решение задачи морфинга голоса актуально для индустрии робототехники, а также полезно в учебных целях для обучения дикторов, артистов, студентов, аспирантов сценических вузов.
- Айвазян С.А. Прикладная статистика. Основы эконометрики. Т. 2. М.: Юнити-Дана. 2001.
- Абердин А.С. Цифровая и аналоговая запись. М.: Вагриус. 2006.
- Zolzer U. (Ed.) Digital audio effects. Chichester: John Wiley & Sons. 2002.
- Дронов В.А. Сэмплирование. М.: Гилея. 2004.
- Мельниченко В.В. FL Studio. СПб.: Генезис. 2005.
- Митин И.В., Русаков В.С. Анализ и обработка экспериментальных данных. Изд. 5-е. М.: Физический факультет МГУ. 2012.
- Емец Д.А. Обработка звука и звуковые эффекты. М.: Гилея. 2005.
- Залесский К.В. Сэмплирование и модуляционные эффекты. М.: Симпозиум. 1998.
- Зыков В.А. Программы обработки звуковой информации. СПб.: Композитор. 2008.
- Кремер Н.Ш., Путко Б.А. Эконометрика. М.: Юнити-Дана. 2003–2004.
- Калиниченко Н.В. Профессиональная обработка звука. М.: Вагриус. 2008.
- Квинт И.А. Sound Forge. М.: Видеосамоучитель. 2009.
- Линник Ю.В. Метод наименьших квадратов и основы математико-статистической теории обработки наблюдений. Изд. 2-е. М.: Физматгиз. 1962.
- Леонтьев В.П. Запись и обработка музыки и звука. М.: ОЛМА-Пресс. 2006.
- Садов С.И. Импульсная и частотная модуляция. Х.: Септима ЛТД. 2009.
- Синицин А.Т. Оцифровка звука. СПб.: Вита. 2003.
- Serra X. Musical sound modeling with sinusoids plus noise / In book: Roads C., Pope S., Picialli A., De Poli G. (Eds.) Musical signal processing. Lisse: Swets & Zeitlinger Publishers. 1997.
- Эконометрика. Учебник / Под ред. И.И. Елисеевой. Изд. 2-е. М.: Финансы и статистика. 2006.