Статья 5315

Название статья

ОЦЕНКА ЧАСТОТЫ ОСНОВНОГО ТОНА РЕЧЕВЫХ СИГНАЛОВ МЕТОДАМИ ДЕКОМПОЗИЦИИ НА ЭМПИРИЧЕСКИЕ МОДЫ

Авторы

Алимурадов Алан Казанферович, соискатель, кафедра информационно-измерительной техники и метрологии, инженер-исследователь, научно-исследовательский отдел, Пензенский государственный университет, alansapfir@yandex.ru

Индекс УДК

004.934

Аннотация

Для повышения эффективности оценки частоты основного тона (ЧОТ) на этапе предварительной обработки предложен новый метод адаптивного разложения нелинейных и нестационарных речевых сигналов – метод декомпозиции на эмпирические моды (ДЭМ). На основании проведенного обзора представлено подробное математическое описание разновидностей методов декомпозиции (множественной декомпозиции на эмпирические моды (МДЭМ), комплементарной множественной декомпозиции на эмпирические моды (КМДЭМ)). Проведены исследования возможности применения методов ДЭМ, МДЭМ и КМДЭМ в алгоритме оценки ЧОТ на основе анализа энергетических и спектральных характеристик эмпирических мод (ЭМ). В соответствии с результатами сделан вывод, что наиболее адаптивным методом декомпозиции речевых сигналов является метод КМДЭМ, который может найти практическое применение в алгоритмах оценки ЧОТ.

Ключевые слова

обработка речевых сигналов, декомпозиция на эмпирические моды, множественная декомпозиция на эмпирические моды, комплементарная множественная декомпозиция на эмпирические моды, частота основного тона.

 Скачать статью в формате PDF

Список литературы

1. Михайлов, В. Г. Измерение параметров речи / В. Г. Михайлов, Л. В. Златоусова ; под ред. М. А. Сапожникова. – М. : Радио и связь, 1987. – 168 с.
2. Azarov, E. Instantaneous pitch estimation based on RAPT framework / E. Azarov, M. Vashkevich, A. Petrovsky // Signal Processing Conference (EUSIPCO), 2012 Proceedings of the 20th European, 27–31 Aug. – 2012. – P. 2787–2791.
3. Huang, N. E. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis / N. E. Huang, Shen Zheng, R. L. Steven // Proceedings of the Royal Society of London A. – 1998. – Vol. 454. – P. 903–995.
4. Zhaohua, Wu. Ensemble empirical mode decomposition: A noise – assisted data analysis method / Wu Zhaohua, N. E. Huang // Advances in Adaptive Data Analysis. – 2009. – Vol. 1 (1). – P. 1–41.
5. Yeh, J.-R. Complementary ensemble empirical mode decomposition: A novel noise enhanced data analysis method / J.-R. Yeh, J.-S. Shieh, N. E. Huang // Advances in Adaptive Data Analysis. – 2010. – Vol. 2 (2). – P. 135–156.
6. Алимурадов, А. К. Определение частоты основного тона речевого сигнала с использованием метода множественной декомпозиции на эмпирические моды / А. К. Алимурадов, П. П. Чураков, А. Ю. Тычков // Модели, системы, сети в экономике, технике, природе и обществе. – 2012. – № 1 (2). – С. 121–126.
7. Алимурадов, А. К. Адаптивный алгоритм предварительной обработки речевых сигналов для оценки частоты основного тона / А. К. Алимурадов // Проблемы автоматизации и управления в технических системах – 2015 : сб. тр. XXXI Междунар. науч.-техн. конф. (Пенза, 19–21 мая 2015 г.). – Пенза : Изд-во ПГУ, 2015. – С. 103–106.
8. Алимурадов, А. К. Применение преобразования Гильберта – Хуанга в задаче выделения информативных признаков речевых сигналов / А. К. Алимурадов, А. Ю. Тычков // Международный научно-исследовательский журнал. – 2013. – № 5-1 (12). – С. 57–58.
9. Баскаков, С. И. Радиотехнические цепи и сигналы / С. И. Баскаков. – М. : Высш. шк., 2000. – 214 с.
10. Малла, С. Вейвлеты в обработке сигналов : пер. англ. / С. Малла. – М. : Мир, 2005. – 212 с.
11. Huang, N. E. The Hilbert – Huang transform and its applications / N. E. Huang // World Scientific Publishing Co. Pte. Ltd. 5, Singapore, 2005. – 526 p.
12. Huang, N. E. An Introduction to Hilbert – Huang Transform: A Plea for Adaptive Data Analysis / N. E. Huang // Research Center for Adaptive Data Analysis. – Singapore : National Central University, 2007. – 257 p.
13. Kuo-Hau Wu. Noise-robust speech feature processing with empirical mode decomposition / Kuo-Hau Wu, Chia-Ping Chen, Bing-Feng Yeh // EURASIP Journal on Audio, Speech, and Music Processing. – 2011. – Р. 9.
14. Speech Enhancement Using EMD Based Adaptive Soft-Thresholding (EMD-ADT) / Md. Ekramul Hamid, Somlal Das, Keikichi Hirose, Md. Khademul Islam Molla // International Journal of Signal Processing, Image Processing and Pattern Recognition. – 2012. – Vol. 5, № 2. – June. – Р. 16.
15. Speech Enhancement via EMD / Kais Khaldi, Abdel-Ouahab Boudraa, Abdelkhalek Bouchikhi, Monia Turki-Hadj Alouane // Hindawi Publishing Corporation EURASIP Journal on Advances in Signal Processing.–2008.–Р.8.
16. Свидетельства о государственной регистрации программ для ЭВМ «Верифицированная база речевых сигналов» / Тычков А. Ю., Алимурадов А. К., Квитка Ю. С., Ярославцева Д. А. – № 2013621156 ; заявл.13.09.2013 ; опубл. 06.11.2013.
17. Gaston, S. Pathological Voice Analysis and Classification Based on Empirical Mode Decomposition / S. Gaston, Maria Eugenia T., L. R. Hugo // Development of Multimodal Interfaces: Active Listening and Synchrony Lecture Notes in Computer Science. – 2010. – Vol. 5967. – P. 364–381.

 

Дата создания: 01.02.2016 16:23
Дата обновления: 02.02.2016 11:12