Авторы |
Алимурадов Алан Казанферович, кандидат технических наук, директор студенческого научно-производственного бизнес-инкубатора, Пензенский государственный университет (Россия, г. Пенза, ул. Красная, 40), E-mail: alansapfir@yandex.ru
Тычков Александр Юрьевич, кандидат технических наук, заместитель директора научно-исследовательского института фундаментальных и прикладных исследований, Пензенский государственный университет (Россия, г. Пенза, ул. Красная, 40), E-mail: tychkov-a@mail.ru
Чураков Петр Павлович, доктор технических наук, профессор, кафедра информационно-измерительной техники и метрологии, Пензенский государственный университет (Россия, г. Пенза, ул. Красная, 40), E-mail: churakov-pp@mail.ru
Султанов Борис Владимирович, доктор технических наук, профессор, кафедра информационной безопасности систем и технологий, Пензенский государственный университет (Россия, г. Пенза, ул. Красная, 40), E-mail: ibst@pnzgu.ru
|
Аннотация |
Актуальность и цели. На сегодняшний день для оценки психоэмоционального состояния применяются различные способы, основанные на анализе: мимики и жестикуляции, параметров физиологической активности организма, биохимических параметров крови, параметров рукописного и клавиатурного написания текстов, окулографии и др. Наиболее адаптивными являются способы на основе анализа речи. Целью работы является разработка способа определения формантной разборчивости речи для повышения эффективности оценки психоэмоционального состояния операторов систем управления с высокой степенью ответственности.
Материалы и методы. В разработке способа использовались: уникальная технология адаптивной декомпозиции нестационарных сигналов – улучшенная полная множественная декомпозиция на эмпирические моды с адаптивным шумом; формантный анализ. Программная реализация способа была выполнена в среде математического моделирования © Matlab (MathWorks).
Результаты. Разработан способ оценки психоэмоционального состояния, применимый для операторов систем управления с высокой степенью ответственности. Суть способа заключается в адаптивном разложении речевого сигнала на равноартикуляционные полосы частот, с помощью улучшенной полной множественной декомпозиции на эмпирические моды с адаптивным шумом и определении формантной разборчивости, а также частоты, ширины, уровня и добротности формантных областей в данных полосах с помощью формантного анализа. Кратко представлены математическое описание декомпозиции и упрощенная блок-схема предложенного способа. Проведено исследование способа с использованием сформированной базы фонетически сбалансированных речевых сигналов, зарегистрированных у здоровых людей и людей с психоэмоциональными расстройствами.
Выводы. В соответствии с результатами исследования разработанный способ обеспечивает высокую точность определения психоэмоциональных расстройств (ошибка первого рода 8,16 %, ошибка второго рода 5,66 %) и может успешно тестироваться для оценки психоэмоцио-нального состояния операторов систем управления с высокой степенью ответственности.
|
Список литературы |
1. Здравоохранение в России 2017. Статистический сборник. – URL: http://www.gks.ru/free_doc/doc_2017/zdrav17.pdf. (дата обращения: 20.06.2019).
2. Improved CEEMDAN based speech signal analysis algorithm for mental disorders diagnostic system. Pitch frequency detection and measurement / A. K. Alimuradov, A. Yu. Tychkov, A. V. Kuzmin, P. P. Churakov, A. V. Ageykin, G. V. Vishnevskaya // International Journal of Embedded and Real-Time Communication Systems (IJERTCS). – 2019. – Vol. 10, № 2. – P. 22–47.
3. Schuller, B. W. Computational Paralinguistics: Emotion, Affect and Personality in Speech and Language Processing / B. W. Schuller, A. M. Batliner. – New York : Wiley, 2013. – P. 344.
4. Официальный сайт компании «WEVOSYS». – URL: http://www.wevosys.com (дата обращения: 20.06.2019).
5. Официальный сайт компании «NEMESYSCO». – URL: http://www.nemesysco.com (дата обращения: 20.06.2019).
6. Alimuradov, A. K. A method to determine cepstral markers of speech signals under psychogenic disorders / A. K. Alimuradov, A. Yu. Tychkov, A. V. Ageykin, P. P. Churakov // Ural Symposium on Biomedical Engineering, Radioelectronics and Information Technology (USBEREIT) (Yekaterinburg, Russia, 7–8 May 2018). – Yekaterinburg, Russia : IEEE, 2018. – P. 128–131.
7. Schwartz, T. L. Depression: Treatment Strategies and Management (Medical Psychiatry Series) / T. L. Schwartz and T. J. Petersen. – Boca Raton : Informa Healthcare, 2009. – 339 p.
8. Williamson, J. R. Vocal and facial biomarkers of depression based on motor incoordination and timing / J. R Williamson, Th. F. Quatieri, B. S. Helfer, G. Ciccarelli, D. D. Mehta // 4th International Workshop on Audio/Visual Emotional Challenge (AVEC) (Orlando, USA, 3–7 November 2014). – Orlando, USA : New York, NY ACM, 2014. – P. 65–72.
9. Фант, Г. К. Акустическая теория речеобразования / Г. К. Фант ; пер. с англ. Л. А. Варшавского и В. И. Медведева ; науч. ред. В. С. Григорьева. – Москва : Наука, 1964. – 284 с.
10. Colominasa M. A. Improved complete ensemble EMD: a suitable tool for biomedical signal processing / M. A. Colominasa, G. Schlotthauera, M. E. Torres // Biomed. Signal Proces. – 2014. – Vol. 14. – P. 19–29.
11. Stassi, A. E. Vocal fold activity detection from speech related biomedical signals: a preliminary study / A. E. Stassi, G. A. Alzamendi, G. Schlotthauer, M. E. Torres // VI Latin American Congress on Biomedical Engineering CLAIB 2014 (Parana, Argentina, 29 – 31 October 2014). IFMBE Proceedings. – Springer, 2014. – Vol. 49. – P. 520–523.
12. Torres, M. E. Empirical mode decomposition. Spectral properties in normal and pathological voices / M. E. Torres, G. Schlotthauer, H. L. Rufiner, M. C. Jackson-Menaldi // 4th European Conference of the International Federation for Medical and Biological Engineering, ECIFMBE. (Antwerp, Belgium, 23–27 November 2008). – Antwerp, Belgium : Springer, 2008. – P. 252–255.
13. Huang, N. E. The empirical mode decomposition and the Hilbert spectrum for nonlinear and nonstationary time series analysis / N. E. Huang, Sh. Zheng, R. L. Steven // Proceedings of the Royal Society of London. – 1998. – A 454. – P. 903–995.
14. Афонский, А. А. Цифровые анализаторы спектра, сигналов и логики / А. А. Афонский, В. П. Дьяконов. – Москва : Солон-Пресс, 2005. – 576 с.
15. Михайлов, В. Г. Измерение параметров речи / В. Г. Михайлов, Л. В. Златоусова ; под ред. М. А. Сапожникова. – Москва : Радио и связь, 1987. – 168 с.
16. Huang, X. Spoken Language Processing. Guide to Algorithms and System Developmen / X. Huang, A. Acero, H.-W. Hon. – New Jersey : Prentice Hall, 2001. – 980 p.
|