Главная imuk.pnzgu.ru/imuk11217 » Статья 11217

Статья 11217

Название статья

ПРИМЕНЕНИЕ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ ДЛЯ РАСПОЗНАВАНИЯ РЕЧЕВЫХ КОМАНД 

Авторы

Бердибаева Гульмира Куанышбаевна, докторант, Казахский национальный исследовательский
университет имени К. И. Сатпаева, (Казахстан, г. Алматы, ул. Сатпаева, 22), horli@mail.ru
Бодин Олег Николаевич, доктор технических наук, профессор, кафедра информационно-измерительной техники и метрологии, Пензенский государственный университет,(Россия, г. Пенза, ул. Красная, 40), bodin_o@inbox.ru
Громков Николай Валентинович, доктор технических наук, профессор, кафедра информационно-измерительной техники и метрологии, Пензенский государственный университет, (Россия, г. Пенза, ул. Красная, 40), ngrom@bk.ru
Козлов Валерий Валерьевич, кандидат технических наук, доцент, кафедра информационно-измерительной техники и метрологии, Пензенский государственный университет, (Россия, г. Пенза, ул. Красная, 40), iit@pnzgu.ru
Ожикенов Касымбек Адилбекович, кандидат технических наук, доцент, заведующий кафедрой робототехники и автоматизации оборудования, Казахский национальный исследовательский  университет  имени К. И. Сатпаева (Казахстан, г. Алматы, ул. Сатпаева, 22), horli@mail.ru
Пижонков Ярослав Андреевич, студент, Пензенский государственный университет, (Россия, г. Пенза, ул. Красная, 40), iit@pnzgu.ru

Индекс УДК

 004.934

Аннотация

Актуальность и цели. Целью работы является оценка применения искусственных нейронных сетей для распознавания речевых команд в системах голосового управления.
Материалы и методы. Применяемый метод основан на анализе голосовых команд нейронными сетями, каждая из которых обучена на соответствующие фонемы естественного языка. Выделенные сегменты речевых команд параллельно подаются на вход каждой сети. В случае распознавания фонемы соответствующая сеть выдаст сигнал, затем группа распознанных фонем анализируется и сравнивается с базовым словарем речевых команд.
Результаты. Рассмотрены современные методы и средства голосового управления, анализ которых показал необходимость использования метода фонемного декодирования при распознавании речевых команд. Приведено описание примера работы программы разделения голосового сообщения на составляющие фонемы, в результате преобразования речевая команда разделяется на фонемы, являющиеся входными данными для нейросетевого анализа.
Выводы. Предлагаемый авторами подход при построении систем голосового управления повышает достоверность распознавания речевых команд за счет выявления частотных признаков фонем и последующего их нейросетевого анализа. При этом повышается восприимчивость нейронной сети к входным данным по сравнению с непосредственной подачей на вход нейронной сети речевых команд.

Ключевые слова

голосовое управление, распознавания речевых команд, искусственная нейронная сеть, классификация, фонема.

 Скачать статью в формате PDF

Список литературы

1. Schuster, M. Speech Recognition for Mobile Devices at Google / M. Schuster // LNCS. –2010. – Vol. 6230. – P. 8–10.
2. Козлов, В. В. Определение параметров гармонических сигналов в условиях действия шумов и помех на основе метода разложения сигнала на собственные числа / В. В. Козлов // Современные проблемы науки и образования. – 2013. – № 6. – URL: http://www.science-education.ru/113-10860.
3. Козлов, В. В. Исследование погрешности определения параметров гармонического сигнала на основе метода разложения на собственные числа / В. В. Козлов, Б. Н. Маньжов, Е. А. Ломтев // Измерения. Мониторинг. Управление. Контроль. – 2012. – № 1. – С. 50–55.
4. Пат. 2466468 Российская Федерация. Система и способ распознавания речи / Кочаров Д. А., Хомяков А. Б. – заявл. 30.06.2011 ; опубл. 10.11.2012, Бюл. № 31.
5. Pat. US 8175883 B2, Int. C1 G10L21/00 (2006.01). Speech recognition system and method / Invertor: Grant R., Gregor P. – Assignee: Nuance Communications Inc. – Pub. Date 08.05.2012.
6. Вишнякова, О. А. Алгоритм фонемной сегментации на основе анализа скорости изменения энергии дискретного вейвлет-преобразования / О. А. Вишнякова, Д. Н. Лавров // Информационные технологии. – 2011. – № 4. – С. 146–152.
7. Савченко, В. В. Распознавание речевых команд методом фонетического декодирования слов с подавлением фонового шума / В. В. Савченко // Информационные технологии. – 2016. № 1. С.76–80.
8. Уоссермен, Ф. Нейрокомпьютерная техника: Теория и практика : пер. с англ. / Ф. Уоссермен. – М. : Мир, 1992. – 118 с.
9. Медведев, В. С. Нейронные сети. MATLAB 6 / В. С. Медведев, В. Г. Потемкин ; под общ. ред. В. Г. Потемкина. – М. : Диалог-МИФИ, 2002. – 496 с.
10. Сергиенко, А. Б. Цифровая обработка сигналов / А. Б. Сергиенко. – СПб. : Питер, 2003. – 604 с.

 

Дата создания: 10.08.2017 11:24
Дата обновления: 10.08.2017 14:23