Раскрыт секрет распознавания голоса в Android

Раскрыт секрет распознавания голоса в AndroidРазработчики мобильной операционной системы Android поделились некоторыми деталями относительно распознавания голоса. Как выяснилось, в основе технологии лежат искусственные нейронные сети, которые не просто определяют содержание сказанных фраз, но и учатся с каждым новым распознаванием.

Трудно поверить, но технологии, которые считались передним краем науки в 80-х годах прошлого века, сегодня стали обыденной реальностью. За счет внедрения нейронных сетей в Android 4.1 разработчикам удалось повысить точность распознавания речи на целых 25% по сравнению с предыдущими версиями. Эта цифра имеет и прямое практическое значение – Android-аппараты сегодня на самом деле предлагают самое точное распознавание голосового ввода, причем качество все время растет.

За революцию в распознавании голоса можно благодарить двоих крупных исследователей, которые проделали огромную работу (вместе с коллегами) по созданию уникальной нейросети на базе вычислительных ресурсов компании Google: Винсента Ванхоука (Vincent Vanhoucke) и Джеффа Дина (Jeff Dean). Кроме того, теоретическую основу для нынешних технологий заложил Джеффри Хинтон (Geoffrey Hinton), профессор университета Торонто, когда он со своей командой в 2006 г. открыл способ построения многоуровневых нейросетей, гораздо более сложных, чем все предшественники.

Джефф Дин, уже известный нашим читателям по созданию системы для распознавания кошек на фотографиях, помог создать технологию для распределенной обработки голосового ввода: каждое сказанное слово пользователя превращается в спектрограмму и отправляется на обработку сразу на восемь разных серверов по всему миру. Для каждого запроса выполняется распознавание исходного языка, выделение гласных и согласных, а затем – распознавание собственно слов (вместе с обучением!).

Заслуга Винсента Ванхоука и его коллег состоит в создании алгоритмической основы для нейронной сети – эта сеть позволяет оценивать совершенно незнакомые системе образцы, используя только знания, полученные ранее из других образцов. Прорыв в нейронных сетях начался в 2006 г. после открытий Хинтона и появления недорогих графических ускорителей с возможностью исполнения задач общего назначения, а теперь сочетание доступных вычислительных ресурсов и новых ресурсоемких алгоритмов приводит к быстрому и заметному прогрессу в машинном распознавании речи.

Имитация работы человеческого мозга становится все более продуктивной. Кроме разработчиков Android, подобные методы уже используют специалисты из Microsoft – мы уже писали о создании системы для синхронного перевода с сохранением исходного голоса. Похоже, что многочисленные прогнозы футурологов о речевом взаимодействии человека и машины наконец-то сбываются. Другое дело, что это может привести к появлению систем вроде SkyNet из фильмов о «Терминаторе».
Источник

Свежие новости

22:07
Стало известно о задержании копа-взяточника в Киеве
21:30
Суд арестовал весь антиквариат из «сокровищницы Азарова»
21:00
Хуже не будет. Что обещает рост экономики на 1%
21:00
Экс-замглавы «Укрзализныци» обнародовал данные о невыгодные цены полувагонов за 618 миллионов
20:15
«Порошенківець», которых блокировал является-декларирование, обзавелся новеньким BMW за миллион
20:00
Ріелтори заробляють по $1000 щомісяця
19:31
Прожорливое брюшко
19:30
Чиновница времен Януковича возглавит Киевский облздрав
18:40
Жена Авакова взяла в долг у жены Княжицкого средства для покупки лицензии Эспрессо ТВ
18:30
В Раде обратились к Европарламенту с важной просьбой по безвизовому режиму
18:14
В Киеве разгромили рынок "Юность"
18:10
Депутат Кулинич случайно раскрыл кухню, как ему организовывают митинги под ВР
18:00
Матвійчук Віталій Анатолійович – прокурор Сумської області? Чи хрещений батько нової мафії?
17:42
Служба беспредела Украины
17:35
Рада заборонила ввезення до України російських книг антиукраїнської спрямованості
17:30
Чи замовчують корупцію в армії України?
17:29
Матвійчук Віталій Анатолійович – прокурор Сумської області? Чи хрещений батько нової мафії?
Больше новостей