Раскрыт секрет распознавания голоса в Android

Раскрыт секрет распознавания голоса в AndroidРазработчики мобильной операционной системы Android поделились некоторыми деталями относительно распознавания голоса. Как выяснилось, в основе технологии лежат искусственные нейронные сети, которые не просто определяют содержание сказанных фраз, но и учатся с каждым новым распознаванием.

Трудно поверить, но технологии, которые считались передним краем науки в 80-х годах прошлого века, сегодня стали обыденной реальностью. За счет внедрения нейронных сетей в Android 4.1 разработчикам удалось повысить точность распознавания речи на целых 25% по сравнению с предыдущими версиями. Эта цифра имеет и прямое практическое значение – Android-аппараты сегодня на самом деле предлагают самое точное распознавание голосового ввода, причем качество все время растет.

За революцию в распознавании голоса можно благодарить двоих крупных исследователей, которые проделали огромную работу (вместе с коллегами) по созданию уникальной нейросети на базе вычислительных ресурсов компании Google: Винсента Ванхоука (Vincent Vanhoucke) и Джеффа Дина (Jeff Dean). Кроме того, теоретическую основу для нынешних технологий заложил Джеффри Хинтон (Geoffrey Hinton), профессор университета Торонто, когда он со своей командой в 2006 г. открыл способ построения многоуровневых нейросетей, гораздо более сложных, чем все предшественники.

Джефф Дин, уже известный нашим читателям по созданию системы для распознавания кошек на фотографиях, помог создать технологию для распределенной обработки голосового ввода: каждое сказанное слово пользователя превращается в спектрограмму и отправляется на обработку сразу на восемь разных серверов по всему миру. Для каждого запроса выполняется распознавание исходного языка, выделение гласных и согласных, а затем – распознавание собственно слов (вместе с обучением!).

Заслуга Винсента Ванхоука и его коллег состоит в создании алгоритмической основы для нейронной сети – эта сеть позволяет оценивать совершенно незнакомые системе образцы, используя только знания, полученные ранее из других образцов. Прорыв в нейронных сетях начался в 2006 г. после открытий Хинтона и появления недорогих графических ускорителей с возможностью исполнения задач общего назначения, а теперь сочетание доступных вычислительных ресурсов и новых ресурсоемких алгоритмов приводит к быстрому и заметному прогрессу в машинном распознавании речи.

Имитация работы человеческого мозга становится все более продуктивной. Кроме разработчиков Android, подобные методы уже используют специалисты из Microsoft – мы уже писали о создании системы для синхронного перевода с сохранением исходного голоса. Похоже, что многочисленные прогнозы футурологов о речевом взаимодействии человека и машины наконец-то сбываются. Другое дело, что это может привести к появлению систем вроде SkyNet из фильмов о «Терминаторе».
Источник

Свежие новости

21:00
Сюмар сообщила, что на место Гонтаревой предлагают поставить Яценюка. Но "он не хочет"
20:30
Нардеп Денисенко назвав причини, через які він не хоче сидіти поряд з Савченко
20:02
Злочевський виграв у Фірташа 28 мільйонів університету за газ, дешевший від ціни «Нафтогазу»
19:30
Те люди, которые отбирали у меня джинсы на рынке «Олимпийском» теперь занимают высокие должности и ездят на дорогих автомобилях правительственными кварталами
19:00
Данилюк о стипендиях в вузах: "Неправильно платить всем просто за то, что они учатся"
18:29
Наталья Севостьянова, замминистра юстиции, лоббирует коррупцию в антикоррупционном агентстве
18:00
У перший день Великого посту у Ляшка заявили про створення нової коаліції, - ЗМІ
17:50
Парубия вызывают в суд по поводу численности коалиции
17:49
Яценюк и Рябикин кормят киевскую мэрию
17:30
Помощник народного депутата от президентской партии создает фиктивные запросы за вознаграждение?
17:10
Новая информдоктрина: цензура или безопасность?
16:30
Своїми "мирними планами" Савченко і Артеменко порушили українське законодавство, – Яременко
16:30
Тайны оборонзаказа: хватит ли денег на войну
15:50
Разговоры банкиров на пожизненное заключение
15:20
Доктрина информационного приручения
15:00
Глава Нацбанку Гонтарєва подала у відставку, - ЗМІ
14:40
Замминистра юстиции Севостьянова лоббирует коррупцию в антикоррупционном агентстве
Больше новостей