В компании
Microsoft заявили о прорыве в области
машинного распознавания речи, научив
компьютер воспринимать разговор человека
так, как это может делать другой человек.
Теперь система распознавания
речи делает всего 5,9% ошибок по методике
WER (Word Error Rate), столько же ошибок совершает
и естественный распознаватель речи —
человек. В прошлом месяце показатель
Microsoft равнялся 6,3%, сообщает CNews.
«Мы достигли уровня человека. Это
историческое достижение», — заявил
главный ученый команды из подразделения
Microsoft по работе с искусственным интеллектом
Сюэдунь Хуань. По признанию исполнительного
вице-президента подразделения Гарри
Шума, ещё пять лет назад они полагали,
что такое невозможно. К успеху учёные
шли с 1970-х годов.
Microsoft смогла
так далеко продвинуться благодаря
использованию глубоких нейронных сетей,
работа которых напоминает биологические
процессы в головном мозге человека.
Предполагается, что такие сети помогут
также в развитии компьютерного зрения.
Сейчас исследователям Microsoft предстоит
выяснить, как система распознавания
речи будет работать в местах с фоновым
шумом — к примеру, на вечеринке или на
трассе. В долгосрочной перспективе
специалисты хотят научить искусственный
интеллект понимать слова, отвечать на
них и предпринимать соответствующие
действия.