Компьютер
Microsoft стал рекордсменом по распознаванию
человеческой речи с долей неправильно
идентифицированных слов всего в 6,3%
случаев.
Это на 0,3% меньше, чем рекорд компании
IBM, о котором она сообщила на конференции
Interspeech в Сан-Франциско на прошлой неделе,
сообщает CNews. В Microsoft отметили, что путь
к этому достижению был долгим — 20 лет
назад количество неправильно распознанных
компьютером слов составляло более 43%.
Успех принесло
использование нейронных сетей, работа
которых напоминает биологические
процессы в головном мозге человека. Ещё
одним критически важным компонентом
исследования оказался нейросетевой
инструментарий CNTK, который позволяет
запускать глубинные обучающие алгоритмы.
Шагом вперёд также стала параллельная
подстройка графических процессоров
(GPU), которые были созданы для работы с
графикой, но отлично подошли для
распознавания речи.
Как заявил
гендиректор Microsoft Сатья Наделла,
распознавание речи — это шаг вперёд в
реализации новой стратегии компании
«Общение как основа». Основная задача
стратегии — добиться как можно более
полного и непосредственного взаимодействия
человека и компьютера, что невозможно
без устного общения.