28 апреля 2024, воскресенье, 7:27
Поддержите
сайт
Сим сим,
Хартия 97!
Рубрики

«Яндекс» научит машины понимать речь человека

«Яндекс» научит машины понимать речь человека

«Яндекс» запустил облачный сервис распознавания речи SpeechKit Cloud.

С его помощью разработчики, в том числе из Беларуси, смогут научить свои продукты понимать человеческий голос. Об этом charter97.org сообщили в пресс-службе компании «Яндекс».

Облачный сервис распознавания речи уже использует Cubic Robotics — разработчик домашнего робота CUBIC. Дроид понимает заданные голосом вопросы и отвечает на них. А вот компания Oktell, выпускающая программное обеспечение для колл-центров, использует технологию «Яндекса», чтобы распознавать речь звонящего в колл-центр человека и соединять его с нужным специалистом.

В основе SpeechKit Cloud лежит технология распознавания речи Yandex SpeechKit, которую «Яндекс» запустил в 2013 году. Сейчас она используется в 400 мобильных приложениях для Android, iOS и Windows Phone и ежедневно обрабатывает миллионы голосовых запросов. Поддержку SpeechKit Cloud можно добавить в самые разные программы, сервисы и устройства: от компьютерной игры до автомобильной навигационной системы.

Качество распознавания речи зависит от тематики запроса. Если вы диктуете смс или заметку, оно составляет 82%, если произносите короткий запрос – 85%. А «географические» запросы (например, адреса и названия организаций) Yandex SpeechKit понимает с точностью, близкой к способностям человека, — 95%.

«В мире есть всего несколько разработчиков систем распознавания голоса – некоторые из них используются, например, в приложениях для смартфонов и планшетов. Однако систем, понимающих русскую речь, значительно меньше: адаптация подобной технологии под конкретный язык занимает очень много времени, так что иностранные разработчики до нашего языка часто «не доходят», – отметил руководитель отдела разработки голосовых сервисов и продуктов «Яндекса» Денис Филиппов.

SpeechKit Cloud понимает русский и турецкий языки, однако в планах «Яндекса» «обучить» технологию и другим языкам. Обработка голосовых запросов производится на серверах «Яндекса», рассчитанных на высокие нагрузки. Распознавание занимает около секунды: именно столько времени проходит с момента отправки данных на сервер до получения ответа. Разработчикам предоставили возможность бесплатно использовать SpeechKit Cloud в течение месяца.

Написать комментарий

Также следите за аккаунтами Charter97.org в социальных сетях