«На CHiME-5 конкурсанты решали так называемую cocktail party problem – распознавание спонтанной речи нескольких дикторов в условиях частичного наложения речи и шума, то есть в типичной ситуации общения на вечеринке. Этот блок требовал работы с сегментированной (уже выделенной) речью. Новизна и особенность CHiME-6 заключалась в том, что впервые в истории конкурсантам было предложено решить аналогичную проблему, но работа с несегментированной речью, при этом – с перекрытием речи до 20%», – говорится в пресс-релизе.
Записи для конкурса были сделаны на 20 ужинах в настоящих домах, где люди свободно общались, шутили, смеялись, готовили, ели, мыли посуду.
Организаторы поставили перед участниками цель – создать систему распознавания, которая «прослушает» записи и выдаст полную расшифровку с наименьшим количеством ошибок. В итоге победителем стала технология, созданная специалистами ЦРТ.
«Качественное распознавание речи разных дикторов, при этом перебиваемой шумами, позволяет выводить сервисы из разряда инновационных в повседневное применение, совершенствуя бизнес и упрощая нашу жизнь», – отметил генеральный директор группы компаний ЦРТ Дмитрий Дырмовский.
В начале января президент России Владимир Путин в ходе обращения с ежегодным посланием к Федеральному собранию заявил, что страна способна достичь прорыва в сфере развития искусственного интеллекта.
В ноябре прошлого года Сбербанк создал самый мощный в России суперкомпьютер. Данная модель помогает ускорить разработку сервисов и процессов, основанных на искусственном интеллекте.