Помните нейросеть Яндекса, которая переводила зарубежные видео на лету? Компания «прокачала» её, научив ещё большим трюкам.

Так, теперь пользователи Яндекс.Браузера могут смотреть ролики на английском языке с многоголосым закадровым переводом на русский.

Если изначально технология использовала два синтезированных голоса для перевода речи — один мужской и один женский — то теперь голосов двенадцать. По шесть на каждый из полов.

Сообщается, что нейросеть «раздаёт» голоса разным спикерам, после чего «запоминает» их с помощью созданных внутри Яндекса ИИ-моделей.

Причём работает это всё достаточно многослойно: сначала одна нейросеть переводит речь в текст, восстанавливает пунктуацию и определяет границы предложений, а затем другая анализирует спектрограмму голоса и отмечает фрагменты, сказанные разными людьми.

Источник статьи: www.ferra.ru

Комментарии:

Оставьте комментарий

Ваш электронный адрес не будет опубликован

Вы можете использовать эти HTML теги и атрибуты: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

Пожалуйста введите ответ (Анти робот) * Лимит времени истёк. Пожалуйста, перезагрузите CAPTCHA.