Microsoft представила новую технологию синхронного голосового перевода
На мероприятии Asia 21st Century Computing, прошедшем в городе Тяньцзинь, Китай, глава исследовательского подразделения Microsoft Research Рик Рашид провел демонстрацию технологии синхронного голосового перевода, над которой команда исследователей трудится уже несколько лет.
В ее рамках, компьютер распознает голос человека, транслирует его в текст, осуществляет перевод, после чего результат вновь транслируется в речь, но уже на языке перевода. Более того, системе достаточно прослушать диктующего в течение часа, что бы сымитировать его собственный голос и начать вещать на иностранном языке.
Алгоритм системы перевода построен на моделях активности мозга. В Microsoft Research его называют Deep Neural Networks, и такая система обеспечивает намного более высокую скорость перевода и его точность, чем существующие аналоги. Лучшие альтернативы в текущий момент делают одну ошибку на каждые 4-5 слов. Исследователи Microsoft добились результата, когда ошибка возникает не чаще, чем на каждые 7-8 слов.
Рашид понимает, что технология все еще далека от идеала, и он озвучил это, но перспективы у разработки огромны и в ближайшие несколько лет исследователи надеются «пробить языковой барьер».