Модель искусственного интеллекта, воспроизводящая звук за 15 секунд

Модель искусственного интеллекта, воспроизводящая звук за 15 секунд

Компания OpenAI объявила о разработке модели искусственного интеллекта, способной клонировать голос с помощью 15-секундной записи речи. Прежде чем обнародовать технологию Voice Engine, компания обсудит ее с властями и экспертами.

OpenAI представила Voice Engine, модель искусственного интеллекта, которая может произвести революцию в клонировании голоса. Эта модель, ставшая результатом двухлетней разработки, может клонировать любой голос, просто прослушав 15-секундную аудиозапись. Это действительно пугающий прогресс.

По словам представителей компании, Voice Engine обучался на основе лицензионных аудиозаписей и публичных баз данных. Поэтому проблем с авторскими правами нет. OpenAI не планирует делать эту технологию широко доступной в настоящее время из-за опасности злоупотребления.

В блоге, написанном OpenAI, есть информация о том, для чего была разработана эта технология. Среди них - помощь в чтении слабовидящим людям или людям с проблемами чтения, перевод и дубляж для людей, говорящих на разных языках, помощь людям с проблемами речи, предоставление новых инструментов производителям контента, а также создание новых возможностей для исследований в таких областях, как освоение языка и логопедия.
 

Как работает Voice Engine?

После прослушивания записи в течение 15 секунд Voice Engine анализирует высоту тона и другие характеристики голоса, чтобы создать синтетический голос, очень похожий на оригинальный. Тот факт, что модель искусственного интеллекта еще не была выпущена для общего пользования, уже говорит о том, что синтетический голос очень близок к оригиналу.

Потенциальная опасность Voice Engine весьма пугающая. Существуют такие риски, как мошенничество, кража личных данных, дезинформация или создание фейковых видео с помощью имитации голоса. OpenAI заявляет, что работает над устранением этих опасений и планирует проконсультироваться с "авторитетами и экспертами", прежде чем сделать Voice Engine общедоступным.

Разработка Voice Engine также поднимает важные этические и юридические вопросы. Как контролировать такие мощные модели искусственного интеллекта и защищать их от злоупотреблений, станет важной проблемой, которую предстоит решить в ближайшие годы. Примеры клонированных голосов можно послушать на странице блога OpenAI.
 

Комментарии