1 апреля 2024, 10:28
5815

Модель искусственного интеллекта, воспроизводящая звук за 15 секунд

Компания OpenAI объявила о разработке модели искусственного интеллекта, способной клонировать голос с помощью 15-секундной записи речи. Прежде чем обнародовать технологию Voice Engine, компания обсудит ее с властями и экспертами.

OpenAI представила Voice Engine, модель искусственного интеллекта, которая может произвести революцию в клонировании голоса. Эта модель, ставшая результатом двухлетней разработки, может клонировать любой голос, просто прослушав 15-секундную аудиозапись. Это действительно пугающий прогресс.

По словам представителей компании, Voice Engine обучался на основе лицензионных аудиозаписей и публичных баз данных. Поэтому проблем с авторскими правами нет. OpenAI не планирует делать эту технологию широко доступной в настоящее время из-за опасности злоупотребления.

В блоге, написанном OpenAI, есть информация о том, для чего была разработана эта технология. Среди них - помощь в чтении слабовидящим людям или людям с проблемами чтения, перевод и дубляж для людей, говорящих на разных языках, помощь людям с проблемами речи, предоставление новых инструментов производителям контента, а также создание новых возможностей для исследований в таких областях, как освоение языка и логопедия.

Как работает Voice Engine?

После прослушивания записи в течение 15 секунд Voice Engine анализирует высоту тона и другие характеристики голоса, чтобы создать синтетический голос, очень похожий на оригинальный. Тот факт, что модель искусственного интеллекта еще не была выпущена для общего пользования, уже говорит о том, что синтетический голос очень близок к оригиналу.

Потенциальная опасность Voice Engine весьма пугающая. Существуют такие риски, как мошенничество, кража личных данных, дезинформация или создание фейковых видео с помощью имитации голоса. OpenAI заявляет, что работает над устранением этих опасений и планирует проконсультироваться с "авторитетами и экспертами", прежде чем сделать Voice Engine общедоступным.

Разработка Voice Engine также поднимает важные этические и юридические вопросы. Как контролировать такие мощные модели искусственного интеллекта и защищать их от злоупотреблений, станет важной проблемой, которую предстоит решить в ближайшие годы. Примеры клонированных голосов можно послушать на странице блога OpenAI.

Модель искусственного интеллекта, воспроизводящая звук за 15 секунд

Теги

Поделиться

Комментарии

Аксессуары OnePlus 15T подтверждены официальными изображениями

Новые Oppo Watch X3: датчик уровня глюкозы в крови и функция мониторинга артериального давления

Новые функции ИИ в Google Maps: как работает Ask Maps с Gemini?

Disney+ запустил ленту видео «Verts» в стиле TikTok