Voice Engine от OpenAI копирует голос человека

admin 2 апреля, 2024

admin 2 апреля, 2024 0 комментариев 624 просмотров

[ad_1]

Компания OpenAI рассказала о модели искусственного интеллекта Voice Engine, которая копирует голос человека и генерирует синтетическую речь на основе предоставленных пользователем аудиосэмплов. По данным OpenAI, ИИ требуется всего 15 секунд звука для имитации говорящего. В своем блоге компания описала Voice Engine как «маленькую модель»: это предполагает, что для ее работы требуется ограниченная вычислительная инфраструктура.

Инструмент был разработан еще в конце 2022 года. OpenAI использует его для реализации функций ChatGPT, которые позволяют взаимодействовать с чат-ботом с помощью голосовых команд и «заставляют» его читать текст вслух. Кроме того, в прошлом году компания открыла доступ к модели ограниченному числу партнеров в рамках пилотной программы. Они успешно применили Voice Engine для таких задач, как создание закадрового голоса для образовательного контента и перевода видео.

Компания сообщает, что участники пилотной программы согласились воспроизводить голоса людей только с их разрешения. Кроме того, клиенты должны добавлять к генерируемой речи информацию о том, что она синтетическая.

«Мы надеемся начать диалог об ответственном использовании синтетических голосов и о том, как общество может адаптироваться к новым возможностям, — написали сотрудники OpenAI в блоге. — На основе этих дискуссий и результатов небольших испытаний мы примем более обоснованное решение о том, стоит ли и как развертывать эту технологию в больших масштабах».

Если OpenAI решит сделать Voice Engine коммерчески доступным, модель ИИ может создать серьезную конкуренцию существующим на рынке сервисам по синтезу речи. Eleven Labs, один из стартапов в этом сегменте, недавно привлек $80 млн инвестиций и заявил, что его пользовательская база включает более 40% компаний из списка Fortune 500.

Текст: Майя Цветкова

Изображение: Freepik

[ad_2]

Источник

Voice Engine от OpenAI копирует голос человека

Тут интересно

Вам может понравиться

Большие ставки откроют реальную ценность генеративного искусственного интеллекта

Nvidia запускает квантовые компьютерные центры на платформе CUDA-Q

Новые правила для внедрения городских роботов предложили в Московском политехе

Вы отстаете в области генеративного искусственного интеллекта?

Откуда мы пришли? Исследование резкого роста интереса к данным и инструментам обработки данных

Cisco переосмысливает кибербезопасность на RSAC 2024 с помощью искусственного интеллекта и прозрачности на уровне ядра

Сэм Альтман опровергает слухи о поисковой системе OpenAI

Последнее партнерство Perplexity направлено на поддержку голосового помощника SoundHound

Голосовые ИИ-агенты навсегда изменят индустрию поддержки клиентов

AI Beat: зачем OpenAI поисковая система?

Invoke AI представляет усовершенствованные функции управления генерацией изображений

Apple Vision Pro, возможно, провалился, но за пространственными вычислениями все еще будущее, говорит Deloitte

Обзор сервисов ИИ

Daily AI

Популярное

Voice Engine от OpenAI копирует голос человека

Не знаете, с чего начать анализ данных? Попробуйте новый Einstein Copilot от Salesforce для Tableau

GigaChat – Перспективы и реальность

Тут интересно

Вам может понравиться

Обзор сервисов ИИ

Daily AI

Популярное