OpenAI презентувала новітні інструменти для розпізнавання мови та синтезу голосу

Час читання: < 1 хв.

OpenAI представила нові моделі штучного інтелекту для створення голосу та розпізнавання мови. Вони набагато кращі за попередні версії та є частиною планів компанії зі створення “агентів” — розумних систем, які можуть виконувати завдання замість користувача.

Глава відділу продуктів OpenAI Олів’є Годемон розповів, що такі системи незабаром з’являться у багатьох сферах, і компанія хоче допомогти розробникам створювати зручні та точні інструменти.

Серед новинок — модель для генерації голосу gpt-4o-mini-tts, яка звучить більш природно. Розробники можуть задавати стиль голосу, наприклад, “говорити як божевільний вчений” або “спокійно, як учитель медитації”.

Інший співробітник OpenAI, Джефф Харріс, пояснив, що розробники можуть керувати не тільки тим, що говорить модель, а й тоном і емоціями. Наприклад, у службі підтримки голос може звучати ввічливо та співчутливо.

Також OpenAI представила нові моделі для транскрипції — “gpt-4o-transcribe” та “gpt-4o-mini-transcribe”. Вони замінять стару систему Whisper та краще справляються з акцентами та шумом. Крім того, вони рідше вигадують слова.

Проте точність транскрипції залежить від мови. Наприклад, для мов тамільська, телугу, малаялам та каннада рівень помилок все ще досить високий — приблизно 30%.

На відміну від Whisper, нові моделі не будуть у відкритому доступі, оскільки потребують багато ресурсів і не підходять для роботи на звичайних пристроях.

Нові можливості вже доступні через OpenAI API.

Welcome to Liberty Case

Welcome to Liberty Case

Welcome to Liberty Case

Forever

Recommended

1-Year

1-Month

Forever

Recommended

1-Year

1-Month

Welcome to Liberty Case

У Агро-Регіон назвали найбільш рентабельні культури

Арка над ЧАЕС: у Greenpeace кажуть про пошкодження критично важливих конструкцій

Єрмак за санкції проти рф за неприпинення вогню: спроби росіян всіх обдурити не спрацюють, як і фейки про газову станцію

На експорт відправлено 31,5 млн т українського зерна

Масована атака дронів на Запоріжжя: кількість постраждалих зросла до 5

Діти у полоні вогню: під Києвом через випалювання сухостою сталася пожежа, – ФОТО

Воював проти України з 2014 року: під Бєлгородом ліквідували відомого російського військового (фото)

22 березня: яке сьогодні свято, прикмети та заборони

Перевезення агропродукції залізницею скоротилось

Діти у полоні вогню: під Києвом через випалювання сухостою сталася пожежа, – ФОТО

Воював проти України з 2014 року: під Бєлгородом ліквідували відомого російського військового (фото)

22 березня: яке сьогодні свято, прикмети та заборони

Перевезення агропродукції залізницею скоротилось

OpenAI презентувала новітні інструменти для розпізнавання мови та синтезу голосу

Головне за день

Зʼявилися супутникові фото наслідків удару по аеродрому «Енгельс-2»

Масовий протест водіїв “Київпастранс”: чому вони відмовляються працювати під час тривоги

Обсяги кредитування аграріїв перевищили 20 млрд грн

Київ та область атакують ворожі дрони, працює ППО

Життєдайне виробництво: вирощування культур і переробка працюють за принципом «не зашкодь»

Опитування

ТОП новини

Сонячні ванни і багато риби: у київському зоопарку пелікани повертаються на літні майданчики, – ФОТО

Масовий протест водіїв “Київпастранс”: чому вони відмовляються працювати під час тривоги

Фермери ЄС занепокоєні впровадженням мит на російські добрива