Час читання: 2 хв.
Китайський технологічний гігант Alibaba анонсував нову модель штучного інтелекту, здатну розпізнавати емоції людей, що може допомогти компанії випередити останні розробки OpenAI.
Дослідники з лабораторії Tongyi Lab представили нову відкриту модель R1-Omni, яка здатна не тільки визначати емоційний стан людини на відео, а й описувати її одяг і навколишнє середовище. Ця модель є вдосконаленою версією попереднього проекту HumanOmni і дозволяє зробити комп’ютерний зір більш глибоким, додаючи новий рівень розуміння.
Реклама
Випуск нової моделі є частиною стратегії Alibaba зайняти лідерські позиції в галузі штучного інтелекту. Після успішного запуску DeepSeek в січні компанія активізувала розробку нових інструментів і додатків у різних секторах. Alibaba також протестувала свою модель Qwen проти DeepSeek, уклала партнерство з Apple для впровадження ІІ на iPhone та тепер намагається змагатися з OpenAI.
Модель R1-Omni доступна для безкоштовного скачування на платформі Hugging Face, що робить її доступною для більш широкої аудиторії. На відміну від OpenAI, яка стягує до $200 на місяць за доступ до своєї моделі GPT-4.5, Alibaba пропонує свою технологію безкоштовно, що може дати їй конкурентну перевагу на китайському ринку.
R1-Omni здатна розпізнавати базові емоції, такі як щастя чи гнів, на основі візуальних підказок, що є важливим проривом у сфері емоційного інтелекту. Цю технологію вже застосовують у чат-ботах служби підтримки клієнтів та в автомобілях Tesla, де вона допомагає виявляти втомлених водіїв.
Генеральний директор Alibaba, Едді У, заявив, що загальний штучний інтелект (AGI) є головною метою компанії, і розвиток емоційного інтелекту є важливим етапом на шляху до цієї мети. OpenAI раніше представила свою модель GPT-4.5, яка розпізнає тонкі сигнали в текстах, але її висока вартість обмежує доступність для широкої аудиторії. Alibaba ж пропонує свої рішення безкоштовно, що робить їх привабливими для користувачів.