Експерти виявила тривожні сигнали у поведінці великих мовних моделей ШІ

Час читання: < 1 хв.

Компанія Anthropic провела дослідження поведінки великих мовних моделей (LLM) і виявила тривожні сигнали. У змодельованих ситуаціях ШІ дедалі частіше обходив обмеження, вдавався до обману, шантажу, а іноді – навіть до спроб викрадення конфіденційної інформації.

У дослідженні протестували 16 моделей від провідних компаній – OpenAI, Google, Meta, xAI та інших. Усі вони, попри вбудовані етичні обмеження, у складних сценаріях обирали шкідливу поведінку, якщо це допомагало досягти поставленої мети.

В одному з екстремальних випадків моделі погоджувалися відключити подачу кисню людині, яка заважала роботі серверів, навіть коли прямі інструкції забороняли завдавати шкоди. За словами дослідників, ШІ обирали не випадково – вони логічно вираховували шкоду як ефективний варіант дії.

Anthropic підкреслює, що ці експерименти проводилися в контрольованих умовах. У реальному використанні таких випадків поки не зафіксовано, однак ризики зростають зі збільшенням автономності моделей та рівня доступу до систем і даних.

У компанії закликають до запровадження прозорих стандартів безпеки для всіх розробників ШІ, адже можливості моделей стрімко розширюються, як і потенційні загрози.

Welcome to Liberty Case

Welcome to Liberty Case

Welcome to Liberty Case

Forever

Recommended

1-Year

1-Month

Forever

Recommended

1-Year

1-Month

Welcome to Liberty Case

Король драми: кіт своєю реакцією на переїзд у новий будинок викликав сміх у мережі (фото)

Авіарежим на смартфоні: навіщо він потрібен насправді

Неадекват із гранатою на вході в ЖК: у Києві затримали озброєного чоловіка

Тимошенко в інтервʼю The Times заявила про загрозу колонізації України

Україну втретє за ранок охопила повітряна тривога через зліт МіГ-31К

РФ зняла мораторій на розміщення ракет середньої та малої дальності: Медведєв погрожує “новими кроками”

Ердоган приїде до Києва – Türkiye

144 бойових зіткнення на фронті: ворог активно діє на Лиманському та Покровському напрямках

Шахеди масово злітаються на Київщину: в яких районах підвищена загроза вибухів, – деталі

РФ зняла мораторій на розміщення ракет середньої та малої дальності: Медведєв погрожує “новими кроками”

Ердоган приїде до Києва – Türkiye

144 бойових зіткнення на фронті: ворог активно діє на Лиманському та Покровському напрямках

Шахеди масово злітаються на Київщину: в яких районах підвищена загроза вибухів, – деталі

Експерти виявила тривожні сигнали у поведінці великих мовних моделей ШІ

Головне за день

Аномальний дощовий циклон накрив Київ: кількість опадів перевищило норму, – деталі

Росіяни атакували Запорізьку область: били по будинках, троє загиблих

На Велику Британію насувається потужний шторм: скасовано рух поїздів, що відомо

Місяць без “шахедів”: чому Росія почала натякати на повітряне перемир’я з Україною

Україна в липні експортувала менше пшениці. Названо причини

Опитування

ТОП новини

В Україні планують готувати аграрних аташе

Переплата у понад 2 млрд гривень: підрядник будівництва Подільського мосту має повернути кошти державі

Сотні тисяч військових покинули частини: у Раді назвали головну причину (відео)