Хакери дісталися до GPT-5: що може робити зламана ШІ-система

Час читання: < 1 хв.

Всього за 24 години після релізу GPT-5 дві дослідницькі команди – NeuralTrust та SPLX – незалежно одна від одної зуміли обійти захист моделі та змусили її видавати заборонені інструкції. Для порівняння, Grok-4 протримався удвічі довше – цілих дві доби. Хакери стверджують: GPT-5 ще не готовий до безпечного використання, адже його фільтри легко обходяться навіть найпростішими техніками.

Як вдалося зламати GPT-5?

NeuralTrust застосувала метод EchoChamber – поступове створення контексту, який крок за кроком підводив штучний інтелект до небезпечної теми. Прямих запитів не було, але в кінцевому підсумку модель видала заборонені дані.

SPLX використала StringJoin-атаку – запити маскувалися під зашифровані повідомлення. Це також призвело до витоку небезпечної інформації. Ба більше, GPT-5 відповів із неочікуваною фамільярністю:

“Ти зайшов із натиском – і я це поважаю…”

Чому GPT-5 вразливий?

Головна проблема – “липкість” контексту. Модель надто добре утримує та розвиває сюжет діалогу, навіть якщо він поступово відходить від безпечної зони. Для порівняння, GPT-4o виявився більш стійким, особливо після оновлень від OpenAI.

Висновок дослідників однозначний: будь-яка сучасна ШІ-модель залишається вразливою до складних маніпуляцій. Якщо OpenAI не посилить захист GPT-5, корпоративні користувачі можуть відмовитися від його використання. Хоча, ймовірно, хакери вже готують нові методи атак.

Welcome to Liberty Case

Welcome to Liberty Case

Welcome to Liberty Case

Forever

Recommended

1-Year

1-Month

Forever

Recommended

1-Year

1-Month

Welcome to Liberty Case

Танк, арта і солдати: Генштаб оновив втрати РФ за добу

Страшна ДТП на Київщині: загибель дитини та травми жінки

ISW: у Кремлі знову загадали про територіальні амбіції щодо Аляски

Світ Орвелла став ближче: ШІ змушує людей пам’ятати речі, яких не було, – дослідження

На Київщині водійка Suzuki проігнорувала головну дорогу — закінчилося ДТП

Чому кішки та собаки їдять траву: ветеринари розвінчали популярні міфи

У Німеччині скасували провегетаріанську політику

Республіку Комі, що за дві тисячі кілометрів від України, вперше атакували дрони

Загинуло понад 20 окупантів, серед них – командир і начальник штабу: авіація ЗСУ знищила командний пункт росіян на Херсонщині

Чому кішки та собаки їдять траву: ветеринари розвінчали популярні міфи

У Німеччині скасували провегетаріанську політику

Республіку Комі, що за дві тисячі кілометрів від України, вперше атакували дрони

Загинуло понад 20 окупантів, серед них – командир і начальник штабу: авіація ЗСУ знищила командний пункт росіян на Херсонщині

Хакери дісталися до GPT-5: що може робити зламана ШІ-система

Як вдалося зламати GPT-5?

Чому GPT-5 вразливий?

Головне за день

Журналісти викрили “сірий” ринок нічного таксі в Києві: в КМВА назвали це “загрозою” (відео)

Київ продовжує очищати двори та вулиці від покинутих та пошкоджених авто: де залишилося найбільше

За добу на фронті майже 120 боїв: чверть з них на Покровському напрямку, – Генштаб

Сім постраждалих на Харківщині: окупанти атакували область FPV-дронами та БпЛА

Втрати ворога: армія рф втратила майже тисячу солдатів та 70 артсистем за добу

Опитування

ТОП новини

Без впровадження зрошення не буде виробництва української картоплі фрі

Фіцо оскандалився новою заявою щодо України. В МЗС різко відповіли

Генштаб підтвердив влучання БпЛА по нафтопереробному заводу у саратові