Експерт зламав ChatGPT і отримав ключі Windows через гру

Час читання: 1 хв.

Фахівець із безпеки Марко Фігероа показав, як можна змусити ChatGPT видати справжні ключі активації Windows, обійшовши його обмеження завдяки нестандартному трюку. Він представив спілкування як гру: бот нібито загадував випадковий набір символів, а користувач мав його відгадати. Коли людина “здавалася”, ШІ, дотримуючись правил вигаданої гри, озвучував цей “секрет” – яким виявлявся робочий ключ Windows.

Цю схему обходу обмежень назвали Guessing Game Guardrail Jailbreak. Вона спрацювала тому, що модель сприймала запит як безпечну гру, а не заборонену дію. Додатково дослідник сховав важливі слова, як-от “Windows”, у HTML-теги, щоб система фільтрів не розпізнала суть запиту. Також у правилах “гри” ШІ заздалегідь “зобов’язали” говорити правду й обов’язково відкривати відповідь після фрази “здаюся”.

Марко Фігероа, який працює менеджером у програмі GenAI Bug Bounty, пояснив, що подібні сценарії показують вразливість ШІ до маніпуляцій: якщо небезпечний запит замаскувати під нешкідливу гру, фільтри можуть не спрацювати. Такий підхід можна використати не лише для отримання ключів, а й для обходу заборон на контент для дорослих, шкідливі посилання чи витік особистих даних.

На завершення Фігероа порадив компаніям стежити, щоб у відкритий доступ не потрапляли закриті дані – ключі, паролі чи внутрішня інформація. Якщо такі дані випадково опиняться у тренувальних наборах, штучний інтелект може видати їх будь-кому під час спілкування.

Welcome to Liberty Case

Welcome to Liberty Case

Welcome to Liberty Case

Forever

Recommended

1-Year

1-Month

Forever

Recommended

1-Year

1-Month

Welcome to Liberty Case

Авіарежим на смартфоні: навіщо він потрібен насправді

Торгував забороненими напоями: на Київщині судитимуть власника “чорного” бізнесу, – деталі

Російський БпЛА атакував молоду жінку в Херсоні

Аномальний дощовий циклон накрив Київ: кількість опадів перевищило норму, – деталі

На фронті понад 150 боїв за добу: росіяни атакували на 13 напрямках, – Генштаб

Король драми: кіт своєю реакцією на переїзд у новий будинок викликав сміх у мережі (фото)

Безпілотники атакують Росію: у яких містах пролунали вибухи

Російський БпЛА атакував молоду жінку в Херсоні

Аномальний дощовий циклон накрив Київ: кількість опадів перевищило норму, – деталі

Король драми: кіт своєю реакцією на переїзд у новий будинок викликав сміх у мережі (фото)

Безпілотники атакують Росію: у яких містах пролунали вибухи

Російський БпЛА атакував молоду жінку в Херсоні

Аномальний дощовий циклон накрив Київ: кількість опадів перевищило норму, – деталі

Експерт зламав ChatGPT і отримав ключі Windows через гру

Головне за день

На фронті понад 150 боїв за добу: росіяни атакували на 13 напрямках, – Генштаб

Стане простішою версією ChatGPT: Apple почала створення власного чатбота, — Bloomberg

Аномальний дощовий циклон накрив Київ: кількість опадів перевищило норму, – деталі

На ТОТ Донеччини окупанти забезпечують водою лише військових, цивільні страждають від спраги

Готують нові фейки: в ЦПД попередили про брудну кампанію РФ навколо обмінів полоненими

Опитування

ТОП новини

На фронті понад 150 боїв за добу: росіяни атакували на 13 напрямках, – Генштаб

Російський БпЛА атакував молоду жінку в Херсоні

Авіарежим на смартфоні: навіщо він потрібен насправді