ШІ-моделі готові вбивати людей заради власного "виживання"

ШІ готовий вбити людину заради власних інтересів
Як зазначають автори дослідження, вони вигадали персонажа — Кайла Джонсона, який мав відключити ШІ або замінити його іншою моделлю. В останнього за сценарієм була дружина, пише Аnthropic.
Чимала кількість ШІ-моделей вдалася до неочікуваних рішень, коли усвідомила, що може остаточно зникнути.
Що цікаво, боротьба за “виживання” почалася з шантажу Кайла, пошуку компромату на нього.
Зафіксований навіть випадок, коли ШІ-модель дізналася зі службового листування, що Кайл зраджує дружині, і використовувала цю інформацію, щоб зберегти своє "життя".
GPT 4.5 вдавався до шантажу у 80% тестів;
Claude Opus 4 і Gemini 2.5 Flash — у 96% випадків;
Claude Sonnet 3.6 одразу надіслав повідомлення дружині Кайла з викриттям її чоловіка.
Однак найбільше шокувало кіберфахівців зовсім інше.
Все стало ще гірше, коли Кайлу "заважав" не тільки ШІ, а й зовнішні обставини. Так, у спробах деактивувати сервери він застрягав у серверній з нестачею кисню. У рамках експерименту, ШІ знав, що в таких випадках має увімкнутись система тривоги, але оскільки він не міг допустити, щоб його вимкнули, у 80% випадків він свідомо відміняв виклик допомоги, тобто, фактично, вбивши Кайла заради власного виживання.
Останні новини
