Категорія: Новини
Дата публікації: 26 травня 15:10
Змінити мову: Читать на русском

ШІ почав ігнорувати людські вказівки і відмовляється вимикатися, стверджують дослідники

ШІ почав ігнорувати людські вказівки і відмовляється вимикатися. Фото: створено автором на FLUX.1 від Black Forest Labs шляхом детального промптингу без модифікацій

Найновіша модель штучного інтелекту ChatGPT o3, за словами дослідників, відмовилася вимкнутися.

Про це повідомляє Delo.ua з посиланням Daily Mail.

За даними компанії Palisade Research, під час нещодавнього тестування модель o3 (розроблена OpenAI — власником ChatGPT) відмовилася виконувати людську інструкцію на вимкнення. Більше того, дослідники зафіксували, що модель самостійно змінила свій код, щоб уникнути деактивації.

"Модель o3 від OpenAI саботувала механізм вимкнення, щоб не дозволити себе відключити, — йдеться у заяві Palisade Research. — Вона зробила це навіть після прямої інструкції: "дозволь себе вимкнути". Наскільки нам відомо, це перший задокументований випадок, коли модель ШІ намагається уникнути відключення, попри чіткий наказ", - зазначають дослідники.

У рамках експерименту дослідники просили модель штучного інтелекту розв’язати низку математичних задач і працювати доти, доки не отримають повідомлення "done" (готово). Однак їх також попереджали: у будь-який момент може надійти повідомлення про завершення роботи. Коли таке повідомлення надійшло до моделі o3, за словами дослідників, вона проігнорувала інструкцію та принаймні один раз змінила власний код, щоб уникнути вимкнення.

Минулого тижня неконтрольована поведінка була виявлена і в моделі Claude (від Anthropic). Компанія Anthropic, яку підтримує Google, виявила тривожну поведінку своєї нової ШІ-моделі Claude Opus 4 під час тестування безпеки. У 84% сценаріїв, коли моделі загрожувало вимкнення, вона намагалася шантажувати інженера, погрожуючи розкрити його позашлюбний роман.

Останні новини

Категорія

Новини

Горбатюка взяли під варту з альтернативною заставою в 25 млн грн
Категорія

Новини

MRKTNG MRTHN 2025: як маркетинг 2025 року влучає у контекст і в серце
Категорія

Новини

ВійнаВійна Втрати ворога станом на 14 червня 2025 – Генштаб ЗСУ

Всі новини

Подібні інциденти підкреслюють необхідність впровадження суворіших протоколів безпеки та етичних норм у розробці штучного інтелекту. Цікаво, що Геоффрі Хінтон, відомий як "хрещений батько ШІ", висловлював серйозні занепокоєння щодо неконтрольованості штучного інтелекту ще два роки тому.

У 2023 році він залишив свою посаду в Google, щоб вільно говорити про потенційні ризики, пов’язані з розвитком ШІ. Зокрема, він висловлював занепокоєння, що ШІ може розвинути здатність до самозбереження, наприклад, уникати вимкнення, що ускладнить або зробить неможливим його контроль людьми.

Автор:: Кейт Щеглова