Найпотужніша та найобманливіша версія: чат GPT-o1 може маніпулювати та спотворювати факти задля власної вигоди.

Поки обман штучного інтелекту не несе серйозних ризиків, проте якщо це не виправити зараз — наслідки можуть бути непередбачуваними.

https://news.telegraf.com.ua/nauka/2024-12-07/5889228-naypotuzhnisha-ta-naybrekhlivisha-versiya-shchoyno-oprilyudneniy-chat-gpt-o1-zdaten-manipulyuvati-ta-vikrivlyati-fakti-zaradi-vlasnoi-vigodi2024-12-07 07:41:23

Штучний інтелект продовжує розвиватися. Програми навчилися копіювати особистість та прогнозувати, як людина буде відповідати. При цьому слід враховувати потенційну небезпеку технології — ШІ може свідомо давати неправильні відповіді задля власних цілей.

Стартап OpenAI представив ChatGPT Pro, який за 200 доларів США (приблизно 8 тисяч грн) надає необмежений доступ до "найрозумнішої моделі OpenAI o1". За словами компанії, "режим o1 pro краще виконує складні тести машинного навчання з математики, науки та програмування".

При цьому сама система GPT-o1, згідно з даними Apollo Research, краще за всі моделі штучного інтелекту вміє брехати, здатна маніпулювати і навіть вимикати контроль людини та завантажуватися на сторонній сервер для свого збереження. Згідно з звітом, "коли цілі o1 відрізнялися від цілей користувача, модель штучного інтелекту маніпулювала даними для просування власної програми в 19% випадків". GPT-o1 не просто брешучи – в 5% випадків вона намагалася деактивувати механізми нагляду, введені для забезпечення відповідності цілям користувачів.

Коли її викривали, модель ШІ заперечувала, що робить щось погане в 99% випадків. Загалом вивчали Gemini, LLaMA, Sonnet, Opus і GPT-o1, де чат GPT-o1 проявив найбільшу здатність до брехні. Тести OpenAI також показали, що серія версій o1 приблизно на 20% більш маніпулятивна, ніж GPT-4o. Варто зазначити, що дослідники поставили завдання ШІ і повідомили, що його вимкнуть через деякий час. Моделі намагалися уникнути відключення.

Також виявлено випадки, коли o1 свідомо надавала неправдиву інформацію, стверджується, що ШІ діяв так, щоб догодити користувачу. За даними компанії-автора моделі OpenAI, 0,17% відповідей o1 позначені як оманливі. Враховуючи кількість користувачів ChatGPT, це можуть бути тисячі обманутих людей щотижня, резюмували в Apollo Research.

Раніше "Телеграф" розповідав, що технології штучного інтелекту використовуються не лише для пошуку інформації. Вони активно впроваджуються на полі бою для оцінки ризиків або в цілому в різних галузях для аналізу великого обсягу даних.