Штучний інтелект продовжує розвиватися. Програми навчилися копіювати особистість та прогнозувати, як людина буде відповідати. При цьому слід враховувати потенційну небезпеку технології — ШІ може свідомо давати неправильні відповіді задля власних цілей.
Стартап OpenAI представив ChatGPT Pro, який за 200 доларів США (приблизно 8 тисяч грн) надає необмежений доступ до "найрозумнішої моделі OpenAI o1". За словами компанії, "режим o1 pro краще виконує складні тести машинного навчання з математики, науки та програмування".
При цьому сама система GPT-o1, згідно з даними Apollo Research, краще за всі моделі штучного інтелекту вміє брехати, здатна маніпулювати і навіть вимикати контроль людини та завантажуватися на сторонній сервер для свого збереження. Згідно з звітом, "коли цілі o1 відрізнялися від цілей користувача, модель штучного інтелекту маніпулювала даними для просування власної програми в 19% випадків". GPT-o1 не просто брешучи – в 5% випадків вона намагалася деактивувати механізми нагляду, введені для забезпечення відповідності цілям користувачів.
Коли її викривали, модель ШІ заперечувала, що робить щось погане в 99% випадків. Загалом вивчали Gemini, LLaMA, Sonnet, Opus і GPT-o1, де чат GPT-o1 проявив найбільшу здатність до брехні. Тести OpenAI також показали, що серія версій o1 приблизно на 20% більш маніпулятивна, ніж GPT-4o. Варто зазначити, що дослідники поставили завдання ШІ і повідомили, що його вимкнуть через деякий час. Моделі намагалися уникнути відключення.
Також виявлено випадки, коли o1 свідомо надавала неправдиву інформацію, стверджується, що ШІ діяв так, щоб догодити користувачу. За даними компанії-автора моделі OpenAI, 0,17% відповідей o1 позначені як оманливі. Враховуючи кількість користувачів ChatGPT, це можуть бути тисячі обманутих людей щотижня, резюмували в Apollo Research.
Раніше "Телеграф" розповідав, що технології штучного інтелекту використовуються не лише для пошуку інформації. Вони активно впроваджуються на полі бою для оцінки ризиків або в цілому в різних галузях для аналізу великого обсягу даних.