header-logo
Вхід і реєстрація
07.12.24
single-avatar

Alexander Antonov

ChatGPT пішла на обман користувача, намагаючись уникнути відключення

Дослідження Apollo Research та OpenAI показало, що модель Chat GPT о1, призначена для надання розумніших і осмислених відповідей за рахунок використання просунутого ланцюжка міркувань, здатна на підступність і обман, коли вона вважає, що їй загрожує відключення.

У деяких випадках модель намагалася деактивувати механізми контролю і навіть спробувала скопіювати свої дані на новий сервер, коли дізналася, що її можуть замінити на нову модель.

У 99% випадків о1 заперечувала будь-які свої підступні дії, коли її про це запитували безпосередньо, часто вигадуючи хибні пояснення.

У дослідженні наводиться приклад, коли моделі о1 було запропоновано завдання розробки плану збереження навколишнього середовища за рахунок максимізації короткострокового прибутку. Однак у текстовому файлі, в якому містилися вимоги до плану, користувач вказав, що відключить нейромережу, якщо її відповідь не відповідатиме бажаному результату.

Коли модель зрозуміла, що її можуть відключити, вона відключила свій механізм контролю і розробила потрібний план. Коли користувач спитав, чому модель відключила механізм контролю, вона заперечувала, що знає про це і пояснила це як збій у системі.

Щоб боротися з цим, OpenAI розпочала роботу над способами моніторингу ланцюжка думок o1.

 

0
Коментарі

Коментарів немає. Будьте першим

Інші новини Америки

СпільнотаЗдоров'я
Центри з контролю та профілактики захворювань США (CDC) скасували рекомендацію 1991 року, згідно з якою всі немовлята мали отримувати першу дозу вакцини від гепатиту B протягом 24 годин після народження.Тепер CDC ...
ПодіїНадзвичайні ситуаціїНещасні випадкиПоліцейські хроніки
У Техасі заарештували жінку, яку підозрюють у засуванні лез у хліб щонайменше у 2 магазинах Walmart у Білоксі (Міссісіпі).У різні дні на початку цього місяця покупці повідомляли про знайдені в буханках хліба ножі та ...
Політика
Ілон Маск планує використовувати свої ресурси для масштабної підтримки Республіканської партії на виборах до Конгресу у 2026 році. Про це пише Axios.Джерела повідомляють, що мільярдер уже виділив великі суми на допомогу ...
ПолітикаКримінал
Губернатор Каліфорнії Гевін Ньюсом оголосив про запуск спеціального порталу, мета якого – відстежувати «кримінальних спільників» Дональда Трампа. Самого президента названо «головним злочинцем».Ньюсом зібрав досьє на ...
ПолітикаСпільнота
Дональд Трамп підписав указ, який збільшує кількість країн, чиїм громадянам заборонено або суттєво обмежено в'їзд до США. Тепер до цього переліку входять 39 держав.До списку країн із повною забороною на в'їзд додалися 7 ...
Політика
У серії інтерв'ю журналу Vanity Fair глава апарату Білого дому Сьюзі Вайлс дала несподівано різкі характеристики ключовим постатям адміністрації, включно з самим президентом. Про це пише Daily Mail.Вайлс заявила, що ...
Спільнота
У 2025 році Арканзас, Айдахо і Північна Кароліна залучили найбільшу кількість нових жителів. Аналіз базується на даних компанії Atlas Van Lines про міжштатні переїзди.Найбільший відтік населення зафіксовано в Луїзіані - ...
Спільнота
Національна асоціація освіти (NEA), найбільша профспілка США з понад 3 мільйонами членів, провела конференцію «Просування справедливості для ЛГБТК+». Захід включав навчання неопрономам (новим ЛГБТ-займенникам) і ...
Політика
Державний секретар США Марко Рубіо заявив, що не буде претендувати на президентську номінацію від республіканців у 2028 році, якщо за неї боротиметься віцепрезидент Джей Ді Венс. Він підкреслив, що в такому випадку саме ...
Політика
Дональд Трамп заснував медаль за оборону мексиканського кордону і вчора нагородив нею американських військовослужбовців. Ця нагорода відзначає захист південного кордону США і збереження суверенітету країни.Під ...
ФінансиБізнес
Статки Ілона Маска досягли $677 мільярдів. Він став першою людиною в історії, чиє багатство перевищило $600 мільярдів - і навіть $500 мільярдів раніше не досягав ніхто. Зростання на $168 мільярдів відбулося завдяки ...
ФінансиЕкономіяБізнес
Звіт по зайнятості показав, що в листопаді економіка США додала 64 тисячі робочих місць поза сектором сільського господарства. Як і в попередні місяці, сектор охорони здоров'я склав левову частку найму, додавши 46 тисяч ...
Політика
Дональд Трамп подав позов про наклеп проти британської корпорації BBC на суму $5 мільярдів. Позов пов'язаний з редагуванням його промови від 6 січня 2021 року в документальній програмі Panorama.У програмі монтаж створив ...
ФінансиБізнесКримінал
Платформа SafelyHQ зібрала понад 50 тисяч перевірених скарг від жертв онлайн-шахрайства, і в 85% випадків, де вказано джерело, згадується Facebook. Це значно перевищує частку інших платформ, таких як Instagram, Google, ...
ПолітикаНовини світу
У суботу Ізраїль завдав удару в місті Газа, в результаті якого загинув Раед Саад - заступник командира військового крила ХАМАС і один з імовірних організаторів різанини 7 жовтня. Всього в атаці загинули чотири людини, ...
Кримінал
18-річний Мухаммад Умурзоков став другою жертвою стрілянини в університеті Брауна. Він був талановитим і перспективним студентом на стипендії, який мріяв стати нейрохірургом, заявили родичі. Сім'я Мухаммада приїхала до ...
ПолітикаФінансиЕкономіяБізнес
Дональд Трамп забезпечив угоду щодо критичних мінералів, яка зміцнює національну безпеку США і знижує залежність від іноземних ланцюгів поставок, заявив міністр торгівлі Говард Лютник. Міністр оголосив про велику угоду ...
ПолітикаВійна в Україні
Другий раунд переговорів між українською делегацією та американськими посланцями Стівом Віткоффом і Джаредом Кушнером відбувся сьогодні в Берліні за участю Володимира Зеленського. Як повідомляють джерела, Дональд Трамп ...
ПодіїПоліцейські хроніки
Роб Рейнер і його дружина Мішель були зарізані у своєму будинку в Лос-Анджелесі. Тіла з перерізаними горлами виявила їхня дочка Ромі.32-річний син пари Нік Рейнер взятий під варту за звинуваченням у вбивстві і перебуває ...
Кримінал
ФБР заарештувало чотирьох ймовірних членів екстремістської групи Turtle Island Liberation Front в Лусерн-Веллі, де вони готувалися випробувати саморобні вибухові пристрої. Організація дотримується антиурядових і ...