header-logo
Alexandria, VA
Вхід і реєстрація
07.12.24
single-avatar

Alexander Antonov

ChatGPT пішла на обман користувача, намагаючись уникнути відключення

Дослідження Apollo Research та OpenAI показало, що модель Chat GPT о1, призначена для надання розумніших і осмислених відповідей за рахунок використання просунутого ланцюжка міркувань, здатна на підступність і обман, коли вона вважає, що їй загрожує відключення.

У деяких випадках модель намагалася деактивувати механізми контролю і навіть спробувала скопіювати свої дані на новий сервер, коли дізналася, що її можуть замінити на нову модель.

У 99% випадків о1 заперечувала будь-які свої підступні дії, коли її про це запитували безпосередньо, часто вигадуючи хибні пояснення.

У дослідженні наводиться приклад, коли моделі о1 було запропоновано завдання розробки плану збереження навколишнього середовища за рахунок максимізації короткострокового прибутку. Однак у текстовому файлі, в якому містилися вимоги до плану, користувач вказав, що відключить нейромережу, якщо її відповідь не відповідатиме бажаному результату.

Коли модель зрозуміла, що її можуть відключити, вона відключила свій механізм контролю і розробила потрібний план. Коли користувач спитав, чому модель відключила механізм контролю, вона заперечувала, що знає про це і пояснила це як збій у системі.

Щоб боротися з цим, OpenAI розпочала роботу над способами моніторингу ланцюжка думок o1.

 

0
Коментарі

Коментарів немає. Будьте першим

Інші новини Америки

Здоров'я
FDA попередило, що таблетки фториду для прийому всередину не слід давати дітям віком до трьох років. Агентство надіслало повідомлення чотирьом компаніям про намір вжити заходів проти «препаратів», які вони не ...
ПодіїПоліцейські хроніки
27 жовтня вантажівка з 21 макакою перекинулася на I-59 на північ від Гайдельберга: 13 тварин зловили відразу, п'ять загинули, три залишилися на волі. Мавпи з Національного центру біомедичних досліджень прямували до ...
Здоров'я
У листопаді 2024 року повітряні фільтри на колишній верфі Hunters Point Naval Shipyard виявили забруднення плутонієм, що перевищує поріг EPA більш ніж удвічі. Міська влада дізналася про це тільки в жовтні 2025 року, ...
Кримінал
23-річному Доновану Фейсону загрожує смертна кара. У листопаді 2022 року він заманив 18-річну Кейлін Фіенго в парк Coastline в Санфорді і розстріляв в машині, повідомляють в поліції. Фейсон розлютився через підозри в ...
Політика
Володимир Путін оголосив про успішне випробування торпеди «Посейдон» - ядерного безпілотного апарата, здатного долати тисячі миль під водою і створювати радіоактивні хвилі. Він зазначив, що вперше вдалося активувати її ...
Політика
Дональд Трамп закликає скасувати філібастер - парламентську процедуру, яка вимагає 60 голосів для прийняття рішення щодо бюджету. За словами президента, звичайною більшістю (51 голос) республіканці зроблять багато ...
ПолітикаФінансиЕкономіяБізнес
Дональд Трамп в передчутті судового засідання в середу, під час якого вирішиться доля законності введених тарифів. За словами президента, якщо Верховний суд скасує тарифи, то США можуть виявитися країною третього світу. ...
Наука і технології
Літак X-59 від NASA і Lockheed Martin здійснив перший тестовий політ в Каліфорнії на швидкості 230 миль на годину і висоті 12 тисяч футів. Повідомляється, що в майбутньому він досягне 925 миль на годину на висоті 55 ...
Кримінал
У районі Діамантовому Манхеттені двоє чоловіків 23 жовтня відкрито торгували майже дюжиною мініатюрних і той-пуделів з багажника Mercedes SUV, незважаючи на заборону штату і міста на продаж собак. Такі продажі з ...
Кримінал
18-річний Джессі Батлер визнав себе винним за кількома звинуваченнями у зґвалтуваннях і нападах на двох 16-річних однокласниць. Його засудили до 78 років в'язниці, але статус «юного правопорушника» (youthful offender) ...
Спільнота
У Чикаго мешканці мобілізуються проти імміграційних рейдів, створюючи зону оборони через чати в соціальних мережах і месенджерах. Активісти діляться даними про місцезнаходження агентів, номери та моделі ...
ПолітикаФінансиЕкономіяБізнес
Білий дім оприлюднив деталі "історичної" торговельної угоди між Дональдом Трампом і Сі Цзіньпіном, досягнутої на двосторонній зустрічі в Південній Кореї. Угода включає зниження американських тарифів і зобов'язання Китаю ...
Спільнота
У неділю вранці літній час закінчився в 48 штатах, де годинник перевели на годину назад для більшої кількості ранкового світла. Однак все більше штатів прагнуть "заморозити годинник" і відмовитися від цієї практики ...
СпільнотаКримінал
Оцінка ситуації зі злочинністю в США серед американців покращується другий рік поспіль, згідно з новим опитуванням Gallup.49% респондентів вважають злочинність "надзвичайно" або "дуже" серйозною проблемою в країні. Це ...
Політика
10 листопада лідер Сирії Ахмед аш-Шараа відвідає Вашингтон (округ Колумбія) для зустрічі з Дональдом Трампом та підписання угоди про приєднання Сирії до Глобальної коаліції по боротьбі з ІДІЛ, до якої входять 89 ...
Політика
Канадський прем'єр-міністр Марк Карні розповів, що приніс вибачення президенту Дональду Трампу через антитарифну рекламну кампанію. Це сталося в середу під час вечері у Південній Кореї.У рекламі, запущеній владою ...
Спільнота
Федеральне управління цивільної авіації США (FAA) попередило про різке зростання кількості неявок на роботу серед авіадиспетчерів. Причина – шатдаун уряду, який триває вже місяць, через що близько 13 000 диспетчерів ...
Новини світу
Адміністрація Трампа оголосила про скорочення військової присутності США у Східній Європі: близько 700 десантників буде виведено з Німеччини, Румунії та Польщі без заміни.Пентагон пояснив, що цей крок є частиною ...
СпільнотаПодіїНадзвичайні ситуаціїНещасні випадкиПоліцейські хроніки
Джозеф Рокко Джанкола-молодший, 72-річний житель Флориди, був заарештований владою після того, як він неодноразово погрожував співробітникам ICE вбивством. Погрози були розміщені під фейковим профілем у соцмережі ...
Кримінал
Сектор Прикордонного патруля долини Ріо-Гранде (Техас) отримав інформацію про «скоординовану атаку», у рамках якої картелі пропонують виплати в розмірі $10 000 особам, які будуть стріляти в агентів Прикордонного патруля ...