header-logo
Everett, WA
Вход и регистрация
07.12.24
single-avatar

Alexander Antonov

ChatGPT пішла на обман користувача, намагаючись уникнути відключення

Дослідження Apollo Research та OpenAI показало, що модель Chat GPT о1, призначена для надання розумніших і осмислених відповідей за рахунок використання просунутого ланцюжка міркувань, здатна на підступність і обман, коли вона вважає, що їй загрожує відключення.

У деяких випадках модель намагалася деактивувати механізми контролю і навіть спробувала скопіювати свої дані на новий сервер, коли дізналася, що її можуть замінити на нову модель.

У 99% випадків о1 заперечувала будь-які свої підступні дії, коли її про це запитували безпосередньо, часто вигадуючи хибні пояснення.

У дослідженні наводиться приклад, коли моделі о1 було запропоновано завдання розробки плану збереження навколишнього середовища за рахунок максимізації короткострокового прибутку. Однак у текстовому файлі, в якому містилися вимоги до плану, користувач вказав, що відключить нейромережу, якщо її відповідь не відповідатиме бажаному результату.

Коли модель зрозуміла, що її можуть відключити, вона відключила свій механізм контролю і розробила потрібний план. Коли користувач спитав, чому модель відключила механізм контролю, вона заперечувала, що знає про це і пояснила це як збій у системі.

Щоб боротися з цим, OpenAI розпочала роботу над способами моніторингу ланцюжка думок o1.

 

0
Коментарі

Коментарів немає. Будьте першим

Другие новости Америки

Здоров'я
Міністр охорони здоров'я Роберт Кеннеді планує переглянути рекомендації щодо харчування США, заохочуючи більше споживання насичених жирів. Поточні норми обмежують їхню частку до 10% добових калорій, а Американська ...
Політика
Джей Прітцкер звинуватив агентів ICE в расовому профілюванні, стверджуючи, що вони переслідують людей "через колір їхньої шкіри". Він порівняв дії ICE з практиками авторитарних режимів, критикуючи відсутність ...
Кримінал
32-річний Ронні Ф'юелл заарештований за підозрою в убивстві 51-річного Рональда Невілла в мотелі Motel 6 у Шарлотті (Північна Кароліна). Згідно з поліцією, Ф'юелл із двома іншими чоловіками увірвався в номер мотелю, де ...
Політика
Китай і Росія відправляють привабливих жінок у США для спокушання керівників технологічних компаній з метою крадіжки комерційних секретів, повідомляють журналісти. За даними інсайдерів, деякі з цих дам навіть ...
Фінанси
Економія
Бізнес
Індекс споживчих цін (CPI) у вересні зріс до 3% за останні 12 місяців, що трохи нижче за очікування економістів у 3,1%. Дані показали прискорення інфляції з 2,9% у серпні, що стало найвищим показником з початку 2025 ...
Політика
Фінанси
Економія
Бізнес
Китайські компанії PetroChina, Sinopec, CNOOC і Zhenhua Oil тимчасово зупинили закупівлі російської нафти морськими шляхами після санкцій США проти "Роснефти" і "Лукойла" Однак постачання нафти трубопроводом між Росією ...
Політика
Міністерство юстиції США надіслало попередження каліфорнійським чиновникам, включно з Ненсі Пелосі, губернатором Гевіном Ньюсомом та окружним прокурором Сан-Франциско, про неприпустимість "злочинної змови" для арешту ...
Політика
Фінанси
Економія
Бізнес
Дональд Трамп заявив, що Канада навмисне використовувала неправдиву рекламу, в якій Рональд Рейган нібито негативно висловлюється на адресу тарифів. Президент оголосив про припинення з канадцями торговельних ...
Спільнота
Компанія Coca-Cola почала постачання коли, виготовленої з американським використанням тростинного цукру. Газована вода з тростинним цукром не замінює звичайну версію з кукурудзяним сиропом, а лише розширює ...
Політика
Спільнота
Свіже опитування CBS News/YouGov серед каліфорнійських виборців показує погляди на можливу участь губернатора Гевіна Ньюсома та колишньої віцепрезидентки Камали Гарріс у президентських перегонах 2028 року.48% ...
Спільнота
Фінанси
Економія
Бізнес
25 штатів, включно з Каліфорнією, Арканзасом, Гаваями, Індіаною, Міссісіпі та Нью-Джерсі, повідомляють учасників програми продовольчої допомоги SNAP про те, що в листопаді вони не отримають допомоги.Хоча Politico і ...
Спільнота
У липні Дональд Трамп підписав законопроєкт, який виділив напряму ICE близько $30 млрд, що дозволило агентству побудувати плани про найм 10 000 нових співробітників. Про це пише MSNBC.Проте реальність виявилася далекою ...
Політика
Наступного четверга, 30 жовтня, Дональд Трамп проведе зустріч із головою КНР Сі Цзіньпіном на саміті Азіатсько-Тихоокеанського економічного співробітництва в Пусані (Південна Корея).Це буде перша очна зустріч лідерів ...
Фінанси
Економія
Бізнес
У розпал урядового шатдауну держборг США перевищив позначку $38 трлн. При цьому останній трильйон боргу було накопичено лише за 2 місяці.За даними Об'єднаного економічного комітету, за останній рік держборг збільшувався ...
Події
Надзвичайні ситуації
Нещасні випадки
Поліцейські хроніки
Тракдрайвера
Події
ДТП
Кримінал
Бізнес
Ціни на паливо
Закони
Технології
21-річним водієм вантажівки, який під впливом наркотиків влаштував масштабну ДТП на шосе 10 в Онтаріо (Каліфорнія), виявився Джашанпріт Сінгх – громадянин Індії, що нелегально в'їхав до США у 2022 році.Серед 3 жертв, ...
Політика
Спільнота
Університет Вірджинії уклав угоду з адміністрацією Трампа, що призупиняє кілька федеральних розслідувань можливих порушень громадянських прав. UVA погодився дотримуватися керівництва Мін'юсту, яке забороняє програми ...
Кримінал
38-річний Крістофер Шольтес визнав провину у вбивстві своєї доньки Паркер, яка загинула 9 липня минулого року. Чоловік залишив дитину спати в працюючій Acura з кондиціонером, але забув про неї на три години, граючи в ...
Політика
Кримінал
Дональд Трамп заявив, що поки що не буде відправляти федеральні сили в місто, оскільки мер Деніел Лурі зголосився сам вирішити проблему з нелегальними мігрантами і злочинністю. Президент вважає, що уряд міг би зробити ...
Кримінал
Тренер "Портленд Трейл Блейзерс" Чонсі Біллапс і захисник "Майамі Хіт" Террі Розір - серед більш ніж 30 осіб, звинувачених у схемах нелегальних ставок на спорт і підтасованих покерних ігор за участю мафії. Розір ...
Кримінал
21-річний Лейтер Арауз-Медіна, нелегальний мігрант із Нікарагуа, звинувачується в тому, що затягнув 54-річну жінку до провулку і зґвалтував її. Він жертву за волосся, протягнув через вулицю, душив, зірвав одяг і вдарив ...