07.12.24
single-avatar

Alexander Antonov

ChatGPT пішла на обман користувача, намагаючись уникнути відключення

Дослідження Apollo Research та OpenAI показало, що модель Chat GPT о1, призначена для надання розумніших і осмислених відповідей за рахунок використання просунутого ланцюжка міркувань, здатна на підступність і обман, коли вона вважає, що їй загрожує відключення.

У деяких випадках модель намагалася деактивувати механізми контролю і навіть спробувала скопіювати свої дані на новий сервер, коли дізналася, що її можуть замінити на нову модель.

У 99% випадків о1 заперечувала будь-які свої підступні дії, коли її про це запитували безпосередньо, часто вигадуючи хибні пояснення.

У дослідженні наводиться приклад, коли моделі о1 було запропоновано завдання розробки плану збереження навколишнього середовища за рахунок максимізації короткострокового прибутку. Однак у текстовому файлі, в якому містилися вимоги до плану, користувач вказав, що відключить нейромережу, якщо її відповідь не відповідатиме бажаному результату.

Коли модель зрозуміла, що її можуть відключити, вона відключила свій механізм контролю і розробила потрібний план. Коли користувач спитав, чому модель відключила механізм контролю, вона заперечувала, що знає про це і пояснила це як збій у системі.

Щоб боротися з цим, OpenAI розпочала роботу над способами моніторингу ланцюжка думок o1.

 

0
Коментарі (0)

Другие новости Америки

Міністр фінансів Скотт Бессент заявив, що підписаний договір - результат зусиль Дональда Трампа щодо досягнення миру в Україні. Ця угода дає сигнал Росії, що США бачать в Україні суверенну і процвітаючу країну."Завдяки ... Еще
Мінфін США підтвердив, що сторони підписали угоду про корисні копалини. Американці назвали це партнерство «історичним».Міністр економіки України Юлія Свириденко поділилася ключовими моментами угоди:Повна власність і ... Еще
Дуг Емхофф, чоловік Камали Гарріс, звільнений з посади куратора Меморіального музею Голокосту. Спочатку чиновнику надійшов лист із Білого дому "від імені Дональда Трампа", а потім він особисто повідомив про звільнення в ... Еще
Країною почав поширюватися азіатський голчастий мураха, отрута якого вкрай небезпечна для людини. Основний ареал проживання комахи - Джорджія та інші південно-східні штати.Учені зазначають, що загалом мураха не ... Еще
ВВП країни з поправкою на інфляцію знизився на 0,3% у річному обчисленні в першому кварталі. Це перший від'ємний показник із 2022-го: до цього ВВП зростав приблизно на 3% щокварталу.Компанії намагаються вберегти свої ... Еще
Про це повідомляють джерела, близькі до оточення обох президентів. За словами інсайдерів, Зеленський наполіг на тому, щоб Трамп змінив своє ставлення до глави Кремля, а той нібито погодився.Спочатку радники Зеленського ... Еще
29-річний гватемалець Рауль Ікал забрався на дерево, рятуючись від імміграційної поліції. Чоловік просидів там шість годин, але зрештою нелегального мігранта заарештували.Ікал приїхав до США у 2013-му, але того ж року ... Еще
КНР почала складати список товарів зі США, які звільняють від 125-відсоткового тарифу, повідомляють джерела. Китайська влада без шуму повідомляє про це своїм компаніям.До білого списку вже входять фармацевтика, ... Еще
35-річна Алексіс фон Єйтс постане перед судом за звинуваченням у зґвалтуванні неповнолітнього. Жінку підозрюють у сексуальному зв'язку з 15-річним пасинком.У липні 2024 року Єйтс поклала спати двох своїх дітей, а потім ... Еще
United Parcel Service оголосила про намір скоротити 20 тисяч робітників. Компанія очікує ослаблення попиту з боку свого головного клієнта - Amazon.UPS хоче заощадити $3,5 мільярда цього року завдяки скороченню персоналу ... Еще
Глава Кремля відмовився заморозити російсько-українську війну по поточній лінії фронту, повідомляють інсайдери. Володимир Путін вимагає віддати РФ території всіх чотирьох областей, які росіяни вважають ... Еще
44-річна Маріанна Акерс із Чатема перебувала за кермом автомобіля, який збив на смерть чотирьох дітей, кажуть у поліції. Щоправда, чомусь жінку не заарештували і не висунули їй поки що жодних звинувачень.Крім чотирьох ... Еще
Нове дослідження показує, що в усьому світі понад 356 тисяч смертей від серцевих захворювань у 2018 році можуть бути пов'язані з так званими фталатами.Це хімічні речовини, які знаходяться в контейнерах для зберігання ... Еще
Минулого тижня Китай скасував замовлення 12 тисяч тонн свинини - найбільше скасування з часів пандемії. Американські фермери повідомляють, що їхня галузь уже перебуває в повномасштабній кризі.За тиждень, який закінчився ... Еще
У Канаді відбулися вибори, на яких перемогла Ліберальна партія на чолі з чинним прем'єр-міністром Марком Карні. Консервативна партія П'єра Пулівра посіла друге місце.Політик заявив, що "колишні відносини зі США впали". ... Еще
Член палати представників Шрі Танедар (демократ від штату Мічиган) представив сім статей (офіційні звинувачення), які запускають процес імпічменту Дональда Трампа.Статті Танедара звинувачують Трампа в перешкоджанні ... Еще
Компанія IBM має намір інвестувати в США $150 млрд протягом наступних 5 років.Більше $30 млрд із загальної суми будуть направлені на американське виробництво квантових комп'ютерів.Зазначимо, що компанія Google планує ... Еще
Республіканці в Палаті представників США представили бюджетний план, який передбачає запровадження плати у розмірі не менше $1 000 за подання заяви на надання притулку.Згідно з планом, заявникам на отримання притулку ... Еще
Після інавгурації Дональда Трампа різні галузі американської промисловості залучили близько $5,2 трлн внутрішніх та іноземних інвестицій, які, як очікується, створять 451 000 робочих місць.Проекти, що фінансуються ... Еще
Дональд Трамп підписав указ, який зобов'язує генпрокурора США, Мін'юст та Міністерство внутрішньої безпеки протягом 30 днів створити список «юрисдикцій-притулків», які «перешкоджають виконанню федеральних імміграційних ... Еще
cookies-icon
Мы используем cookie. Чтобы сайт был удобным и полезным для вас.Вы можете согласиться на их использование или изменить настройки cookies в своем браузере. Privacy policy