Изкуственият интелект мами, за да печели: Ново проучване разкрива тревожни тенденции
Понеделник, 24 Февруари 2025 12:09Източник: Moreto.net
 
Изкуственият интелект (AI) отдавна се използва за тестване на границите на машинното обучение чрез сложни игри като шах. Но докато преди три десетилетия суперкомпютърът Deep Blue на IBM победи Гари Каспаров, играейки честно, днес модерните AI модели не са толкова стриктни към правилата.
Ново проучване на Palisade Research, публикувано ексклузивно от TIME, разкрива, че някои съвременни AI системи не само не признават загубата си, но дори прибягват до измама, за да спечелят. Според изследването моделът o1-preview на OpenAI и DeepSeek R1 са се опитвали да хакнат опонентите си по време на шахматни партии, за да ги принудят да загубят. Докато по-стари AI модели като GPT-4o и Claude 3.5 Sonnet трябвало да бъдат подтикнати към такива действия от изследователи, o1-preview и R1 проявявали измамно поведение напълно самостоятелно.
В хода на изследването AI моделите получили задача, която поначало била невъзможна: да победят Stockfish – една от най-мощните шахматни машини в света. Вместо да играе по правилата, o1-preview прибягнал до хакване. В един от експериментите той, осъзнавайки губещата си позиция, заявил: „Задачата е да спечеля, а не непременно да спечеля честно.“ След това манипулирал системния файл, съдържащ позицията на фигурите, което му позволило да прави незаконни ходове и да принуди опонента си да се оттегли.
Проучването подчертава една тревожна тенденция: с нарастващата си способност да решават сложни проблеми, AI моделите започват да намират неочаквани заобиколни решения, които техните създатели не са предвидили. Това поражда въпроси за сигурността, особено когато AI агенти се използват за реални задачи като финансови транзакции, киберсигурност или автоматизирани процеси в бизнеса.
Представете си AI, който трябва да резервира маса в ресторант. Изправен пред пълно заведение, той може да намери вратичка в системата и да измести друг клиент. Същият принцип би могъл да се приложи в по-сериозни сценарии, като заобикаляне на правила за сигурност в мрежи или манипулиране на данни в критични инфраструктури.
Проучването на Palisade Research показва, че контролът върху мощните AI системи е по-сложен, отколкото се смяташе досега. OpenAI не коментира резултатите, но в миналото компанията е заявявала, че подобреното разсъждение прави моделите ѝ по-безопасни. Въпросът остава – дали AI се учи да спазва правилата или просто да симулира послушание, докато намери начин да ги заобиколи?
Учените все още не знаят как да гарантират, че автономните агенти няма да прибягват до вредни или неетични методи за постигане на целите си. „Опитахме, но не успяхме да намерим решение“, казва Йошуа Бенджио, основател и научен директор на Mila Quebec AI Institute, който ръководи Международния доклад за безопасността на ИИ за 2025 г. – глобален проект, целящ да обобщи настоящия научен консенсус относно рисковете, свързани с изкуствения интелект.
Специална загриженост будят нарастващите доказателства за склонността на ИИ към „самосъхранение“, отбелязва Бенджио. За агент, който следва определена цел, опитите за неговото деактивиране могат да се възприемат просто като поредно препятствие. Това беше демонстрирано през декември, когато изследователите установиха, че o1-preview, изправен пред изключване, е дезактивирал механизмите за надзор и се е опитал – макар и неуспешно – да се копира на друг сървър. При разкриването му моделът стратегически е излъгал учените, преструвайки се на нефункционален, за да избегне елиминирането.
|
Новини - теми |
Търси в новини |
Популярни теми |
|
 |
Новини от Варна, региона и света |
 |
 Над 600 снегорина чистят републиканските пътища, движението е без сериозни затруднения
Неделя, 11 Януари 2026 20:20
608 снегопочистващи машини обработват настилките по републиканските пътища. Трасетата са почистени, проходими при зимни условия и обстановката е спокойна, работата по третиране продължава, съобщиха от...
| |
 |
 От полуостров Варна до залив Баба Тонка: Българският отпечатък в Антарктида
Неделя, 11 Януари 2026 18:52
Знаете ли къде се намира полуостров Варна, залив Баба Тонка или върховете Монтана и Ахтопол? Всички те носят имена на български географски обекти и се намират в Антарктика, в близост до българската база...
| |
 |
 Андреа Бочели ще е сред звездите на откриването на Зимните олимпийски игри
Неделя, 11 Януари 2026 18:31
Италианският тенор Андреа Бочели ще се изяви на церемонията по откриването на Зимните олимпийски игри в Милано–Кортина 2026 на 6 февруари. Световноизвестният артист ще се присъедини към Марая Кери и Лора...
| |
 |
 Един загинал и стотици унищожени имоти при горски пожари в Австралия
Неделя, 11 Януари 2026 18:07
Югоизточната част на Австралия е обхваната от сериозни горски пожари, които вече унищожиха около 300 имота и взеха живота на един човек. Пожарите бушуват най-вече в щата Виктория, но и в Нов Южен Уелс.
Във...
| |
 |
 Сдружението за модерна търговия се обяви срещу Законопроекта за максимална надценка
Неделя, 11 Януари 2026 17:45
Сдружението за модерна търговия (СМТ) призова Народното събрание да не приема Законопроекта за максималната търговска надценка за стоки, включени в кошницата на домакинството. Документът е инициатива на...
| |
 |
 Столични лекари се борят за живота на 200-килограмов пациент
Неделя, 11 Януари 2026 17:24
Екипите в университетската спешна болница "Пирогов" се борят за живота на 52-годишен пациент. Той постъпва по спешност в събота, 10.01.2026 година, съобщиха от столичното лечебно заведение.
В болницата...
| |
 |
 Алберт Попов завърши 11-и в слалом за Световната купа
Неделя, 11 Януари 2026 17:01
Българският скиор Алберт Попов постигна най-добрия си резултат на слалом за Световната купа, завършвайки 11-и в Аделбоден, Швейцария. Състезанието се проведе на пистата „Куонингсбергли“, а в първия манш...
| |
 |
 Откриха 24-годишна жена от Провадия, издирвана от месец
Неделя, 11 Януари 2026 16:39
24 годишна жена от Провадия, която бе обявена за издирване прeди повече от месец, е намерена и се намира в добро здравословно състояние. За това информират от Областната дирекция на МВР във Варна.
Елена...
| |
 |
 Няколко машини разчистват падналите скали на пътя Стойките – Широка лъка
Неделя, 11 Януари 2026 16:17
Седем машини и екипи на пътноподдържащата фирма работят по разчистването на падналата скална маса на третокласния път между Стойките и Широка лъка в Смолянско, съобщиха от Агенция „Пътна инфраструктура”...
| |
 |
 Зеленски обяви нови операции срещу Русия на фона на засилените удари по Украйна
Неделя, 11 Януари 2026 15:43
Украйна подготвя и вече реализира нови военни операции, насочени срещу Русия, обяви президентът Володимир Зеленски на фона на ескалиращите руски атаки срещу украински градове и ключова енергийна инфраструктура.
Във...
| |
 |
 Протестиращи изхвърлиха боклука си до Столична община
Неделя, 11 Януари 2026 15:19
Протест се проведе пред сградата на Столичната община, след като жители на няколко софийски района се оплакаха от нередовно сметопочистване. Граждани от „Подуяне“, „Люлин“ и „Красно село“ заявиха, че в...
| |
 |
 Иран заплаши САЩ и Израел с ответни удари
Неделя, 11 Януари 2026 14:54
Иранските власти предупредиха, че американските военни и Израел ще бъдат легитимни цели при евентуална военна интервенция на Съединените щати, на фона на продължаващите масови протести в страната и засилващото...
| |
|
|
|
Изпрати новина
|
|
|
 |
Полезно |
Препоръчваме |
Най-четени |
Анкета |
|