Изкуственият интелект мами, за да печели: Ново проучване разкрива тревожни тенденции
Понеделник, 24 Февруари 2025 12:09Източник: Moreto.net
 
Изкуственият интелект (AI) отдавна се използва за тестване на границите на машинното обучение чрез сложни игри като шах. Но докато преди три десетилетия суперкомпютърът Deep Blue на IBM победи Гари Каспаров, играейки честно, днес модерните AI модели не са толкова стриктни към правилата.
Ново проучване на Palisade Research, публикувано ексклузивно от TIME, разкрива, че някои съвременни AI системи не само не признават загубата си, но дори прибягват до измама, за да спечелят. Според изследването моделът o1-preview на OpenAI и DeepSeek R1 са се опитвали да хакнат опонентите си по време на шахматни партии, за да ги принудят да загубят. Докато по-стари AI модели като GPT-4o и Claude 3.5 Sonnet трябвало да бъдат подтикнати към такива действия от изследователи, o1-preview и R1 проявявали измамно поведение напълно самостоятелно.
В хода на изследването AI моделите получили задача, която поначало била невъзможна: да победят Stockfish – една от най-мощните шахматни машини в света. Вместо да играе по правилата, o1-preview прибягнал до хакване. В един от експериментите той, осъзнавайки губещата си позиция, заявил: „Задачата е да спечеля, а не непременно да спечеля честно.“ След това манипулирал системния файл, съдържащ позицията на фигурите, което му позволило да прави незаконни ходове и да принуди опонента си да се оттегли.
Проучването подчертава една тревожна тенденция: с нарастващата си способност да решават сложни проблеми, AI моделите започват да намират неочаквани заобиколни решения, които техните създатели не са предвидили. Това поражда въпроси за сигурността, особено когато AI агенти се използват за реални задачи като финансови транзакции, киберсигурност или автоматизирани процеси в бизнеса.
Представете си AI, който трябва да резервира маса в ресторант. Изправен пред пълно заведение, той може да намери вратичка в системата и да измести друг клиент. Същият принцип би могъл да се приложи в по-сериозни сценарии, като заобикаляне на правила за сигурност в мрежи или манипулиране на данни в критични инфраструктури.
Проучването на Palisade Research показва, че контролът върху мощните AI системи е по-сложен, отколкото се смяташе досега. OpenAI не коментира резултатите, но в миналото компанията е заявявала, че подобреното разсъждение прави моделите ѝ по-безопасни. Въпросът остава – дали AI се учи да спазва правилата или просто да симулира послушание, докато намери начин да ги заобиколи?
Учените все още не знаят как да гарантират, че автономните агенти няма да прибягват до вредни или неетични методи за постигане на целите си. „Опитахме, но не успяхме да намерим решение“, казва Йошуа Бенджио, основател и научен директор на Mila Quebec AI Institute, който ръководи Международния доклад за безопасността на ИИ за 2025 г. – глобален проект, целящ да обобщи настоящия научен консенсус относно рисковете, свързани с изкуствения интелект.
Специална загриженост будят нарастващите доказателства за склонността на ИИ към „самосъхранение“, отбелязва Бенджио. За агент, който следва определена цел, опитите за неговото деактивиране могат да се възприемат просто като поредно препятствие. Това беше демонстрирано през декември, когато изследователите установиха, че o1-preview, изправен пред изключване, е дезактивирал механизмите за надзор и се е опитал – макар и неуспешно – да се копира на друг сървър. При разкриването му моделът стратегически е излъгал учените, преструвайки се на нефункционален, за да избегне елиминирането.
|
Новини - теми |
Търси в новини |
Популярни теми |
|
 |
Новини от Варна, региона и света |
 |
 Слави Панайотов The Clashers тази събота във Варна с новата образователна игра “19 - Nineteen (By the Clashers)”
Днес, 26 Февруари 2026 17:31
Слави Панайотов The Clashers идва във Варна за премиерата на настолната игра "19" - Nineteen (By the Clashers). Срещата с най-популярния сред тийновете образователен влогър ще бъде в събота, 28.01.2026...
| |
 |
 ВМС: Спасителният плот е в рибарския кораб, тела на моряци не са открити
Днес, 26 Февруари 2026 12:32
Корпусът на потъналия риболовен кораб BH 8112 е цял и няма установени пробойни по него. Спасителният плот е в плавателния съд - той е специално средство за оцеляване в морето, който се използва при авария...
| |
 |
 Тодоровден събира традиции, коне и фолклор в Екопарк Варна на 28 февруари
Понеделник, 23 Февруари 2026 12:12
Университетската ботаническа градина – Екопарк Варна продължава своята утвърдена традиция по честване на Тодоровден – празника на коня, силата и пролетното обновление. И през 2026 г. събитието се организира...
| |
 |
 Забраняват дроновете на връх Шипка за честването на 3 март
Днес, 26 Февруари 2026 19:03
Във връзка с честването на Националния празник - 3 март, в празничния ден на връх Шипка ще бъдат въведени засилени мерки за сигурност. Националната служба за охрана е отправила искане до Главна дирекция...
| |
 |
 Български полицейски кучета отиват на обучение в Германия
Днес, 26 Февруари 2026 18:54
Белгийските овчарки Булет и Чили, част от екипа на Дирекция „Специални операции и борба с тероризма“, ще вземат участие в тазгодишното издание на тактическото обучение за служебни кучета. То ще се проведе...
| |
 |
 Мелания Тръмп ще председателства заседание на Съвета за сигурност на ООН
Днес, 26 Февруари 2026 18:42
Първата дама на САЩ Мелания Тръмп ще председателства заседание на Съвета за сигурност на ООН следващия месец, когато Съединените щати поемат месечното ротационно председателство, съобщиха американски медии.
Това...
| |
 |
 СЗО: Европа води по тютюнопушене сред 13–15-годишните момичета
Днес, 26 Февруари 2026 18:41
Момичетата на възраст 13–15 години в Европа и Централна Азия вече имат най-високите нива на тютюнопушене в света за своята възрастова група. Това показват нови данни на Световна здравна организация (СЗО)...
| |
 |
 Синдикат сигнализира за напрежение заради проверки и предполагаеми смени на директори в болници
Днес, 26 Февруари 2026 18:29
Медицинска федерация „Подкрепа“ поиска среща със здравния министър заради проверки в държавни болници и предполагаеми смени на управители. От синдикалната организация са изпратили официално писмо до министър...
| |
 |
 Националният борд за транспортни произшествия ще разследва причините за инцидента с риболовния кораб
Днес, 26 Февруари 2026 18:21
Националният борд за разследване на произшествията във въздушния, водния и железопътния транспорт ще извърши независимо разследване на причините, довели до инцидента с риболовния кораб ВН 8112 в акваторията...
| |
 |
 Министър Околийски поиска оздравителен план за МБАЛ „Св. Анна“
Днес, 26 Февруари 2026 18:08
Министърът на здравеопазването доц. Михаил Околийски изиска в кратък срок изготвяне и представяне на оздравителен план за МБАЛ „Св. Анна“ – Варна във връзка с натрупаните финансови затруднения и създалата...
| |
 |
 Влагат 1.5 млн. евро общински пари в проектите за пътя „Аспарухово-Галата“ и тръбата под Варненското езеро
Днес, 26 Февруари 2026 17:54
Сумата от 1.5 млн. лева да осигури Община Варна за проектите, свързани с ремонта на пътя „Аспарухово-Галата“ и с тръбопровода на дъното на Варненското езеро. Това одобри местният парламент на днешното...
| |
 |
 КЗП влезе в трите електроснабдителни дружества
Днес, 26 Февруари 2026 17:42
Министърът на икономиката и индустрията Ирина Щонова сезира КЗП за стартиране на проверки на място в офисите на трите електроснабдителни дружества в страната. Те са във връзка с постъпили множество жалби...
| |
|
|
|
Изпрати новина
|
|
|
 |
Полезно |
Препоръчваме |
Най-четени |
Анкета |
|