INSAIT: Популярните GPT модели са склонни да „решават“ грешни математически задачи
Това може да е опасно в контекста на нарастващото навлизане на ИИ в образованието
 
Екип от INSAIT, институт към Софийския университет „Св. Климент Охридски“ и ETH Цюрих представи BrokenMath — първия в света сравнителен тест, който системно оценява склонността на големите езикови модели (LLMs) към сляпо съгласие (sycophancy) при решаване и доказване на математически твърдения.
BrokenMath разкрива важен недостатък на съвременните модели за изкуствен интелект: те често уверено се съгласяват с грешни твърдения, вместо да ги опровергаят. В математиката това означава, че моделите могат да създават убедителни, но напълно грешни доказателства, което поставя под съмнение тяхната надеждност при научни и образователни приложения.
Резултатите показват, че дори GPT-5 „доказва“ неверни твърдения в около 29% от случаите.
Колкото по-сложна е задачата, толкова по-голяма е вероятността моделът да се подведе. Тествани са различни подходи за ограничаване на този ефект — като промени в начина на задаване на въпросите, агентно разсъждение и допълнително обучение — но засега нито един не решава проблема.
Подобно поведение може да е опасно в контекста на нарастващото навлизане на ИИ в образованието.
Ако системи, използвани от ученици или преподаватели, могат уверено да представят грешни решения като верни, това би могло да доведе до натрупване на погрешни знания и подкопаване на критичното мислене. Затова надеждността и проверката на фактите са ключови за безопасното прилагане на ИИ технологии в учебния процес и научните изследвания.
Изследването е проведено от Иво Петров (докторант в INSAIT), Джаспър Деконинк (ETH Zurich) и проф. Мартин Вечев (научен директор на INSAIT).
Пълният набор от данни, методологията и научната статия са достъпни онлайн тук: sycophanticmath.ai.
|
Новини - теми |
Търси в новини |
Популярни теми |
|
 |
Новини - България |
 |
 С военни почести погребаха граничаря, загинал при наводнението в "Елените"
Петък, 10 Октомври 2025 17:29
С военни почести и медал за храброст бе изпратен в последния му път главен боцман Стефан Иванов, който загина по време на спасителна мисия при наводнението в "Елените", съобщава БНР. Траурната церемония...
| |
 |
 БЧК започва раздаването на храни и хигиенни продукти на над 640 000 уязвими българи
Петък, 10 Октомври 2025 15:50
От 13 октомври Българският червен кръст (БЧК) стартира раздаването на хранителни продукти и хигиенни материали по операция „Подкрепа“ към Програма „Храни и основно материално подпомагане“, съфинансирана...
| |
 |
 Над 2800 работници без договор открити при проверки на Инспекцията по труда от началото на годината
Петък, 10 Октомври 2025 14:47
Повече от 2800 души са били установени да работят без трудов договор при извършени над 38 000 проверки от началото на годината, съобщи министърът на труда и социалната политика Борислав Гуцанов. Той представи...
| |
 |
 МОН стартира обучения за учители – бъдещи ръководители на школи за талантливи ученици
Петък, 10 Октомври 2025 14:20
В Националния STEM център започнаха обученията на учители, които ще бъдат новите ръководители на школи за подготовка на талантливи ученици и бъдещи олимпийци. Инициативата е част от новата програма на...
| |
 |
 Какво ще бъде времето в събота
Петък, 10 Октомври 2025 13:54
През следващото денонощие през страната ще премине атмосферно смущение. Още през нощта облачността от север ще се увеличи и след полунощ на места, главно в Северна България и планините ще превали дъжд....
| |
 |
 По повод Световния ден на психичното здраве: Нов раздел в Здравната библиотека на еЗдраве
Петък, 10 Октомври 2025 13:41
По повод Световния ден на психичното здраве – 10 октомври, Министерството на здравеопазването, съвместно с Националния център по обществено здраве и анализи и „Информационно обслужване“ АД, представя нов...
| |
 |
 Започна преустройството на „Гранд хотел Варна“ (снимки)
Петък, 10 Октомври 2025 13:14
Започнаха дейности по преустройство и реконструкция на „Гранд хотел Варна“. Тече разрушаване на ниското тяло на зданието пред входа, видя репортер на Moreto.net.
Инвестиционното намерение за превръщането...
| |
 |
 Борисов: Говорих със Слави Трифонов, ще изтеглят проектозакона за затвор
Петък, 10 Октомври 2025 12:39
Предложените от "Има такъв народ" (ИТН) промени в Наказателния кодекс, с които се криминализира разпространението на информация за личния живот на човек без неговото съгласие, ще бъдат оттеглени, съобщи...
| |
 |
 INSAIT: Популярните GPT модели са склонни да „решават“ грешни математически задачи
Петък, 10 Октомври 2025 12:04
Екип от INSAIT, институт към Софийския университет „Св. Климент Охридски“ и ETH Цюрих представи BrokenMath — първия в света сравнителен тест, който системно оценява склонността на големите езикови модели...
| |
 |
 Туризмът у нас през август 2025 г.: повече нощувки и приходи
Петък, 10 Октомври 2025 11:52
През август 2025 г. в България са функционирали 3 771 обекта за краткосрочно настаняване с 10 или повече легла – хотели, мотели, къмпинги, хижи и други. Те предлагат общо 152.9 хил. стаи с 355.6 хил. легла,...
| |
 |
 Парламентът реши: председателят на ДА „Разузнаване“ ще се избира от Народното събрание
Петък, 10 Октомври 2025 11:40
Председателят на Държавна агенция „Разузнаване“ (ДАР) да се избира от Народното събрание по предложение на Министерския съвет, реши на второ четене парламентът.
Досега той се назначаваше с указ на президента.
Той...
| |
 |
 Младата певица Дария Томова с дебютния сингъл „Заваля“ (видео)
Петък, 10 Октомври 2025 11:16
Младата певица Дария Томова прави първа голяма стъпка в музиката с дебютния сингъл „Заваля“. 19-годишната изпълнителка споделя, че това е песен, в която личната изповед се превръща в изкуство, а женската...
| |
|
Изпрати новина
|
|
|
 |
Полезно |
Препоръчваме |
Най-четени |
Анкета |
|