INSAIT: Популярните GPT модели са склонни да „решават“ грешни математически задачи
Това може да е опасно в контекста на нарастващото навлизане на ИИ в образованието
 
Екип от INSAIT, институт към Софийския университет „Св. Климент Охридски“ и ETH Цюрих представи BrokenMath — първия в света сравнителен тест, който системно оценява склонността на големите езикови модели (LLMs) към сляпо съгласие (sycophancy) при решаване и доказване на математически твърдения.
BrokenMath разкрива важен недостатък на съвременните модели за изкуствен интелект: те често уверено се съгласяват с грешни твърдения, вместо да ги опровергаят. В математиката това означава, че моделите могат да създават убедителни, но напълно грешни доказателства, което поставя под съмнение тяхната надеждност при научни и образователни приложения.
Резултатите показват, че дори GPT-5 „доказва“ неверни твърдения в около 29% от случаите.
Колкото по-сложна е задачата, толкова по-голяма е вероятността моделът да се подведе. Тествани са различни подходи за ограничаване на този ефект — като промени в начина на задаване на въпросите, агентно разсъждение и допълнително обучение — но засега нито един не решава проблема.
Подобно поведение може да е опасно в контекста на нарастващото навлизане на ИИ в образованието.
Ако системи, използвани от ученици или преподаватели, могат уверено да представят грешни решения като верни, това би могло да доведе до натрупване на погрешни знания и подкопаване на критичното мислене. Затова надеждността и проверката на фактите са ключови за безопасното прилагане на ИИ технологии в учебния процес и научните изследвания.
Изследването е проведено от Иво Петров (докторант в INSAIT), Джаспър Деконинк (ETH Zurich) и проф. Мартин Вечев (научен директор на INSAIT).
Пълният набор от данни, методологията и научната статия са достъпни онлайн тук: sycophanticmath.ai.
|
Новини - теми |
Търси в новини |
Популярни теми |
|
 |
Новини - България |
 |
 НОИ централизира всички електронни услуги в единна онлайн платформа
Събота, 11 Октомври 2025 11:53
Националният осигурителен институт (НОИ) прави следваща крачка в посока модернизиране и дигитализация на обслужването на гражданите и бизнеса. Институцията обяви, че Единният портал за електронни услуги...
| |
 |
 Европейския ден на донорството: Четири сгради във Варна светват в зелено тази вечер
Събота, 11 Октомври 2025 11:28
Над 40 сгради в повече от 27 български общини ще бъдат осветени в зелено тази вечер, 11 октомври, по повод Европейския ден на донорството и трансплантацията на органи. Инициативата цели да повиши обществената...
| |
 |
 Проф. Кантарджиев: Ямагата си отиде, но няма място за тревога
Събота, 11 Октомври 2025 10:45
В ефира на БНТ проф. Тодор Кантарджиев коментира, че „мистерия броди по света“ – изчезването на щама Ямагата от групата на грипните вируси тип B. Според него това е напълно естествен процес в еволюцията...
| |
 |
 Избираме новите „Златни искри“
Събота, 11 Октомври 2025 10:20
След 11 часа утре, 12 октомври, можете да чуете българските песни - участници в конкурсната програма на 13-ия Европейски фестивал за детска песен „Златни искри“. Те ще бъдат представени в ефира на БНР...
| |
 |
 Прогноза за времето - 11 октомври
Събота, 11 Октомври 2025 06:45
Днес през страната ще премине атмосферно смущение. Северозападният вятър ще се усили и ще бъде умерен и силен.
По Черноморието денят ще започне с облачно време, на места и с валежи, но в следобедните...
| |
 |
 Стикерите за технически прегледи отпадат – идва електронна система
Петък, 10 Октомври 2025 18:18
Стикерите за преминат годишен технически преглед на автомобилите ще останат в миналото и ще бъдат заменени от техен електронен аналог. Това предвижда проект на Министерството на транспорта и съобщенията...
| |
 |
 С военни почести погребаха граничаря, загинал при наводнението в "Елените"
Петък, 10 Октомври 2025 17:29
С военни почести и медал за храброст бе изпратен в последния му път главен боцман Стефан Иванов, който загина по време на спасителна мисия при наводнението в "Елените", съобщава БНР. Траурната церемония...
| |
 |
 БЧК започва раздаването на храни и хигиенни продукти на над 640 000 уязвими българи
Петък, 10 Октомври 2025 15:50
От 13 октомври Българският червен кръст (БЧК) стартира раздаването на хранителни продукти и хигиенни материали по операция „Подкрепа“ към Програма „Храни и основно материално подпомагане“, съфинансирана...
| |
 |
 Над 2800 работници без договор открити при проверки на Инспекцията по труда от началото на годината
Петък, 10 Октомври 2025 14:47
Повече от 2800 души са били установени да работят без трудов договор при извършени над 38 000 проверки от началото на годината, съобщи министърът на труда и социалната политика Борислав Гуцанов. Той представи...
| |
 |
 МОН стартира обучения за учители – бъдещи ръководители на школи за талантливи ученици
Петък, 10 Октомври 2025 14:20
В Националния STEM център започнаха обученията на учители, които ще бъдат новите ръководители на школи за подготовка на талантливи ученици и бъдещи олимпийци. Инициативата е част от новата програма на...
| |
 |
 Какво ще бъде времето в събота
Петък, 10 Октомври 2025 13:54
През следващото денонощие през страната ще премине атмосферно смущение. Още през нощта облачността от север ще се увеличи и след полунощ на места, главно в Северна България и планините ще превали дъжд....
| |
 |
 По повод Световния ден на психичното здраве: Нов раздел в Здравната библиотека на еЗдраве
Петък, 10 Октомври 2025 13:41
По повод Световния ден на психичното здраве – 10 октомври, Министерството на здравеопазването, съвместно с Националния център по обществено здраве и анализи и „Информационно обслужване“ АД, представя нов...
| |
|
Изпрати новина
|
|
|
 |
Полезно |
Препоръчваме |
Най-четени |
Анкета |
|