INSAIT: Популярните GPT модели са склонни да „решават“ грешни математически задачи
Това може да е опасно в контекста на нарастващото навлизане на ИИ в образованието
 
Екип от INSAIT, институт към Софийския университет „Св. Климент Охридски“ и ETH Цюрих представи BrokenMath — първия в света сравнителен тест, който системно оценява склонността на големите езикови модели (LLMs) към сляпо съгласие (sycophancy) при решаване и доказване на математически твърдения.
BrokenMath разкрива важен недостатък на съвременните модели за изкуствен интелект: те често уверено се съгласяват с грешни твърдения, вместо да ги опровергаят. В математиката това означава, че моделите могат да създават убедителни, но напълно грешни доказателства, което поставя под съмнение тяхната надеждност при научни и образователни приложения.
Резултатите показват, че дори GPT-5 „доказва“ неверни твърдения в около 29% от случаите.
Колкото по-сложна е задачата, толкова по-голяма е вероятността моделът да се подведе. Тествани са различни подходи за ограничаване на този ефект — като промени в начина на задаване на въпросите, агентно разсъждение и допълнително обучение — но засега нито един не решава проблема.
Подобно поведение може да е опасно в контекста на нарастващото навлизане на ИИ в образованието.
Ако системи, използвани от ученици или преподаватели, могат уверено да представят грешни решения като верни, това би могло да доведе до натрупване на погрешни знания и подкопаване на критичното мислене. Затова надеждността и проверката на фактите са ключови за безопасното прилагане на ИИ технологии в учебния процес и научните изследвания.
Изследването е проведено от Иво Петров (докторант в INSAIT), Джаспър Деконинк (ETH Zurich) и проф. Мартин Вечев (научен директор на INSAIT).
Пълният набор от данни, методологията и научната статия са достъпни онлайн тук: sycophanticmath.ai.
|
Новини - теми |
Търси в новини |
Популярни теми |
|
 |
Новини - Наука |
 |
 Над 1400 души посетиха Провадия–Солницата на 22 септември (снимки)
Вторник, 23 Септември 2025 10:15
Над 1400 любители на историята и археологията избраха да прекарат празничния 22 септември сред уникалния праисторически обект Провадия–Солницата, отчитат от екиа на археологическия комплекс.
След двата...
| |
 |
 Емил Табаков и "малкият Моцарт" Ивайло Василев откриват сезона във варненската опера
Понеделник, 22 Септември 2025 15:49
Двама виртуози от две поколения в един необикновен концерт ще се срещнат на сцената на 1 октомври, в Световния ден на музиката, за да открият новия 79-и сезон на Държавна опера Варна. Доайенът на диригентското...
| |
 |
 Днес: Ден на отворените врати в Провадия-Солницата
Понеделник, 22 Септември 2025 08:22
Ден на отворените врати ще се проведе днес, 22 септември, в Провадия-Солницата. Това обявиха от археологическия екип, който проучва праисторическият солодобивен и градски център
Любители на древността...
| |
 |
 Филмът „Дяволски игри“ с безплатна прожекция за хора със специални потребности във Варна
Неделя, 21 Септември 2025 19:04
На 27 септември (събота) от 17:00 часа в зала „Вапцаров“ на Висшето военноморско училище във Варна ще се състои безплатна прожекция на филма „Дяволски игри“. Събитието е насочено към хора със специални...
| |
 |
 Аладжа манастир и Побити камъни ще работят в празничния 22 септември
Неделя, 21 Септември 2025 13:15
На 22 септември – Деня на Независимостта на България, отворени за посетители ще бъдат музейните обекти „Аладжа манастир“ и „Побити камъни“. Това информират от Регионалния исторически музей - Варна.
Обектите...
| |
 |
 Варна посреща фестивала „Златният делфин“ през октомври
Петък, 19 Септември 2025 13:38
Варна ще бъде домакин на XIX Международен куклен фестивал „Златният делфин“ от 1 до 7 октомври. Това е първият фестивал на кукленото изкуство в България, създаден през 1972 г. и насочен към популяризиране...
| |
 |
 Учени от БАН разработиха устройство за експерименти при термоядрения синтез
Петък, 19 Септември 2025 12:32
Учени от Института по електроника на БАН разработиха устройство, наречено Анализатор на забавящо поле, което се използва за провеждане на експерименти за постигане на управляем термоядрен синтез. Устройството...
| |
 |
 Иван Минчев открива нова изложба в Ателие „Георги Велчев" във Варна
Петък, 19 Септември 2025 11:18
Варненският художник Иван Минчев представя новата си самостоятелна изложба живопис, озаглавена „Джокер".
Експозицията ще бъде открита днес, 19 септември, и ще може да бъде разгледана до 25 октомври...
| |
 |
 Астрономи откриха нова квазилуна край Земята – 2025 PN7
Петък, 19 Септември 2025 09:47
Астрономи съобщиха за откриването на нова квазилуна, наречена 2025 PN7, която вероятно обикаля в близост до Земята от около 60 години, без да бъде забелязана. Космическата скала е заснета за първи път...
| |
 |
 Седмица с разнообразни събития за Нощ на литература във Варна
Четвъртък, 18 Септември 2025 19:02
Нощ на литературата завладява Варна в предстоящата седмица с богата четиридневна програма от 23 до 26 септември. Срещи с писатели, илюстратори и преводачи, изложби на български и чешки илюстратори с акценти...
| |
 |
 Проучват колко ще струва новогодишният концерт на площада във Варна
Четвъртък, 18 Септември 2025 14:34
Община Варна проучва колко ще й струва ангажирането на фирма с организацията на новогодишния концерт на площад „Независимост“. Това става ясно от обявената процедура за пазарни консултации на сайта на...
| |
 |
 Нов инструмент с изкуствен интелект прогнозира риска от над 1000 заболявания
Четвъртък, 18 Септември 2025 13:21
Учени разработиха нов инструмент с изкуствен интелект (ИИ), който може да предскаже риска от развитие на над 1000 медицински състояния, включително различни видове рак и инфаркти, повече от десет години...
| |
|
Изпрати новина
|
|
|
 |
Полезно |
Препоръчваме |
Най-четени |
Анкета |
|