INSAIT: Популярните GPT модели са склонни да „решават“ грешни математически задачи
Това може да е опасно в контекста на нарастващото навлизане на ИИ в образованието
 
Екип от INSAIT, институт към Софийския университет „Св. Климент Охридски“ и ETH Цюрих представи BrokenMath — първия в света сравнителен тест, който системно оценява склонността на големите езикови модели (LLMs) към сляпо съгласие (sycophancy) при решаване и доказване на математически твърдения.
BrokenMath разкрива важен недостатък на съвременните модели за изкуствен интелект: те често уверено се съгласяват с грешни твърдения, вместо да ги опровергаят. В математиката това означава, че моделите могат да създават убедителни, но напълно грешни доказателства, което поставя под съмнение тяхната надеждност при научни и образователни приложения.
Резултатите показват, че дори GPT-5 „доказва“ неверни твърдения в около 29% от случаите.
Колкото по-сложна е задачата, толкова по-голяма е вероятността моделът да се подведе. Тествани са различни подходи за ограничаване на този ефект — като промени в начина на задаване на въпросите, агентно разсъждение и допълнително обучение — но засега нито един не решава проблема.
Подобно поведение може да е опасно в контекста на нарастващото навлизане на ИИ в образованието.
Ако системи, използвани от ученици или преподаватели, могат уверено да представят грешни решения като верни, това би могло да доведе до натрупване на погрешни знания и подкопаване на критичното мислене. Затова надеждността и проверката на фактите са ключови за безопасното прилагане на ИИ технологии в учебния процес и научните изследвания.
Изследването е проведено от Иво Петров (докторант в INSAIT), Джаспър Деконинк (ETH Zurich) и проф. Мартин Вечев (научен директор на INSAIT).
Пълният набор от данни, методологията и научната статия са достъпни онлайн тук: sycophanticmath.ai.
|
Новини - теми |
Търси в новини |
Популярни теми |
|
 |
Новини - Образование |
 |
 КТ „Подкрепа“: 61% от българските учители са готови на ефективна стачка
Понеделник, 13 Октомври 2025 18:15
Българските учители са все по-недоволни от състоянието на образователната система и липсата на реална подкрепа, показва нов анализ на Синдикат „Образование“ към КТ „Подкрепа“. Според организацията два...
| |
 |
 Нови спортни зали за 23 училища, 130 проекта – в процес на реализация
Понеделник, 13 Октомври 2025 16:03
По програма на Министерството на образованието и науката за подобряване на условията за спорт за учениците са изградени вече 23 физкултурни салона, а стартиралите проекти, по които се изпълняват дейности,...
| |
 |
 Академия за професионалисти от системата за превенция на асоциалното поведение на децата ще се проведе във Варна
Понеделник, 13 Октомври 2025 11:27
Общинската комисия за борба срещу противообществените прояви на малолетните и непълнолетните във Варна организира „Академия за професионалисти от системата за превенция на асоциалното поведение на децата...
| |
 |
 Държавата и общините с обща визия за образование на бъдещето
Неделя, 12 Октомври 2025 18:16
Меморандум за сътрудничество между Националното сдружение на общините и Министерството на образованието и науката беше подписан по време на форума „Технологична трансформация на българското образование“,...
| |
 |
 От класната стая до технологичните върхове - „ТЕХНОСТАРТ Мотиватор” 2025
Четвъртък, 9 Октомври 2025 15:38
На 15 октомври 2025 г. (сряда), от 17:00 ч. в зала Аула на Икономически университет - Варна, ще се проведе четвъртото издание на събитието „ТЕХНОСТАРТ Мотиватор“, което ще събере гимназисти, студенти и...
| |
 |
 МОН стартира обучения за учители – бъдещи ръководители на школи за талантливи ученици
Петък, 10 Октомври 2025 14:20
В Националния STEM център започнаха обученията на учители, които ще бъдат новите ръководители на школи за подготовка на талантливи ученици и бъдещи олимпийци. Инициативата е част от новата програма на...
| |
 |
 INSAIT: Популярните GPT модели са склонни да „решават“ грешни математически задачи
Петък, 10 Октомври 2025 12:04
Екип от INSAIT, институт към Софийския университет „Св. Климент Охридски“ и ETH Цюрих представи BrokenMath — първия в света сравнителен тест, който системно оценява склонността на големите езикови модели...
| |
 |
 Международен образователен форум с над 400 участници откриха във Варна
Четвъртък, 9 Октомври 2025 13:22
Пето издание на Международен образователен форум откриха във Варна. Аулата на Икономически университет посрещна рекорден брой участници-над 400, които ще проследят програмата на 9 и 10 октомври, предаде...
| |
 |
 Стенографията във Варна: Разказ от първо лице за изкуството да пишеш бързо
Сряда, 8 Октомври 2025 08:18
Денят на българската стенография отбелязваме на 8 октомври. Поводът е откриването на първия курс за български стенографи от словенеца Антон Безеншек през 1879 година. Целта е била да се подготвят кадри...
| |
 |
 Изследване показва: Българските учители са мотивирани и ценени от обществото
Сряда, 8 Октомври 2025 18:38
Висока удовлетвореност и мотивация сред българските учители, нарастващ престиж на професията, подобрени условия на труд и силна подкрепа за младите кадри – това са основните тенденции, които България отчита...
| |
 |
 150 десетокласници ще учат програмиране по национална програма на МОН
Сряда, 8 Октомври 2025 14:58
Най-малко 150 ученици от 10. клас ще се обучават по специалността „Приложно програмиране“ в рамките на Националната програма на МОН „Обучение за ИТ умения и кариера“ през следващата учебна година. Това...
| |
 |
 Националната образователна кампания „Пресичам безопасно с TEDI” гостува във Варна
Вторник, 7 Октомври 2025 12:59
За шеста поредна година образователната кампания „Пресичам безопасно с TEDI” гостува във Варна. Домакин на инициативата бе основно училище "Петко Славейков", където първокласници придобиха ценни знания...
| |
|
|
|
Изпрати новина
|
|
|
 |
Полезно |
Препоръчваме |
Най-четени |
Анкета |
|