Międzynarodowy zespół 30 matematyków przygotował test, którego trudność naukowiec porównuje do pracy doktorskiej.
Kombinatoryka, topologia, teoria liczb. Rzeczy, które wielu ludziom często nic nie mówią. Każde z tych zagadnień dotyczy rzeczy, z którymi my się spotykamy, czyli zarządzanie ruchem, transport, wysyłanie informacji przez nasze telefony, bezpieczeństwo
- tłumaczy dr Naskręcki.
Najlepszy model sztucznej inteligencji (o4-mini OpenAI) rozwiązał 3 z 48 zadań. Większość nie poradziła sobie z żadnym problemem o największej trudności.
Zdaniem doktora Bartosza Naskręckiego, taki wynik pokazuje, że człowiek nie zostanie szybko zastąpiony przez AI.
Jeżeli dochodzimy do naprawdę trudnych problemów, nie tylko zagadek sportowych, ale prawdziwych problemów naukowych, to okazuje się, że AI w pewnym sensie nie potrafi często planować, wpadać na pomysł, wymyślać nowych koncepcji, łączyć abstrakcji ze sobą
- zauważa.
Test jest dostępny na stronie internetowej projektu. Każdy model sztucznej inteligencji można poddać próbie. Na portalu znajduje się też wykres pokazujący jak algorytymy poradziły sobie z zadaniami.