Apple yetakchi sunʼiy intellekt modellarining mantiqiy fikrlash qobiliyatini shubha ostiga oldi. Kompaniyaning Machine Learning Research saytida eʼlon qilingan tadqiqotda OpenAI, DeepSeek, Anthropic va Google modellari sinovdan o‘tkazildi. Natijalar murakkab masalalarni yechishda bu tizimlarning aniqligi keskin pasayib ketganini ko‘rsatmoqda.

Image credit: pikabu.ru

Tajribada OpenAI‘ning o1 va o3, DeepSeek‘ning R1, Anthropic‘ning Claude 3.7 Sonnet va Google‘ning Gemini modellari tekshirildi. Modellarning har biriga to‘rtta klassik mantiqiy masala taklif etildi: daryodan o‘tish, shashka ustidan sakrash, bloklarni joylashtirish va Xanoy minorasi.

Natijalar kutilmagan bo‘ldi. Oddiy masalalarda mulohaza yuritish qobiliyatiga ega ilg‘or modellar odatdagi katta til modellaridan past natija ko‘rsatdi. O‘rtacha murakkablikdagi masalalarda ulardan ustun keldi, ammo haqiqatan ham murakkab boshqotirmalarga o‘tganda esa aniqlik deyarli nolga tushib ketdi.

Hatto, masalan, Xanoy minorasi uchun bosqichma-bosqich yechim algoritmlari taqdim etilganda ham, sifat yaxshilanmadi. Bundan tashqari, modellar o‘zlarini noizchil tutishdi: bir vazifada 100 tagacha to‘g‘ri yurish qilishlari mumkin edi, ammo boshqa vazifada dastlabki besh qadamdayoq muvaffaqiyatsizlikka uchrashdi.

Tahlillar shuni ko‘rsatdiki, murakkablik oshgani sain modellar kamroq tokenlardan foydalana boshladi, yaʼni resurslar mavjud bo‘lsa ham, avvalgiga qaraganda kamroq “fikr yurita boshladi”. Bu mulohazalar zanjirini saqlab qolishda fundamental cheklovlar mavjudligini ko‘rsatadi.

Fikrlovchi modellar «fikrlar zanjiri» tamoyili bo‘yicha ishlaydi: ular inson mantig‘iga taqlid qiladi, murakkab vazifalarni ko‘plab bosqichlarga ajratadi va har bir bosqichda o‘z harakatlarini tushuntiradi. Biroq, Apple tadqiqotchilarining fikricha, bu yondashuv “tushunish”ga emas, balki o‘quv maʼlumotlaridan shablonlarni tanib olishga asoslangan.

Apple, shuningdek, sunʼiy intellektni baholashda qabul qilingan yondashuvlarni tanqid qiladi: ularning fikricha, mavjud mezonlar ko‘pincha o‘quv namunalarida uchraydigan vazifalarni o‘z ichiga oladi, bu esa haqiqiy manzarani noto‘g‘ri aks ettiradi.

Ish turli xil fikrlarni keltirib chiqardi. Baʼzilar, sunʼiy intellekt poygasida ortda qolayotgan Apple shu tariqa raqobatchilariga bo‘lgan ishonchga putur yetkazmoqda, deb hisoblaydi. Boshqalar esa qo‘llab-quvvatlaydi.

Masalan, mashinali o‘rganish bo‘yicha ekspert va Gartner guruhining sobiq rahbari Andrey Burkov Xʼdagi postida tadqiqotni sunʼiy intellekt imkoniyatlarini tushunishga qo‘shilgan muhim hissa deb atadi. Uning taʼkidlashicha, hatto eng ilg‘or modellar ham barcha cheklovlari bilan neyron tarmoqlar bo‘lib qolmoqda.

Fikr bildirish

Email manzilingiz chop etilmaydi. Majburiy bandlar * bilan belgilangan