Apple mavjud sunʼiy intellekt modellarining fikrlash qobiliyatiga shubha bildirmoqda

570

Apple yetakchi sunʼiy intellekt modellarining mantiqiy fikrlash qobiliyatini shubha ostiga oldi. Kompaniyaning Machine Learning Research saytida eʼlon qilingan tadqiqotda OpenAI, DeepSeek, Anthropic va Google modellari sinovdan o‘tkazildi. Natijalar murakkab masalalarni yechishda bu tizimlarning aniqligi keskin pasayib ketganini ko‘rsatmoqda.

Tajribada OpenAI‘ning o1 va o3, DeepSeek‘ning R1, Anthropic‘ning Claude 3.7 Sonnet va Google‘ning Gemini modellari tekshirildi. Modellarning har biriga to‘rtta klassik mantiqiy masala taklif etildi: daryodan o‘tish, shashka ustidan sakrash, bloklarni joylashtirish va Xanoy minorasi.

Natijalar kutilmagan bo‘ldi. Oddiy masalalarda mulohaza yuritish qobiliyatiga ega ilg‘or modellar odatdagi katta til modellaridan past natija ko‘rsatdi. O‘rtacha murakkablikdagi masalalarda ulardan ustun keldi, ammo haqiqatan ham murakkab boshqotirmalarga o‘tganda esa aniqlik deyarli nolga tushib ketdi.

Hatto, masalan, Xanoy minorasi uchun bosqichma-bosqich yechim algoritmlari taqdim etilganda ham, sifat yaxshilanmadi. Bundan tashqari, modellar o‘zlarini noizchil tutishdi: bir vazifada 100 tagacha to‘g‘ri yurish qilishlari mumkin edi, ammo boshqa vazifada dastlabki besh qadamdayoq muvaffaqiyatsizlikka uchrashdi.

Tahlillar shuni ko‘rsatdiki, murakkablik oshgani sain modellar kamroq tokenlardan foydalana boshladi, yaʼni resurslar mavjud bo‘lsa ham, avvalgiga qaraganda kamroq “fikr yurita boshladi”. Bu mulohazalar zanjirini saqlab qolishda fundamental cheklovlar mavjudligini ko‘rsatadi.

Fikrlovchi modellar «fikrlar zanjiri» tamoyili bo‘yicha ishlaydi: ular inson mantig‘iga taqlid qiladi, murakkab vazifalarni ko‘plab bosqichlarga ajratadi va har bir bosqichda o‘z harakatlarini tushuntiradi. Biroq, Apple tadqiqotchilarining fikricha, bu yondashuv “tushunish”ga emas, balki o‘quv maʼlumotlaridan shablonlarni tanib olishga asoslangan.

Apple, shuningdek, sunʼiy intellektni baholashda qabul qilingan yondashuvlarni tanqid qiladi: ularning fikricha, mavjud mezonlar ko‘pincha o‘quv namunalarida uchraydigan vazifalarni o‘z ichiga oladi, bu esa haqiqiy manzarani noto‘g‘ri aks ettiradi.

Ish turli xil fikrlarni keltirib chiqardi. Baʼzilar, sunʼiy intellekt poygasida ortda qolayotgan Apple shu tariqa raqobatchilariga bo‘lgan ishonchga putur yetkazmoqda, deb hisoblaydi. Boshqalar esa qo‘llab-quvvatlaydi.

Masalan, mashinali o‘rganish bo‘yicha ekspert va Gartner guruhining sobiq rahbari Andrey Burkov Xʼdagi postida tadqiqotni sunʼiy intellekt imkoniyatlarini tushunishga qo‘shilgan muhim hissa deb atadi. Uning taʼkidlashicha, hatto eng ilg‘or modellar ham barcha cheklovlari bilan neyron tarmoqlar bo‘lib qolmoqda.

Du	Se	Ch	Pa	Ju	Sh	Ya
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Apple mavjud sunʼiy intellekt modellarining fikrlash qobiliyatiga shubha bildirmoqda

O‘xshash maqola

Anthropic Opus 4.7 ni taqdim etdi: model endi ko‘p bosqichli vazifalarni yaxshiroq bajaradi

AQSHda sun’iy intellekt bilan jihozlangan modulli, avtonom va ko‘p vazifali dron taqdim etildi

Janubiy Koreyada bazaviy mobil internet barcha uchun bepul bo‘ldi

Fikr bildirish Javobni bekor qilish

O‘tkazib yuborgan bo‘lsangiz

Anthropic Opus 4.7 ni taqdim etdi: model endi ko‘p bosqichli vazifalarni yaxshiroq bajaradi

AQSHda sun’iy intellekt bilan jihozlangan modulli, avtonom va ko‘p vazifali dron taqdim etildi

Sun’iy intellekt boshqa modellarning yashirin «xarakterini» meros qilib olishi mumkinligi aniqlandi

Sunʼiy intellekt tufayli ommaviy ishdan bo‘shatishlar iqtisodiyotni “jarlik”ka qulatadi – tadqiqot

RepublicAi