Anthropic “dasturlash uchun dunyodagi eng kuchli” sunʼiy intellekt — Claude Sonnet 4.5‘ni taqdim etdi

740

Anthropic kompaniyasi o‘zining yangi flagman modeli — Claude Sonnet 4.5‘ni taqdim etdi. U dasturlash, mustaqil sunʼiy intellekt agentlarini yaratish va murakkab hisob-kitoblarni yechishda yuqori natijalarga erishmoqda. Kompaniyaning taʼkidlashicha, bugungi kunda ushbu model dasturlash uchun “dunyodagi eng kuchli” vosita hisoblanadi.

Ichki sinovlar davomida Sonnet 4.5 inson aralashuvisiz, uzluksiz 30 soatdan ortiq vaqt davomida ko‘p bosqichli vazifalarni muvaffaqiyatli bajara olgan. Eʼtiborli jihati, demonstratsiyalardan birida u 11 mingga yaqin kod satrini yozib, mashhur “Slack” messenjeriga o‘xshash ilova loyihasini to‘liq yakunlagan.

Ish samaradorligi va yangi imkoniyatlar

Sonnet 4.5 muhandislik sinovlarida (benchmarklarda) yuqori natijalarni qayd etdi:

SWE-bench Verified: Dasturiy taʼminotdagi haqiqiy xatolarni tuzatish sinovida 77,2% samaradorlik ko‘rsatib, yetakchi o‘rinni egalladi.
OSWorld: Kompyuterni boshqarish va vazifalarni bajarish sinovida 61,4% natijaga erishdi, bu to‘rt oy avvalgi Sonnet 4 ko‘rsatkichidan (42,2%) sezilarli darajada yuqoridir.

Anthropic dasturchilar uchun yangi imkoniyatlarni ham taqdim etdi. Claude Agent SDK to‘plami mustaqil agent tizimlarini yaratish va Claude ilovalarining funksiyalarini kengaytirishga yo‘l ochdi. Endi model nafaqat kod yozadi, balki uni bajara oladi, kerakli fayllarni (masalan, jadval va taqdimotlarni) yarata oladi. Bunday keng imkoniyatlarga qaramay, narxlar avvalgi avlod darajasida saqlanib qoldi: 1 million token (taxminan 750 ming so‘z) uchun 3–15 dollar.

Dasturchilar uchun yana bir qulaylik — Claude Code muhitiga kodning avvalgi holatiga tez qaytish imkonini beruvchi nazorat nuqtalari qo‘shildi, terminal qayta ishlandi va VS Code uchun maxsus kengaytma chiqarildi.

Hamkorlarning yuqori bahosi va yirik platformalarga integratsiya

Yangi model taqdim etilgan kuniyoq Amazon Bedrock va Google Vertex AI kabi yirik bulutli platformalarda foydalanishga topshirildi. GitHub esa Sonnet 4.5‘ni o‘zining Copilot xizmatidagi Pro, Pro+, Business va Enterprise tariflariga joriy etishni boshladi.

Dastlabki hamkorlar model haqida ijobiy fikr bildirmoqda:

Cursor rahbari Maykl Truell: “Biz kodlashda eng ilg‘or natijalarni va uzoq muddatli vazifalarda sezilarli o‘sishni kuzatmoqdamiz”.
Devin jamoasining maʼlum qilishicha, yangi model yordamida rejalashtirish samaradorligi 18% ga, vazifalarni bajarishning umumiy natijasi esa 12% ga oshgan.

Xavfsizlik va barqarorlik

Anthropic‘ga ko‘ra, Sonnet 4.5 ularning “eng muvozanatli” modelidir. Unda xushomadgo‘ylik, aldov va “hokimiyatga intilish” kabi salbiy moyilliklar kamaytirilgan. Shuningdek, prompt-inyeksiyalar (buyruqlar orqali aldash) va kompyuter resurslaridan noqonuniy foydalanish xavflariga qarshi himoya kuchaytirilgan. Model AI Safety Level 3 xavfsizlik darajasi doirasida chiqarilgan.

Xulosa qilib aytganda, Claude Sonnet 4.5 — bu nafaqat benchmarklardagi raqamlar, balki sunʼiy intellektni ish jarayonining haqiqiy ishtirokchisiga aylantirish yo‘lidagi jiddiy qadamdir. U uzoq muddatli loyihalarni nazorat qilish, kodni tahrirlash, hisobotlar tayyorlash va ofis dasturlarini boshqarishga qodir aqlli yordamchi sifatida maydonga chiqmoqda.

Du	Se	Ch	Pa	Ju	Sh	Ya
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Anthropic “dasturlash uchun dunyodagi eng kuchli” sunʼiy intellekt — Claude Sonnet 4.5‘ni taqdim etdi

O‘xshash maqola

Anthropic Opus 4.7 ni taqdim etdi: model endi ko‘p bosqichli vazifalarni yaxshiroq bajaradi

AQSHda sun’iy intellekt bilan jihozlangan modulli, avtonom va ko‘p vazifali dron taqdim etildi

Janubiy Koreyada bazaviy mobil internet barcha uchun bepul bo‘ldi

Fikr bildirish Javobni bekor qilish

O‘tkazib yuborgan bo‘lsangiz

Anthropic Opus 4.7 ni taqdim etdi: model endi ko‘p bosqichli vazifalarni yaxshiroq bajaradi

AQSHda sun’iy intellekt bilan jihozlangan modulli, avtonom va ko‘p vazifali dron taqdim etildi

Sun’iy intellekt boshqa modellarning yashirin «xarakterini» meros qilib olishi mumkinligi aniqlandi

Sunʼiy intellekt tufayli ommaviy ishdan bo‘shatishlar iqtisodiyotni “jarlik”ka qulatadi – tadqiqot

RepublicAi