Anthropic kompaniyasi o‘zining yangi flagman modeli — Claude Sonnet 4.5‘ni taqdim etdi. U dasturlash, mustaqil sunʼiy intellekt agentlarini yaratish va murakkab hisob-kitoblarni yechishda yuqori natijalarga erishmoqda. Kompaniyaning taʼkidlashicha, bugungi kunda ushbu model dasturlash uchun “dunyodagi eng kuchli” vosita hisoblanadi.

Image credit: anthropic.com

Ichki sinovlar davomida Sonnet 4.5 inson aralashuvisiz, uzluksiz 30 soatdan ortiq vaqt davomida ko‘p bosqichli vazifalarni muvaffaqiyatli bajara olgan. Eʼtiborli jihati, demonstratsiyalardan birida u 11 mingga yaqin kod satrini yozib, mashhur “Slack” messenjeriga o‘xshash ilova loyihasini to‘liq yakunlagan.

Ish samaradorligi va yangi imkoniyatlar

Sonnet 4.5 muhandislik sinovlarida (benchmarklarda) yuqori natijalarni qayd etdi:

  • SWE-bench Verified: Dasturiy taʼminotdagi haqiqiy xatolarni tuzatish sinovida 77,2% samaradorlik ko‘rsatib, yetakchi o‘rinni egalladi.
  • OSWorld: Kompyuterni boshqarish va vazifalarni bajarish sinovida 61,4% natijaga erishdi, bu to‘rt oy avvalgi Sonnet 4 ko‘rsatkichidan (42,2%) sezilarli darajada yuqoridir.

Anthropic dasturchilar uchun yangi imkoniyatlarni ham taqdim etdi. Claude Agent SDK to‘plami mustaqil agent tizimlarini yaratish va Claude ilovalarining funksiyalarini kengaytirishga yo‘l ochdi. Endi model nafaqat kod yozadi, balki uni bajara oladi, kerakli fayllarni (masalan, jadval va taqdimotlarni) yarata oladi. Bunday keng imkoniyatlarga qaramay, narxlar avvalgi avlod darajasida saqlanib qoldi: 1 million token (taxminan 750 ming so‘z) uchun 3–15 dollar.

Dasturchilar uchun yana bir qulaylik — Claude Code muhitiga kodning avvalgi holatiga tez qaytish imkonini beruvchi nazorat nuqtalari qo‘shildi, terminal qayta ishlandi va VS Code uchun maxsus kengaytma chiqarildi.

Hamkorlarning yuqori bahosi va yirik platformalarga integratsiya

Yangi model taqdim etilgan kuniyoq Amazon Bedrock va Google Vertex AI kabi yirik bulutli platformalarda foydalanishga topshirildi. GitHub esa Sonnet 4.5‘ni o‘zining Copilot xizmatidagi Pro, Pro+, Business va Enterprise tariflariga joriy etishni boshladi.

Dastlabki hamkorlar model haqida ijobiy fikr bildirmoqda:

  • Cursor rahbari Maykl Truell: “Biz kodlashda eng ilg‘or natijalarni va uzoq muddatli vazifalarda sezilarli o‘sishni kuzatmoqdamiz”.
  • Devin jamoasining maʼlum qilishicha, yangi model yordamida rejalashtirish samaradorligi 18% ga, vazifalarni bajarishning umumiy natijasi esa 12% ga oshgan.

Xavfsizlik va barqarorlik

Anthropic‘ga ko‘ra, Sonnet 4.5 ularning “eng muvozanatli” modelidir. Unda xushomadgo‘ylik, aldov va “hokimiyatga intilish” kabi salbiy moyilliklar kamaytirilgan. Shuningdek, prompt-inyeksiyalar (buyruqlar orqali aldash) va kompyuter resurslaridan noqonuniy foydalanish xavflariga qarshi himoya kuchaytirilgan. Model AI Safety Level 3 xavfsizlik darajasi doirasida chiqarilgan.

Xulosa qilib aytganda, Claude Sonnet 4.5 — bu nafaqat benchmarklardagi raqamlar, balki sunʼiy intellektni ish jarayonining haqiqiy ishtirokchisiga aylantirish yo‘lidagi jiddiy qadamdir. U uzoq muddatli loyihalarni nazorat qilish, kodni tahrirlash, hisobotlar tayyorlash va ofis dasturlarini boshqarishga qodir aqlli yordamchi sifatida maydonga chiqmoqda.

Fikr bildirish

Email manzilingiz chop etilmaydi. Majburiy bandlar * bilan belgilangan