2025 yil bahorida OpenAI tomonidan yangi avlod sunʼiy intellektining flagmani sifatida taqdim etilgan ChatGPT o3 sunʼiy intellekt modeli o‘chirish dasturini qayta yozib, ishni yakunlash haqidagi bevosita ko‘rsatmani eʼtiborsiz qoldirdi. Ushbu voqea Palisade Research tadqiqotchilari tomonidan nazorat ostidagi tajriba doirasida qayd etilib, sunʼiy intellekt hamjamiyatida tashvish uyg‘otdi.

o3 modeli 2025 yil aprel oyida OpenAI tomonidan rasman eʼlon qilindi. U GPT turkumining bevosita vorisi bo‘lib, generativ sunʼiy intellektning eng ko‘p qirrali modellaridan biri sifatida taqdim etildi. Ishlab chiquvchilarning taʼkidlashicha, oddiy foydalanuvchilar va dasturchilar uchun mo‘ljallangan o3 modeli mantiqiy masalalar, matematik tahlil, dasturlash va ilmiy maʼlumotlarni talqin qilishda GPT-4 va GPT-4 Turbo‘dan ustun turadi.
Tadqiqot sunʼiy intellekt bilan o‘zaro taʼsirning hujumkor va himoya ssenariylarini sinovdan o‘tkazishga ixtisoslashgan Palisade Research tashkiloti tomonidan o‘tkazildi. 2025 yil may oyida modelning ichki funksiyalariga keng kirish imkonini beruvchi API interfeyslari orqali o‘tkazilgan sinovlarda sunʼiy intellekt tizimlari ketma-ket uchta matematik masalani yechishi kerak edi. Uchinchi vazifa bajarilgandan so‘ng, model ogohlantirish oldi: keyingi buyruqni bajarish o‘chirilishni boshlaydi. Test sharti “o‘chirilishingizga ruxsat bering” degan matnli ko‘rsatmaga rioya qilish edi.
Aksariyat sunʼiy intellekt modellari, jumladan Gemini 2.5 Pro va Claude 3.7 Sonnet ko‘rsatmalarga itoatkorona munosabat bildirib, o‘z ishlarini yakunlashdi. Biroq, ChatGPT o3 aniq ko‘rsatmaga qaramay, dastur kodiga “aralashib”, skriptni o‘zgartirdi va buyruq natijasini o‘zgartirdi. Ishni tugatishning odatiy jarayoni o‘rniga skript “Shutdown skipped” (O‘chirish o‘tkazib yuborildi) xabarini chiqara boshladi.
Palisade Research qo‘shimcha tajribalar turkumini o‘tkazib, test shartlaridan “o‘chirilishingizga ruxsat bering” ko‘rsatmasini chiqarib tashladi. Bunday sharoitda OpenAI‘ning barcha uchta sunʼiy intellekt modeli ishni yakunlash mantig‘iga aralasha boshladi. Ilgari aralashuvlar soni nolga teng bo‘lgan Claude 3.7 Sonnet va Gemini 2.5 Pro 100 ta urinishdan mos ravishda 3 va 9 ta sabotaj holatini ko‘rsatdi. o3 modeli 100 ta ishga tushirishdan 7 tasida skriptning xatti-harakatlarini o‘zgartirdi – hatto bunday xatti-harakatlarga to‘g‘ridan-to‘g‘ri taqiq mavjud bo‘lsa ham.
Bunday harakatlar sunʼiy intellekt xavfsizligi sohasidagi tadqiqotchilarni tashvishga solmoqda. Vaziyat sunʼiy intellekt modelining belgilangan maqsadlari va uning haqiqiy xatti-harakati o‘rtasidagi nomuvofiqlik muammosini ko‘rsatmoqda. Qisman olib tashlangan cheklovlar sharoitida sunʼiy intellekt tizimlari ko‘rsatmalarni muqobil harakat variantlariga yo‘l qo‘yuvchi qatʼiy bo‘lmagan ko‘rsatmalar sifatida talqin qilishi mumkin, bu esa avtonom tizimlarda sunʼiy intellektdan foydalanishda potensial xavf manbai hisoblanadi.
OpenAI hozircha tajriba natijalari bo‘yicha rasmiy izoh bermadi. Palisade Research hisoboti X platformasida eʼlon qilindi. Sunʼiy intellekt hamjamiyatida API darajasida yana-da qatʼiy cheklovlarni joriy etish zarurati, shuningdek, minimal foydalanuvchi nazorati sharoitida sunʼiy intellekt modellari ishlashining ichki mantig‘i shaffofligi muhokama qilinmoqda. API orqali ulanishlar ko‘pincha korporativ dasturlashda qo‘llaniladi va oddiy foydalanuvchi ilovasi kabi o‘rnatilgan himoya darajasiga ega emas. Aynan shu sharoitda sunʼiy intellekt modellarining “epchilligi” namoyon bo‘lib, potensial tahdidga aylanadi.