ZDNET’i takip edin: Bizi tercih edilen bir kaynak olarak ekleyin Google’da.
ZDNet’in temel paketleri
- Antropic’in son modeli Claude Sonnet 4.5 burada.
- Kodlama ölçütlerinde çok puan aldı.
- Claude Kodu da uzun zamandır beklenen yükseltmeler aldı.
Antropic’in kodlama araçları, Mayıs ayında piyasaya sürülen Claude 4 sonnet modeli ile geliştiriciler arasında saygın hale geldi ve birçokları için ücretsiz ve güvenilir bir kodlama asistanı olarak hizmet etti. Sadece aylar sonra Antropic, yönetim kuruldaki performansına yükseltmeler içeren yeni nesil modelini yayınladı.
Ayrıca: Antropic’in Ücretsiz Claude Sonnet 4 kodlama testlerimi kabul etti – ama ücretli opus modeli bir şekilde yapmadı
Claude Sonnet 4.5’in şu anda mevcut olduğunu söyledi Çarşamba günü yaptığı açıklamada, “dünyanın en iyi kodlama modeli” olduğunu ve karmaşık ajanlar oluşturmak, bilgisayarları kullanmak ve akıl yürütme ve matematiksel yetenekler kazanmak için en iyi mannequin olduğunu iddia etti. Antropic ayrıca Claude Code Teklifinde güncellemeler, Chrome Uzantısı için Claude ve daha fazlasını başlattı.
Claude 4.5 sonnet’te yenilikler neler?
Antropik’in sürümlerini yakından takip ediyorsanız, Mayıs ayında, Claude Opus 4 ve Sonnet 4’ün, Github’dan kaynaklanan gerçek savaş yazılım mühendislik görevlerini çözmek için LLMS’nin yeteneklerini değerlendiren endüstri standart yazılım mühendislik kıyaslama testinde (SWE-Bench) en yüksek puan aldığını hatırlayabilirsiniz. Ağustos ayında piyasaya sürülen Claude Opus 4.1 bunu aştı.
Şimdi, Claude Sonnet 4.5, SWE-Bench’in insan filtrelenmiş bir alt kümesi olan SWE-Bench Doğrulanmış Değerlendirme üzerinde daha iyi performans göstererek son modeli alıştı. Claude Sonnet 4.5 ayrıca GPT-5 Codex, GPT-5 ve Gemini 2.5 Professional dahil olmak üzere rakiplerden önde gelen modellerden daha iyi performans gösterdi.
Antropic, Swe-Bench’in doğrulandığını, Sonnet 4.5’in karmaşık, çok aşamalı görevlere 30 saatten fazla odaklandığını söyledi. Bu yetenek, çoğu zaman uzun süreler boyunca arka planda solo çalışma gerektiren aracı görevler için özellikle yararlıdır.
Ayrıca: 4 gün içinde 4 gün içinde 200 dolara yaptım ve hala hayrete düştüm
Diğer iyileştirmeler, AI modellerinin gerçek dünyadaki bilgisayar görevlerindeki performansını check eden Osworld ölçütündeki puanıyla belirtildiği gibi bilgisayarlardaki performansını içerir:
“Sonnet 4.5 şimdipercent61.4’e liderlik ediyor. Sadece dört ay önce Sonnet 4,%42.2 öne geçti.”
Geçen ay bekleme listesine katılan herkese sunulan Chrome Uzantısı için Claude, bu yetenekleri kullanıyor. Antropik ayrıca matematik ve akıl yürütme konusunda gelişmeler gördü.
Ayrıca: büyük bir hatayı çözmek için iki AI aracı takım kurdum – ama bensiz yapamadılar
Şirkete göre Claude Sonnet 4.5 ayrıca Antropic’in “en hizalanmış” sınır modeli. Bu, insanların talimatlarına ve amaçlanan kullanım durumlarına en yakından bağlı olan ve sycophancy ve aldatma gibi davranış örneklerini azaltan mannequin olduğu anlamına gelir. Mannequin ayrıca hızlı enjeksiyon saldırılarına direnmede daha iyidir ve Antropic’in mannequin çerçevesinde AI Güvenlik Seviyesi 3 (ASL-3) korumalarına sahiptir.
Nasıl erişilir
Claude Sonnet 4.5, claude.ai chatbot da dahil olmak üzere her yerde mevcuttur. Tabii ki, geliştiriciler ve profesyoneller yeni modele API ve Claude kodundaki ve Sonnet 4 ile aynı fiyata erişebilirler.
Diğer yükseltmeler
Antropic ayrıca, kullanıcıların ilerlemeyi kaydetmesine ve önceki bir durumu tekrar ziyaret etmesine izin veren kontrol noktalarına sahip olan Claude Code ile başlayarak diğer kodlama tekliflerini de yükseltti. Ayrıca Antropic’in “yenilenmiş” bir terminal arayüzü ve yerel vs kod uzantısı olarak adlandırdığı şey var.
Ayrıca: Openai, Antropik, Meta ve Google Sayı Ortak AI Güvenlik Uyarısı’ndan araştırmacılar – işte neden
Antropic ayrıca, Claude kodunu güçlendiren ve geliştiricilerin kendi ajanlarını onunla oluşturmalarına izin veren aynı altyapı olan Claude Agent SDK’yı başlattı.
Claude Code API, şirkete göre yeni bir bağlam düzenleme özelliği ve ajanların daha verimli çalışmasını ve daha karmaşık sorunlarla mücadele etmelerini sağlayan bir bellek aracı sundu. Şirket ayrıca CLAUDE uygulamalarını yükseltti, böylece kod yürütebilir ve sohbette dosya oluşturabilirler.