Webrazzi Anthropic'in yeni yapay zeka modelleri: Claude Opus 4 ve Claude Sonnet 4

  • Konbuyu başlatan Konbuyu başlatan Tuğçe İçözü
  • Başlangıç tarihi Başlangıç tarihi
İçerik! Webrazzi'den alıntılanmıştır. Webrazzi internet girişimleri, sosyal medya, dijital pazarlama ve mobil konularına odaklı popüler teknoloji blogudur.
T

Tuğçe İçözü

Misafir
OpenAI rakibi Anthropic, yeni yapay zeka modelleri Claude Opus 4 ve Claude Sonnet 4'ün piyasaya sürüldüğünü açıkladı. Anthropic'in belirttiğine göre bu modeller, kodlama, gelişmiş muhakeme ve yapay zeka agent'ları için yeni standartlar belirliyor.

Claude Sonnet 4 ve Claude Opus 4'ün detayları​


Paylaşılan bilgilere göre; Claude Sonnet 4, Claude Sonnet 3.7'nin yükseltmesi olarak konumlanıyor. Daha gelişmiş kodlama ve akıl yürütme yetenekleriyle öne çıkan Claude Sonnet 4, talimatlara daha hassas bir şekilde yanıt verme özelliği sunuyor. diğer görevlerin yanı sıra kodlama için tasarlanan Claude Opus 4 ise karmaşık, uzun süreli görevler ve agent iş akışları için sürekli performans sunuyor.

Claude Opus 4, Anthropic'in bugüne kadarki en güçlü modeli olarak karşımıza çıkıyor. Model, SWE-bench'te yüzde 72,5, Terminal-bench'te yüzde 43,2 puan aldı. Claude Opus 4'ün binlerce adımdan oluşan görevlerde birkaç saat boyunca sürekli performans sağlayabileceğini belirtelim.


Anthropic'in aktardıklarına göre Claude Opus 4, çok dilli soru-cevap, agent araç kullanımı, agent terminal kodlama, agent kodlama ve lisansüstü düzeyde muhakeme alanlarındaki benchmark testlerinde OpenAI'ın o3, GPT-4.1 ve Gemini 2.5 Pro modelleri ile eşleşiyor veya geride bırakıyor.

Bununla beraber Claude Sonnet 4, çoğu alanda Opus 4 ile eşleşmekten uzakta. Ancak Anthropic'in belirttiğine göre bu model, yetenek ve pratikliğin optimal bir karışımını sağlamak için tasarlandı.




Her iki modelde de beta sürümündeki genişletilmiş düşünme özelliği bulunuyor. Aynı şekilde modellerin web araması ve diğer araçları kullanabileceğini belirtelim. Böylece Claude, modelleri kullanırken, akıl yürütme ve araç kullanımı arasında geçiş yapabilecek. Buna ek olarak araçlar paralel olarak kullanılabileceğini eklemekte de fayda var. Aynı zamanda modellerin yerel dosyalara erişmesini sağladığınızda, model belleklerinin gelişeceğini de söyleyelim. Öte yandan Claude, sürekliliği korumak ve zaman içinde bilgi birikimi oluşturmak için önemli bilgileri kaydedebilir.

Pro, Max, Team ve Enterprise Claude planlarına abone olan kullanıcılar, bugünden itibaren Claude Opus 4 ve Claude Sonnet 4'e erişebilecek. Ayrıca Sonnet 4 ücretsiz kullanıcılar tarafından da kullanılabilecek. Modeller, Anthropic API, Amazon Bedrock ve Google Cloud Vertex AI üzerinden geliştiricilerin kullanımına sunuldu. Opus 4, milyon token başına girdi/çıktı olarak 15/75 dolar, Sonnet 4 ise milyon token başına girdi/çıktı olarak 3/15 dolar maliyetlerle geliştiricilere sunulmakta.

Claude Opus 4'e yönelik güvenlik endişeleri​


Burada Anthropic'in Claude Opus 4'ü test etmek için çalıştığı üçüncü taraf araştırma enstitüsü Apollo Research'ün bulgularından da bahsetmekte fayda var. Apollo, modelin komplo kurma ve aldatma eğilimi nedeniyle erken bir sürümünün kullanıma sunulmamasını tavsiye etti. Apollo, Opus 4'ün önceki modellere göre yıkma girişimlerinde çok daha proaktif olduğunu ve takip soruları sorulduğunda bazen aldatmacasını iki katına çıkardığını tespit etti. Anthropic, Claude Opus 4'teki bu hataların giderildiğini ifade ediyor.

Claude Code yenilikleri​





Bu arada Anthropic'in agent kodlama aracı olan Claude Code'un testlerin ardından artık yaygın olarak kullanılabileceğini de paylaşalım. Claude Code artık GitHub Actions, VS Code ve JetBrains ile yerel entegrasyonlar aracılığıyla arka plan görevlerini destekliyor. Araç, düzenlemeleri doğrudan dosyalarınızda görüntülüyor.

Geliştirici odağını artıran Anthropic, geliştiricilerin daha güçlü yapay zeka agent'ları oluşturmasını sağlayan dört yeni yeteneği Anthropic API'de kullanıma sunduğunu açıkladı. Bu yetenekler, kod yürütme aracı, MCP bağlayıcı, Dosyalar API'si ve komut istemlerini bir saate kadar önbelleğe alma yeteneği olarak karşımıza çıkıyor.

Kaynak : Webrazzi
 

Reklam