T
Tuğçe İçözü
Misafir
Yakın zamanda açık kaynak olarak yayınlanan Elon Musk'ın yapay zekası Grok, 314 milyar parametreli Uzmanlar Karışımı modeli Grok-1'in temel model ağırlıklarını ve ağ mimarisini içeriyor. Elon Musk'ın OpenAI'a dava açmasıyla birlikte gündemden düşmeyen Elon Musk ve OpenAI sürtüşmesi, konu yapay zeka modelleri olduğunda kendini nasıl gösteriyor?
Grok-1'ın prototipi Grok-0, 33 milyar parametre ile eğitildi. Bu ilk model, standart dil modelleri ile kıyaslandığında Meta ve Microsoft iş birliği ile üretilen LLaMA 2'nin (70B) yeteneklerine yaklaşıyor. Ancak söz konusu model, eğitim için LLaMA 2'nin kullandığı kaynakların yalnızca yarısını kullanıyor.
Grok'un ortaya çıkarılması için Kubernetes, Rust ve JAX tabanlı özel bir eğitim ve çıkarım yığını oluşturuldu. Paylaşılan bilgilere göre Grok-1, Python kod tamamlama görevi HumanEval'da yüzde 63,2 ve multidisipliner çoktan seçmeli sorular sunan MMLU'da yüzde 73 başarı sağladı.
Ayrıca aşağıda paylaşılan tabloda da görüleceği üzere Grok-1, ChatGPT-3.5 ve Inflection-1 dahil olmak üzere kendi hesaplama sınıfındaki diğer modelleri geride bıraktı. Bu hesaplamalar arasında MATH ve GSM8k da yer almakta. Ancak GPT-4 ve Claude'un Grok'ta daha yüksek performans gösterdiğini söylemek mümkün.
Bu değerlendirmelere ek olarak xAI ekibi, hem Grok-1'ı hem de Claude-2 ve GPT-4'u 2023 Macaristan ulusal lise matematik finallerinde derecelendirdiğini aktarıyor. Grok sınavı yüzde 59 ile C alarak geçerken, Claude-2 aynı notu yüzde 55 ile elde etti. Bu esnada GPT-4 yüzde 68 ile B aldı.
Bu arada OpenAI'ın GPT-4 Turbo modeliyle de öne çıktığını belirtelim. GPT-4 Turbo, 128 bin token'lık bağlam penceresine sahip. GPT-4 Turbo'nun bağlam penceresi GPT-4’ün bağlam penceresinin dört katına denk gelmekte.
Grok şu anda yalnızca metin odaklı olarak faaliyet gösteriyor. Araç, görüntülerin veya videoların içeriğini anlayamıyor. İlerleyen dönemde Grok'un multimodal yetenekler ile görme ve ses gibi diğer duyuları da kazanması planlanıyor.
Bu noktada ChatGPT'nin görme, duyma ve konuşma yeteneklerine sahip olduğunu belirtelim. Bununla beraber, Grok ekibi araştırma çalışmaları kapsamında uzun bağlama sahip verileri anlama ve gerektiğinde bu verileri geri getirme özelliğine de odaklanıyor. Ancak bu konuda henüz yeni bir gelişme paylaşılmadı.
Grok-1 isimli üretimsel yapay zeka modelini kullanan Grok'un rakiplerinden en büyük farkı ise X'teki gönderilerden gelen gerçek zamanlı verileri de yanıtlarına dahil edebilmesi. Claude, Gemini ve ChatGPT gibi sohbet robotları, yanıtlarına eğitim verilerinin sınırlarını ve web erişimlerindeki filtreleri yansıtıyor. Oysa Grok, sorgulara yeni manşetlerden oluşan yanıtlar veriyor.
Bu arada Elon Musk'ın, Grok'un özellikle Anthropic'in Claude'u ve Google'ın Bard'ında gördüğümüz politik doğruculuktan yoksun olmasını amaçladığını belirtelim. Bu bağlamda Musk, yapay zekayı politik doğrucu olarak eğitmeyi yalan söylemek için eğitmek ile eş tutmuş ve bunun tehlikesinin ölümcül olacağını dile getirmişti.
Kısaca özetlemek gerekirse, multimodal özellikleri, GPT-4 ve GPT-4 Turbo modelleri ile ChatGPT, Grok'tan önde. Grok'un modeli açık kaynak yayınlaması ise yeni geliştirmelerin yolunu açıyor.
Kaynak : Webrazzi
Grok-0 ve Grok-1
Grok-1'ın prototipi Grok-0, 33 milyar parametre ile eğitildi. Bu ilk model, standart dil modelleri ile kıyaslandığında Meta ve Microsoft iş birliği ile üretilen LLaMA 2'nin (70B) yeteneklerine yaklaşıyor. Ancak söz konusu model, eğitim için LLaMA 2'nin kullandığı kaynakların yalnızca yarısını kullanıyor.
Grok'un ortaya çıkarılması için Kubernetes, Rust ve JAX tabanlı özel bir eğitim ve çıkarım yığını oluşturuldu. Paylaşılan bilgilere göre Grok-1, Python kod tamamlama görevi HumanEval'da yüzde 63,2 ve multidisipliner çoktan seçmeli sorular sunan MMLU'da yüzde 73 başarı sağladı.
Ayrıca aşağıda paylaşılan tabloda da görüleceği üzere Grok-1, ChatGPT-3.5 ve Inflection-1 dahil olmak üzere kendi hesaplama sınıfındaki diğer modelleri geride bıraktı. Bu hesaplamalar arasında MATH ve GSM8k da yer almakta. Ancak GPT-4 ve Claude'un Grok'ta daha yüksek performans gösterdiğini söylemek mümkün.
Bu değerlendirmelere ek olarak xAI ekibi, hem Grok-1'ı hem de Claude-2 ve GPT-4'u 2023 Macaristan ulusal lise matematik finallerinde derecelendirdiğini aktarıyor. Grok sınavı yüzde 59 ile C alarak geçerken, Claude-2 aynı notu yüzde 55 ile elde etti. Bu esnada GPT-4 yüzde 68 ile B aldı.
Bu arada OpenAI'ın GPT-4 Turbo modeliyle de öne çıktığını belirtelim. GPT-4 Turbo, 128 bin token'lık bağlam penceresine sahip. GPT-4 Turbo'nun bağlam penceresi GPT-4’ün bağlam penceresinin dört katına denk gelmekte.
ChatGPT multimodal yetenekleriyle öne çıkıyor
Grok şu anda yalnızca metin odaklı olarak faaliyet gösteriyor. Araç, görüntülerin veya videoların içeriğini anlayamıyor. İlerleyen dönemde Grok'un multimodal yetenekler ile görme ve ses gibi diğer duyuları da kazanması planlanıyor.
Bu noktada ChatGPT'nin görme, duyma ve konuşma yeteneklerine sahip olduğunu belirtelim. Bununla beraber, Grok ekibi araştırma çalışmaları kapsamında uzun bağlama sahip verileri anlama ve gerektiğinde bu verileri geri getirme özelliğine de odaklanıyor. Ancak bu konuda henüz yeni bir gelişme paylaşılmadı.
Grok'un ChatGPT, Claude ve Gemini'dan farkı
Grok-1 isimli üretimsel yapay zeka modelini kullanan Grok'un rakiplerinden en büyük farkı ise X'teki gönderilerden gelen gerçek zamanlı verileri de yanıtlarına dahil edebilmesi. Claude, Gemini ve ChatGPT gibi sohbet robotları, yanıtlarına eğitim verilerinin sınırlarını ve web erişimlerindeki filtreleri yansıtıyor. Oysa Grok, sorgulara yeni manşetlerden oluşan yanıtlar veriyor.
Bu arada Elon Musk'ın, Grok'un özellikle Anthropic'in Claude'u ve Google'ın Bard'ında gördüğümüz politik doğruculuktan yoksun olmasını amaçladığını belirtelim. Bu bağlamda Musk, yapay zekayı politik doğrucu olarak eğitmeyi yalan söylemek için eğitmek ile eş tutmuş ve bunun tehlikesinin ölümcül olacağını dile getirmişti.
Kısaca özetlemek gerekirse, multimodal özellikleri, GPT-4 ve GPT-4 Turbo modelleri ile ChatGPT, Grok'tan önde. Grok'un modeli açık kaynak yayınlaması ise yeni geliştirmelerin yolunu açıyor.
Kaynak : Webrazzi