Webrazzi Microsoft, küçük dil modeli Phi-4’ü Hugging Face'te açık kaynaklı hale getirdi

  • Konbuyu başlatan Konbuyu başlatan Gözde Ulukan
  • Başlangıç tarihi Başlangıç tarihi
İçerik! Webrazzi'den alıntılanmıştır. Webrazzi internet girişimleri, sosyal medya, dijital pazarlama ve mobil konularına odaklı popüler teknoloji blogudur.
G

Gözde Ulukan

Misafir
Microsoft, küçük dil modeli Phi-4'ü tamamen açık kaynak olarak yayınladığını duyurdu. Böylelikle model, Hugging Face platformunda indirilebilir hale geldi.

Phi-4, Microsoft'un 2023 yılında tanıttığı küçük dil modelleri serisinin dördüncü versiyonu. 14 milyar parametreye sahip olan model, matematiksel akıl yürütme, çok görevli dil anlama ve işlevsel kod oluşturma gibi alanlarda, boyut olarak daha büyük rakiplerini geride bırakıyor. Örneğin; Google'ın Gemini Pro ve GPT-4o-mini gibi daha büyük modellerini zorlayıcı MATH ve MGSM benchmark testlerinde yüzde 80'in üzerinde bir başarıyla geçtiği belirtildi.

Model, yoğun ve yalnızca kod çözücü (decoder-only) bir transformer mimarisi üzerine kurulu. Bu yaklaşım, hesaplama maliyetlerini düşürerek daha verimli bir yapı sağlıyor. Phi-4, 9,8 trilyon token üzerinde, matematik, kodlama ve mantık tabanlı verilerden oluşan yüksek kaliteli veri kümeleriyle eğitildi. Ayrıca, yüzde 8 oranında çok dilli içerik kullanılarak İngilizce dışındaki uygulamalara da sınırlı bir destek sunuyor.

Phi-4, ilk olarak Aralık 2024’te Microsoft'un Azure AI Foundry platformunda araştırma lisansıyla kullanıma sunulmuştu. Ancak bu erişim sınırlıydı. Şimdi, model Hugging Face üzerinden MIT lisansı ile herkese açık hale getirildi. Bu lisans, modelin ticari projelerde de serbestçe kullanılabilmesine olanak tanıyor.

Modelin ağırlıklarının paylaşılması, diğer araştırmacıların ve geliştiricilerin modeli özelleştirip farklı projelere adapte edebilmesini sağlıyor. Microsoft, bu hamleyle yapay zeka alanında şeffaflığı ve inovasyonu desteklemeyi hedefliyor.

Kaynak : Webrazzi
 

Reklam