Hoş Geldin, Ziyaretçi!

Üye girişi yapmayı ihmal etmeyin ! Konulara cevap yazmak, kaynak dosyalarını iletmek ve yeni konu açabilmek için üye girişi yapmanız gerekir. Üye kayıtları aktif !

Webrazzi Mistral'in kod yazımı görevlerine odaklanan büyük dil modeli: Codestral

  • Konbuyu başlatan Tuğçe İçözü
  • Başlangıç tarihi
İçerik! Webrazzi'den alıntılanmıştır. Webrazzi internet girişimleri, sosyal medya, dijital pazarlama ve mobil konularına odaklı popüler teknoloji blogudur.
T

Tuğçe İçözü

Misafir
Avrupa merkezli yapay zeka şirketi Mistral, ilk kod merkezli büyük dil modeli (LLM) Codestral'i duyurdu. Codestral, kod üretiminden kod tamamlanmaya kadar kod yazımı görevlerine odaklanıyor. 22 milyar parametreye sahip Codestral, ağırlıklı olarak açık bir üretken yapay zeka modeli olarak karşımıza çıkıyor.

Mistral, Codestral'i ticari olmayan bir lisans altında bugün kullanıma sundu. Mistral'in paylaştığı bilgilere göre, model 80'den fazla programlama dilinde uzmanlaştı. Bu diller arasında SQL, Python, Java, C ve C++ gibi popüler dillerin yanı sıra Swift ve Fortran gibi daha spesifik diller bulunmakta.

Codestral 22B, 32 bin token'lık bağlam penceresine sahip. Model geliştiricilerin hem çeşitli kodlama ortamlarında hem de projelerinde kod yazmasını ve kodla etkileşim kurmasını sağlıyor. Modelin yerine getirebildiği görevler arasında sıfırdan kod oluşturma, kod yazma işlevlerini tamamlama, test yazma ve ortadaki doldurma mekanizmasını kullanarak herhangi bir kısmi kodu tamamlama yer alıyor. Geliştiriciler, projelerini seviyenelendirmek, hata ve bug riskini azaltmak için Codestral'den yararlanabilir.

Bununla beraber paylaşılan bilgilere göre, Codestral, Meta'ya ait CodeLlama 70B ve DeepSeek AI'ın Deepseek Coder 33B'si gibi kod yazma görevleri için tasarlanan önceki modellerden daha iyi performans gösteriyor. Modelin RepoBench'te yüzde 34 doğruluk puanıyla CodeLlama 70B, Deepseek Coder 33B, and Llama 3 70B'dendaha iyi performans gösterdiği görülüyor. Aynı şekilde, Python kod üretimini değerlendirmek için HumanEval ve Python çıktı tahminini test etmek için CruxEval'de, model sırasıyla yüzde 81,1 ve yüzde 51,3 puanlarla rakiplerini geride bıraktı. Üstelik Codestral 22B, Bash, Java ve PHP için HumanEval'deki modellerden daha iyi performans gösterdi.


Geliştiriciler Hugging Face üzerinde Codestral 22B'yi deneyebilir. Ayrıca codestral.mistral.ai ve api.mistral.ai üzerinden de modele ulaşılabilir. Bunlara ek olarak Mistral'in ücretsiz konuşma arayüzü olan Le Chat'te modelin özel olarak çeşitli talimatlarla eğitilmiş bir versiyonuyla sohbet edebileceğini de belirtelim. Modeli kullanan endüstri ortaklarına baktığımızda ise SourceGraph, LlamaIndex, LangChain, Continue.dev, Tabnine ve JetBrains gibi isimleri görmekteyiz.

Kaynak : Webrazzi
 

Reklam

  AdBlock Detected
Sure, ad-blocking software does a great job at blocking ads, but it also blocks some useful and important features of our website. For the best possible site experience please take a moment to disable your AdBlocker.