T
Tuğçe İçözü
Misafir
Google, dahil olmak üzere yapay zeka öncülerinin radarına giren ve fiziksel dünyayı simüle eden dünya modelleri, Nvidia'nın da yeni odak noktası. Şirket, Cosmos World Foundation Models isimli dünya modelleri ailesini açık bir şekilde kullanıma sunduğunu duyurdu. Bu dünya modelleri ailesi, fiziğe duyarlı videoları tahmin edebiliyor ve üretebiliyor.
Şirket paylaştığı gönderide, fizik tabanlı simülasyon ve sentetik veri üretimi için Cosmos WFM'lerin ilk dalgasını kullanıma sunduğunu belirtti. Şirketin belirttiğine göre; araştırmacılar ve geliştiriciler, şirket büyüklükleri farketmeksizin, Cosmos modellerini Nvidia'nın ticari kullanıma izin veren açık model lisansı altında özgürce kullanabilecek.
Cosmos WFM ailesi model büyüklüğü 4 milyar ila 14 milyar parametre arasında değişen Nano, Super ve Ultra olmak üzere üç kategoriye ayrılmış modellerden oluşuyor. Nano, düşük gecikmeli ve gerçek zamanlı uygulamalar için tercih edilirken, Super “yüksek performanslı temel” modeller için kullanılıyor. Maksimum kalite ve aslına uygun çıktılar için ise Ultra'nın kullanılması tavsiye ediliyor.
Nvidia'nın paylaştığı bilgilere göre; Cosmos WFM modelleri, 20 milyon saatlik gerçek dünya insan etkileşimleri, çevre, endüstriyel, robotik ve sürüş verilerinden elde edilen 9.000 trilyon token üzerinde eğitildi.
Şirket, geliştiricilerin WFM'leri otonom araç yolculuklarının video kayıtları veya bir depoda gezinen robotlar gibi veri setleriyle özelleştirebileceklerini ifade ediyor. Fiziksel yapay zeka araştırma ve geliştirme için özel olarak üretilen Cosmos WFM'ler, metin, görüntü ve video gibi girdilerin yanı sıra robot sensörü veya hareket verilerinin bir kombinasyonundan fizik tabanlı videolar oluşturabilir.
Nvidia'nın Cosmos WFM'nin bir parçası olarak pek çok modeli yayına aldığını söyleyebiliriz. Bunlar arasında yukarı örnekleme modeli, artırılmış gerçeklik için optimize edilmiş bir video kod çözücü ve sorumlu kullanımı sağlamak için korkuluk modelleri yer almakta. Ayrıca şirket, otonom araç geliştirme için sensör verileri üretmek gibi uygulamalar için ince ayarlı modeller de yayınlıyor.
Nvidia'nın açıklamasına göre; Waabi, Wayve, Fortellix ve Uber gibi şirketler, Cosmos WFM'leri çeşitli kullanım durumları için pilot olarak kullanacaklarını ifade etti. Bu şirketler, video arama, video küratörlüğü ve sürücüsüz araçlar için yapay zeka modelleri oluşturmak gibi amaçlar için Cosmos WFM'lerden yararlanabilir.
Modellere belirli uygulamalar için ince ayar yapılabilmek mümkün. Modelleri test etmek isteyenler, Cosmos World Foundation Models'a Nvidia'nın API ve NGC kataloglarından, GitHub'dan ve yapay zeka geliştirme platformu Hugging Face'den erişilebilir.
Kaynak : Webrazzi
Şirket paylaştığı gönderide, fizik tabanlı simülasyon ve sentetik veri üretimi için Cosmos WFM'lerin ilk dalgasını kullanıma sunduğunu belirtti. Şirketin belirttiğine göre; araştırmacılar ve geliştiriciler, şirket büyüklükleri farketmeksizin, Cosmos modellerini Nvidia'nın ticari kullanıma izin veren açık model lisansı altında özgürce kullanabilecek.
Cosmos World Foundation Models'ın detayları
Cosmos WFM ailesi model büyüklüğü 4 milyar ila 14 milyar parametre arasında değişen Nano, Super ve Ultra olmak üzere üç kategoriye ayrılmış modellerden oluşuyor. Nano, düşük gecikmeli ve gerçek zamanlı uygulamalar için tercih edilirken, Super “yüksek performanslı temel” modeller için kullanılıyor. Maksimum kalite ve aslına uygun çıktılar için ise Ultra'nın kullanılması tavsiye ediliyor.
Nvidia'nın paylaştığı bilgilere göre; Cosmos WFM modelleri, 20 milyon saatlik gerçek dünya insan etkileşimleri, çevre, endüstriyel, robotik ve sürüş verilerinden elde edilen 9.000 trilyon token üzerinde eğitildi.
Şirket, geliştiricilerin WFM'leri otonom araç yolculuklarının video kayıtları veya bir depoda gezinen robotlar gibi veri setleriyle özelleştirebileceklerini ifade ediyor. Fiziksel yapay zeka araştırma ve geliştirme için özel olarak üretilen Cosmos WFM'ler, metin, görüntü ve video gibi girdilerin yanı sıra robot sensörü veya hareket verilerinin bir kombinasyonundan fizik tabanlı videolar oluşturabilir.
Nvidia'nın Cosmos WFM'nin bir parçası olarak pek çok modeli yayına aldığını söyleyebiliriz. Bunlar arasında yukarı örnekleme modeli, artırılmış gerçeklik için optimize edilmiş bir video kod çözücü ve sorumlu kullanımı sağlamak için korkuluk modelleri yer almakta. Ayrıca şirket, otonom araç geliştirme için sensör verileri üretmek gibi uygulamalar için ince ayarlı modeller de yayınlıyor.
Nvidia'nın açıklamasına göre; Waabi, Wayve, Fortellix ve Uber gibi şirketler, Cosmos WFM'leri çeşitli kullanım durumları için pilot olarak kullanacaklarını ifade etti. Bu şirketler, video arama, video küratörlüğü ve sürücüsüz araçlar için yapay zeka modelleri oluşturmak gibi amaçlar için Cosmos WFM'lerden yararlanabilir.
Modellere belirli uygulamalar için ince ayar yapılabilmek mümkün. Modelleri test etmek isteyenler, Cosmos World Foundation Models'a Nvidia'nın API ve NGC kataloglarından, GitHub'dan ve yapay zeka geliştirme platformu Hugging Face'den erişilebilir.
Kaynak : Webrazzi