Webrazzi Öne çıkan açık kaynak 4 yapay zeka video modeli

  • Konbuyu başlatan Konbuyu başlatan Tuğçe İçözü
  • Başlangıç tarihi Başlangıç tarihi
İçerik! Webrazzi'den alıntılanmıştır. Webrazzi internet girişimleri, sosyal medya, dijital pazarlama ve mobil konularına odaklı popüler teknoloji blogudur.
T

Tuğçe İçözü

Misafir
Yapay zeka kullanan pazarlama profesyonelleri içerik üretiminde haftada ortalama 114 dakika tasarruf ediyor. Bu da yıllık 98 saatlik bir zaman kazancı anlamına geliyor. Yapay zeka video üretimi konusunda açık kaynak modellerin üretim sürecine yenilikler kattığını söyleyebiliriz. Gelin, son dönemde öne çıkan açık kaynak 4 yapay zeka video modeline gelin birlikte bakalım.

OmniHuman



TikTok'un çatı şirketi ByteDance'in OmniHuman modeli, gerçekçi insan videoları oluşturuyor. Model, hareket, ışıklandırma ve doku detayları dahil olmak üzere kapsamlı yönlerden bir gerçekçilik sunuyor. Modelin herhangi bir en boy oranında ve vücut oranında çıktılar ortaya koyduğunu söylemek mümkün. OmniHuman çizgi filmleri, yapay nesneleri, hayvanları ve zorlu pozları destekliyor. Bununla birlikte hareket özellikleri, her stilin benzersiz özellikleriyle eşleşiyor. Çeşitli müzik stillerini destekleyebilen OmniHuman, birden fazla şarkı söyleme formunu barındırabiliyor. Model, yüksek perdeli şarkıları işleyebileceği gibi, farklı müzik türleri için farklı hareket stilleri görüntüleyebilir.

MatAnyone



Videoda yer alan ana karakter veya objeleri arka plandan ayırmanızı sağlıyor. Model sayesinde arka planı kaldırarak objeleri ya da ana karakterleri izole edebilirsiniz. Aynı şekilde modeli kullanarak birden fazla karakteri videodan ayırabileceğinizi de belirtelim. Birden fazla karakter arasında seçim yapabilmeniz de mümkün. Videolardan izole etmek istediğiniz karakteri seçerek, aracın maskelemesini sağlayabiliyorsunuz. Hafıza tabanlı teknikten faydalanan model, önceki videolarda yer alan karakteri hatırlıyor diyebiliriz.

CineMaster



Cinemaster, kullanıcıların yüksek kaliteli sinematik video oluşturması için 3 Boyutlu nesneleri ve kamerayı birlikte manipüle etmelerine imkan tanıyor. Nesnelerin sahne içinde hassas bir şekilde yerleştirilmesine destek olan model, 3 Boyutlu ortamda hem nesnelerin hem de kameranın esnek bir şekilde manipüle edilmesini mümkün kılıyor. Buna ek olarak işlenen kareler üzerinde sezgisel düzen kontrolü sağlandığını da belirtelim.

CineMaster, tüm bu yetenekleri ortaya koymak için iki aşamalı olarak çalışıyor. İlk aşamada, 3 Boyutlu farkındalıklı ve koşullu sinyaller oluşturulmasını sağlayan etkileşimli bir iş akışı tasarlayan model, ikinci aşamada ise işlenmiş derinlik haritaları, kamera yörüngeleri ve nesne sınıfı etiketlerinden oluşan kontrol sinyallerinden faydalanıyor.

Light-A-Video



Görüntü odaklı yeniden aydınlatma modellerinden uyarlanan Light-A-Video, sahnelerin ışıklandırmasını değiştiriyor. Model, girdi olarak verilen videoların detaylarını tutmaya devam ederken, ışıklandırmayı istemler aracılığıyla değiştirmenizi sağlıyor. Işıklandırmayı değiştirmenin ötesinde model, arka plandan izole ederek koyduğunuz obje ve karakterlere istemler aracılığıyla farklı arka planlar eklemenize de olanak sağlıyor.

Bonus: Videojam



Üretken video modelleri, genel olarak gerçek dünya hareketini, dinamiklerini ve fiziğini yakalamakta zorlanıyor. Bir framework olan Videojam, bu probleme çözüm getiriyor. Videojam'in özellikle minimum uyarlamalarla herhangi bir video modeline uygulanabilir olması dikkat çekiyor. Bununla birlikte VideoJam'in eğitim verilerinde veya modelin ölçeklendirilmesinde herhangi bir değişiklik gerektirmemesi de dikkate değer.

Kaynak : Webrazzi
 

Reklam