G
Gözde Ulukan
Misafir
Google DeepMind, yapay zeka destekli video üretimi alanında OpenAI'ın Sora modeliyle rekabet edecek yeni nesil video oluşturma modeli Veo 2'yi duyurdu. Veo 2, daha gerçekçi videolar, daha uzun klipler ve daha yüksek çözünürlük sunuyor.
Veo 2, 4K kalitesinde iki dakikadan uzun videolar oluşturabilen bir video modeli. Bu özellikleriyle OpenAI'ın Sora modelinden 4 kat daha yüksek çözünürlük ve 6 kat daha uzun süreli videolar üretebiliyor. Ancak bu şu an teorik bir avantaj; çünkü Veo 2, Google’ın deneysel video aracı VideoFX üzerinde yalnızca 720p çözünürlükte ve 8 saniyeye kadar olan videolarla sınırlı durumda.
VideoFX platformu, Google Labs tarafından yönetiliyor ve kullanıcılar bekleme listesine kaydolup erişim için davet alabiliyor. Google, bu hafta daha fazla kullanıcının platforma erişim sağlayacağını belirtiyor.
Veo 2, giriş metni veya bir metin ile referans görsel kullanarak videolar oluşturabiliyor. Ancak yeni model, bir öncekine göre önemli geliştirmeler sunuyor:
Fiziksel Gerçekçilik: Hareket ve sıvı dinamikleri konusunda geliştirilen Veo 2, örneğin bir fincana dökülen kahve gibi detayları daha doğru modelliyor.
Kamera Kontrolleri: Model, sanal kamerayı daha hassas pozisyonlayarak nesneleri farklı açılardan kaydedebilme yeteneğine sahip. Kullanıcılar çekim özelliklerini detaylı bir şekilde belirleyebiliyor.
Netlik ve Hareket: Özellikle hareketli sahnelerde doku ve görüntünün daha net olması sağlanıyor. Pixar tarzı animasyonlardan, görsel efektlerle zenginleştirilmiş sinematik sahnelere kadar geniş bir yelpazede video oluşturabiliyor.
DeepMind'ın paylaştığı örnek videolarda, özellikle yansımalar, sıvılar ve karmaşık hareketler konusunda önemli ilerlemeler dikkat çekiyor. Ancak, modelin bazı durumlarda gerçekçilik sorunları yaşadığı da kabul ediliyor.
Veo 2, büyük miktarda video içeriği üzerinde eğitildi. Google, bu videoların tam olarak nereden toplandığını açıklamasa da YouTube’un mümkün bir kaynak olduğunu söylüyor. Google’ın bu konuda yasal dayanağı ise özgür kullanım ilkesi. Telif hakları konusunda endişeleri azaltmak için Google, Veo 2 ile oluşturulan videolara, çerçevelerin içine gömülü, gözle görülmeyen SynthID filigranı ekliyor. Ancak bu filigranın tam anlamıyla sökülemez olduğu garanti edilmiyor.
DeepMind, geliştirme sürecinde özellikle sanatçı ve yapımcılarla yakın iş birliği yürüttü. Ünlü sanatçılar Donald Glover (Childish Gambino), The Weeknd ve d4vd gibi isimler Veo’nun gelişiminde rol aldı.
Google'ın Veo 2'sinin en önemli rakibi hiç şüphesiz OpenAI'ın yapay zeka destekli video oluşturma aracı Sora. Ancak piyasada ayrıca Runway ML, Pika Labs ve Luma AI gibi şirketler de dikkat çekici ilerlemeler kaydediyor.
Google DeepMind, video üretiminin yanı sıra görsel üretim alanında da çalışmalarını sürdürüyor. Google, Imagen serisinin en yeni modeli Imagen 3’ü tanıttı. Imagen 3, detaylı görsel tutarlılığı artırarak metin tabanlı komutlarla yüksek çözünürlüklü görüntüler üretebiliyor. Özellikle yazı yazma ve ince dokuları oluşturma yeteneği ile ön plana çıkıyor.
Google, hem Veo 2 hem de Imagen 3’ü geliştirirken güvenlik, etik ve yaratıcı kullanım alanlarına odaklandığını belirtiyor. Bu modellerin ilerleyen dönemlerde içerik üreticileri, sinema sektörü ve reklamcılık gibi alanlarda yaygın olarak kullanılması bekleniyor.
Kaynak : Webrazzi
Veo 2 nedir ve neler sunuyor?
Veo 2, 4K kalitesinde iki dakikadan uzun videolar oluşturabilen bir video modeli. Bu özellikleriyle OpenAI'ın Sora modelinden 4 kat daha yüksek çözünürlük ve 6 kat daha uzun süreli videolar üretebiliyor. Ancak bu şu an teorik bir avantaj; çünkü Veo 2, Google’ın deneysel video aracı VideoFX üzerinde yalnızca 720p çözünürlükte ve 8 saniyeye kadar olan videolarla sınırlı durumda.
VideoFX platformu, Google Labs tarafından yönetiliyor ve kullanıcılar bekleme listesine kaydolup erişim için davet alabiliyor. Google, bu hafta daha fazla kullanıcının platforma erişim sağlayacağını belirtiyor.
Veo 2, giriş metni veya bir metin ile referans görsel kullanarak videolar oluşturabiliyor. Ancak yeni model, bir öncekine göre önemli geliştirmeler sunuyor:
Fiziksel Gerçekçilik: Hareket ve sıvı dinamikleri konusunda geliştirilen Veo 2, örneğin bir fincana dökülen kahve gibi detayları daha doğru modelliyor.
Kamera Kontrolleri: Model, sanal kamerayı daha hassas pozisyonlayarak nesneleri farklı açılardan kaydedebilme yeteneğine sahip. Kullanıcılar çekim özelliklerini detaylı bir şekilde belirleyebiliyor.
Netlik ve Hareket: Özellikle hareketli sahnelerde doku ve görüntünün daha net olması sağlanıyor. Pixar tarzı animasyonlardan, görsel efektlerle zenginleştirilmiş sinematik sahnelere kadar geniş bir yelpazede video oluşturabiliyor.
DeepMind'ın paylaştığı örnek videolarda, özellikle yansımalar, sıvılar ve karmaşık hareketler konusunda önemli ilerlemeler dikkat çekiyor. Ancak, modelin bazı durumlarda gerçekçilik sorunları yaşadığı da kabul ediliyor.
Veo 2'nin güvenlik ve telif konusundaki yaklaşımı
Veo 2, büyük miktarda video içeriği üzerinde eğitildi. Google, bu videoların tam olarak nereden toplandığını açıklamasa da YouTube’un mümkün bir kaynak olduğunu söylüyor. Google’ın bu konuda yasal dayanağı ise özgür kullanım ilkesi. Telif hakları konusunda endişeleri azaltmak için Google, Veo 2 ile oluşturulan videolara, çerçevelerin içine gömülü, gözle görülmeyen SynthID filigranı ekliyor. Ancak bu filigranın tam anlamıyla sökülemez olduğu garanti edilmiyor.
İş birlikleri ve rakipler
DeepMind, geliştirme sürecinde özellikle sanatçı ve yapımcılarla yakın iş birliği yürüttü. Ünlü sanatçılar Donald Glover (Childish Gambino), The Weeknd ve d4vd gibi isimler Veo’nun gelişiminde rol aldı.
Google'ın Veo 2'sinin en önemli rakibi hiç şüphesiz OpenAI'ın yapay zeka destekli video oluşturma aracı Sora. Ancak piyasada ayrıca Runway ML, Pika Labs ve Luma AI gibi şirketler de dikkat çekici ilerlemeler kaydediyor.
Google’dan bir diğer yenilik: Imagen 3
Google DeepMind, video üretiminin yanı sıra görsel üretim alanında da çalışmalarını sürdürüyor. Google, Imagen serisinin en yeni modeli Imagen 3’ü tanıttı. Imagen 3, detaylı görsel tutarlılığı artırarak metin tabanlı komutlarla yüksek çözünürlüklü görüntüler üretebiliyor. Özellikle yazı yazma ve ince dokuları oluşturma yeteneği ile ön plana çıkıyor.
Google, hem Veo 2 hem de Imagen 3’ü geliştirirken güvenlik, etik ve yaratıcı kullanım alanlarına odaklandığını belirtiyor. Bu modellerin ilerleyen dönemlerde içerik üreticileri, sinema sektörü ve reklamcılık gibi alanlarda yaygın olarak kullanılması bekleniyor.
Kaynak : Webrazzi