G
Gözde Ulukan
Misafir
Meta AI, geçtiğimiz günlerde Twitter üzerinden bir duyuru gerçekleştirdi. Bu duyuruda şirketin Encodec adı verilen yeni ses sıkıştırma yöntemi odak noktasıydı. Bu yöntem ile Meta AI araştırmacılarının, kalite kaybı olmadan 64 kbps'de MP3'e kıyasla 10 kat daha küçük sıkıştırma oranı elde ettiği açıklandı. Söz konusu ürün ile ilgili tüm detaylar bir makalede açıkça paylaşıldı.
Müzik parçaları için kullanılabilen teknik, Meta'nın söylediğine göre, sorunlu hizmet bulunan bölgelerdeki telefon görüşmeleri gibi düşük bant genişliğine sahip bağlantılarda konuşmanın ses kalitesini önemli ölçüde artırabiliyor.
Meta'nın paylaştığı bilgilere göre Encodec, üç farklı bölümden oluşuyor: Kodlayıcı (encoder), niceleyici (quantizer), kod çözücü (decoder). Encoder, sıkıştırılmamış verileri daha düşük kare hızlı gizli uzay temsiline dönüştürüyor. Quantizer, daha sonra orijinal sinyali yeniden oluşturmak için kullanılacak en önemli bilgileri takip ederken temsili hedef boyuta sıkıştırıyor. Decoder ise tek bir CPU üzerinde bir sinir ağı kullanarak sıkıştırılmış verileri gerçek zamanlı olarak sese dönüştürüyor.
Meta, Encodec'i kullanarak, düşük bit hızlı konuşma sesi sıkıştırmasında son teknoloji ürünü sonuçlar elde ettiğini söylüyor. Ekip, nicemleme tekniklerinin sınırlarına henüz ulaşamadıkları için daha da küçük dosya boyutlarına ulaşabileceklerine inanıyor. Yani kısa bir süre sonra 10 katın çok daha fazlasına ulaşma ihtimali var. Bu noktada Encodec'in metaverse ile ilişkilendirildiğini de belirtmek gerek. Zira Meta AI araştırmacıları, teknolojinin sonunda büyük bant genişliği iyileştirmeleri gerektirmeden zengin metaverse deneyimleri sunabileceğini de belirtiyor.
Bu konuda bizi nasıl bir geleceğin beklediğini hep birlikte göreceğiz.
Kaynak : Webrazzi
Müzik parçaları için kullanılabilen teknik, Meta'nın söylediğine göre, sorunlu hizmet bulunan bölgelerdeki telefon görüşmeleri gibi düşük bant genişliğine sahip bağlantılarda konuşmanın ses kalitesini önemli ölçüde artırabiliyor.
Meta'nın paylaştığı bilgilere göre Encodec, üç farklı bölümden oluşuyor: Kodlayıcı (encoder), niceleyici (quantizer), kod çözücü (decoder). Encoder, sıkıştırılmamış verileri daha düşük kare hızlı gizli uzay temsiline dönüştürüyor. Quantizer, daha sonra orijinal sinyali yeniden oluşturmak için kullanılacak en önemli bilgileri takip ederken temsili hedef boyuta sıkıştırıyor. Decoder ise tek bir CPU üzerinde bir sinir ağı kullanarak sıkıştırılmış verileri gerçek zamanlı olarak sese dönüştürüyor.
Encodec, our AI-powered compression neural net, has 3 parts:
Encoder: transforms raw data into higher dimensional + lower frame rate
Quantizer: compresses to target size, equiv. to mp3
Decoder: turns compressed signal back to waveform, most similar to the original
3/5 pic.twitter.com/S4AvsNgztP
— Meta AI (@MetaAI) October 25, 2022
Meta, Encodec'i kullanarak, düşük bit hızlı konuşma sesi sıkıştırmasında son teknoloji ürünü sonuçlar elde ettiğini söylüyor. Ekip, nicemleme tekniklerinin sınırlarına henüz ulaşamadıkları için daha da küçük dosya boyutlarına ulaşabileceklerine inanıyor. Yani kısa bir süre sonra 10 katın çok daha fazlasına ulaşma ihtimali var. Bu noktada Encodec'in metaverse ile ilişkilendirildiğini de belirtmek gerek. Zira Meta AI araştırmacıları, teknolojinin sonunda büyük bant genişliği iyileştirmeleri gerektirmeden zengin metaverse deneyimleri sunabileceğini de belirtiyor.
Bu konuda bizi nasıl bir geleceğin beklediğini hep birlikte göreceğiz.
Kaynak : Webrazzi