G
Gözde Ulukan
Misafir
Aranızda muhakkak ABD’li müzik grubu Talking Heads’in beyni David Byrne’e aşina olanlar vardır. David Byrne, aynı zamanda müzikal yaşantısını kelimelere de döken bir müzisyen ve yazar. Ülkemizde Mundi Kitap etiketiyle yayımlanan “Müzik Nasıl İşler” adlı kitabında da müziğin evrimsel gelişimine, hatta teknoloji ile kesiştiği noktalara değiniyor. Byrne bu kitabında, ses bilgisinin ve hemen ardından her türlü bilginin dijitalleştirilmesinin büyük oranda bir telefon şirketi tarafından gerçekleştirildiğini söylüyor.
Buradan da anlayabileceğimiz üzere, sesin dijitalleştirilmesi tamamen başka bir ihtiyaçtan ortaya çıktı. Aslında teknolojinin de en güzel yanlarından biri bu; bir şeyi ararken başka bir şeye ulaşmak. Plaklardan kasetlere, kasetlerden CD’lere ve MP3’lere uzanan süreçte artık dijital bir müzik dünyası söz konusu. Spotify’ın ve akabinde diğer platformların kurulması, yayılması, benimsenmesi ve kendinden bir önce geleni rafa kaldırması da bunun en kayda değer örneklerinden biri.
Evet, dijitalleşme ile müzik konusunda farklı bir döneme girdik. Ancak artık çok daha farklı bir dönem bizleri bekliyor. Bu dönemin en önemli teknolojisi ise bir dönem sadece bir bilim kurgu terimi olabilmiş “yapay zekâ”.
Öncelikle yapay zekâ ile nasıl müzik oluşturulacağından çok da teknik olmayan bir şekilde bahsetmeye çalışalım. Aslında yapay zekânın görsel üretmesi ve müzik üretmesi aynı mantık üzerinden ilerliyor. Makine öğrenimi modelleri, modele anlaşılır bir şekilde sağlamak istediğimiz girdiyi temsil eden sayısal vektör şeklinde girdiler olarak kullanılıyor. Yani makine öğrenimi, dolayısıyla yapay zekâ ile müzik üretmek için müziği sayısal hale dönüştürmek gerekiyor. Bunun için de yapılması gereken ilk şey melodinin bir sayısal belirteçler dizisi olarak düşünülmesi. Bu arada her bir vektörün, temsil edilebilecek diğer özelliklerin yanı sıra nota, ritim ve tını hakkında bazı bilgilere sahip olduğunu göz önünde bulundurmak gerek.
Keşfedilecek modelleri eğitmek için notalar, ritimdeki değişiklikler, BPM gibi sıralı bilgiler sağlayan yapılandırılmış dosyalar olan MIDI dosyaları kullanılabilir. Ham sesle çoğu algoritma, her zaman adımında sesin ham temsilini kullanır. Girdi vektörleri olarak girdi dizileriyle, çoğu zaman modeller, her zaman adımında bir dizinin bir sonraki belirtecini tahmin etme görevi olan doğal dil işleme yani NLP ile eğitilir.
Bu noktada vurgulanması gereken en önemli şey şu; yapay zekâ ile müzik üreten platformlar tamamen aynı sistemi kullanmak zorunda değil. Kimi platform dikkat katmanları adı verilen bir dizi özel katman içeren sinir ağları için kullanılan bir mimari olarak tasvir edilen transformatörleri kullanırken, kimi platform da bir MIDI dosyasının perde aralığını değiştirmek için sinir ağı mimarilerinin bazı konfigürasyonlarını kullanabilir. Sonuç olarak buradaki en önemli nokta sesin sayısallaştırılması ve eğitilmesi. Tabii kendi adıma altını çizmem gereken bir nokta var, buna ilgi alanı olarak yaklaştığım için benim kaçırdığım veya anlamlandıramadığım yerler muhakkak var. Hatta belki bazı noktaları yanlış yorumluyor da olabilirim. Ama eğer siz de benim gibi geliştirici değilseniz zaten bunun çok da önemi yok, zira artık birçok platform birkaç belirteç ile size istediğiniz veya istediğinize en yakın sesleri üretebiliyor.
Bu alanda en sık kullanılan birkaç platformdan da bahsetmeden geçmeyelim.
Amper Music, kullanımı en kolay yapay zekâ ile müzik üreteçlerinden biri. Amper, önceden kaydedilmiş örneklerden müzik parçaları oluşturduğu için kullanmak için derin müzik teorisi veya beste bilgisi gerektirmiyor. AIVA da bir başka yapay zekâ destekli müzik oluşturucu. Bu platform ile reklamlar, video oyunları, filmler ve daha fazlası için müzik bestelemek mümkün. AIVA ile önceden ayarlanmış bir stil seçerek kolayca birçok tür ve stilde müzik oluşturulabiliyor. Ecrett Music ise yüzlerce saatlik mevcut şarkı üzerinde eğitim alarak herkesin müzik klipleri oluşturmasına olanak tanıyor. Anlaşılır arayüze sahip platform, hem amatörler hem de profesyoneller tarafından kullanılabiliyor.
Soundraw, şarkıyı yapay zekâ tarafından oluşturulan cümlelerle özelleştirmenizi sağlıyor. Araç, kolaylıkla yeni müzik oluşturmanızı ve özelleştirmenizi sağlayan yapay zekâ ve onun manuel araçlar derlemesinin birleşiminden oluşuyor. Boomy, orijinal şarkıları saniyeler içinde oluşturmanızı sağlıyor. Şarkılar benzersiz olduğu için daha sonra bu şarkılardan gelir elde etmek de mümkün hale geliyor. OpenAI, MuseNet adında kendi online yapay zekâ müzik üretme aracına sahip. Araç, on adede kadar farklı enstrümanla şarkılar ve 15 adede kadar farklı tarzda müzik üretebiliyor. Hatta OpenAI'ın Soundcloud hesabından bu müziklere göz atabilirsiniz. Amadeus Code ise dünyanın en ünlü şarkılarından bazılarının akor ilerlemelerini içeren bir yapay zekâ motoru olarak hizmet veriyor. Daha sonra bunları yeni müzik bestesi yapıları oluşturmak için kullanabilmek mümkün.
Bunlar temel olarak en fazla tercih edilen platformlar arasında sayılsa da aslında bu alanda hizmet veren araç sayısı inanılmaz ve hepsine tek yazıda yer vermek mümkün değil. Yapay zekânın bu denli talep görmesi ile artan yapay zekâ ile müzik oluşturma araçlarına Webrazzi'de de sıklıla yer veriyoruz ve vermeye devam edeceğiz.
Temel olarak kullanıcının bu platformlarda yaptığı çok basit. Bir platforma giriyor, gerekiyorsa üye oluyor, istediğiniz müzik türünü, müziğin ne amaçlı kullanılacağını, oluşturulacak şarkının veya sesin modunu (üzgün, mutlu, sinirli vs.) seçiyorsunuz. Daha sonra halihazırda eğitilmiş seslerden sizin için en uygun olanı seçiliyor, bir araya getiriliyor. Diyelim ki oluşan sesteki enstrümanlar içinize sinmedi, aynı sesin üzerinden enstrüman ekleyip çıkarabiliyor, hızı azaltıp artırabiliyor, istediğiniz sonuca ulaşana kadar çeşitli denemeler yapabiliyorsunuz. Çıkan sonuç sizi gerçek biri tarafından bestelenmiş müzik kadar mutlu eder mi, bilemem. Ancak buradaki avantaj oluşan "şarkının" anında değiştirilebiliyor olması, ya da bunu da geçelim, şarkının "anında" oluşturulabilirken aynı zamanda "kişiye özgün" olması.
Bu noktada akıllardaki en önemli soru şu: "Yapay zekâ bir müzisyenin işini alabilir mi?" Kişisel fikrim böyle bir şeyin hiçbir zaman olmayacağı yönünde. Önder Kulak'ın "Theodor Adorno: Kültür Endüstrisinin Kıskacında Kültür" adlı doktora tezinde şöyle bir ifade var; "Adorno, enstrüman ve sanatçı arasındaki ilişkinin, bir eserin değeri açısından son derece önemli olduğuna işaret eder. Örneğin enstrümanların sanatçıları yönetmeye başladıkları bir yapıt için, sanatsal değerden bahsedilemeyeceği gibi, bir kitsch olma halinden fazlası da beklenemez. Bunun başlıca nedeni sanatın, “bireyin kendi öznel yaratıcılığına” dayanmasıdır."
Bu ifade demek istediğimi tam olarak anlatıyor. Enstrümanlar insanları yönetirse sanatsal değer ortadan kalkar, zira sanat bireyin kendi öznel yaratıcılığına dayanır. Bu nedenle bana göre yapay zekâ ile üretilen müzikler insanın ruhuna dokunmaktan ziyade bir tüketim ürünü görevinde olabilir. Nedir bu tüketim ürünleri? Bir sosyal medya videosunun müziği olabilir, bir reklamda kullanılabilecek müzik olabilir. Kısacası yapay zekâ ile etkisi uzun sürmeyecek, kişilerin "aa bu şarkı neymiş, hemen dinleyeyim" diyemeyeceği bir eserlerin ortaya çıkması daha muhtemel. Ancak burada da "popüler kültür" devreye giriyor. Son dönemde popüler olan müzik türleri genelde bilgisayar ile oluşturulmaya uygun. Özellikle sözsüz içeriklerde bu durum böyle. Yani Adorno da ben de yanılıyor da olabiliriz. Nitekim bunu zaman gösterecek.
Son olarak şunu ifade etmek isterim ki yapay zekâ insanın karşında değil, insanın yanında olduğu süre fayda sağlayacaktır. Bu düşüncem müzik sektörü için de geçerli. Yani müzisyenlerin, sanatçıların teknolojiyi reddetmek yerine bundan yararlanması kendilerine kolaylık sağlayacaktır. Belki ileride hiç beklemediğimiz formatlarda aklımıza gelmeyecek şarkıları, insan beyni ve yapay zekânın birleşimi sayesinde dinliyor oluruz, kim bilir?
Kaynak : Webrazzi
Bell Telephone Company’nin bir bölümü olan Bell Laboratuvarları, konuşmaları iletmenin daha verimli ve güvenilir bir yolunu bulma talimatı almıştı.
...
1962’de Bell Laboratuvarları, sesi nasıl dijitalleştireceğini -yani aslen bir ses dalgasını örneklemeyi ve birler ve sıfırlarla ifade edilebilecek küçük parçalara ayırmayı- keşfetti.
Buradan da anlayabileceğimiz üzere, sesin dijitalleştirilmesi tamamen başka bir ihtiyaçtan ortaya çıktı. Aslında teknolojinin de en güzel yanlarından biri bu; bir şeyi ararken başka bir şeye ulaşmak. Plaklardan kasetlere, kasetlerden CD’lere ve MP3’lere uzanan süreçte artık dijital bir müzik dünyası söz konusu. Spotify’ın ve akabinde diğer platformların kurulması, yayılması, benimsenmesi ve kendinden bir önce geleni rafa kaldırması da bunun en kayda değer örneklerinden biri.
Evet, dijitalleşme ile müzik konusunda farklı bir döneme girdik. Ancak artık çok daha farklı bir dönem bizleri bekliyor. Bu dönemin en önemli teknolojisi ise bir dönem sadece bir bilim kurgu terimi olabilmiş “yapay zekâ”.
Yapay zekâ ile müzik nasıl oluşturulur?
Öncelikle yapay zekâ ile nasıl müzik oluşturulacağından çok da teknik olmayan bir şekilde bahsetmeye çalışalım. Aslında yapay zekânın görsel üretmesi ve müzik üretmesi aynı mantık üzerinden ilerliyor. Makine öğrenimi modelleri, modele anlaşılır bir şekilde sağlamak istediğimiz girdiyi temsil eden sayısal vektör şeklinde girdiler olarak kullanılıyor. Yani makine öğrenimi, dolayısıyla yapay zekâ ile müzik üretmek için müziği sayısal hale dönüştürmek gerekiyor. Bunun için de yapılması gereken ilk şey melodinin bir sayısal belirteçler dizisi olarak düşünülmesi. Bu arada her bir vektörün, temsil edilebilecek diğer özelliklerin yanı sıra nota, ritim ve tını hakkında bazı bilgilere sahip olduğunu göz önünde bulundurmak gerek.
Keşfedilecek modelleri eğitmek için notalar, ritimdeki değişiklikler, BPM gibi sıralı bilgiler sağlayan yapılandırılmış dosyalar olan MIDI dosyaları kullanılabilir. Ham sesle çoğu algoritma, her zaman adımında sesin ham temsilini kullanır. Girdi vektörleri olarak girdi dizileriyle, çoğu zaman modeller, her zaman adımında bir dizinin bir sonraki belirtecini tahmin etme görevi olan doğal dil işleme yani NLP ile eğitilir.
Bu noktada vurgulanması gereken en önemli şey şu; yapay zekâ ile müzik üreten platformlar tamamen aynı sistemi kullanmak zorunda değil. Kimi platform dikkat katmanları adı verilen bir dizi özel katman içeren sinir ağları için kullanılan bir mimari olarak tasvir edilen transformatörleri kullanırken, kimi platform da bir MIDI dosyasının perde aralığını değiştirmek için sinir ağı mimarilerinin bazı konfigürasyonlarını kullanabilir. Sonuç olarak buradaki en önemli nokta sesin sayısallaştırılması ve eğitilmesi. Tabii kendi adıma altını çizmem gereken bir nokta var, buna ilgi alanı olarak yaklaştığım için benim kaçırdığım veya anlamlandıramadığım yerler muhakkak var. Hatta belki bazı noktaları yanlış yorumluyor da olabilirim. Ama eğer siz de benim gibi geliştirici değilseniz zaten bunun çok da önemi yok, zira artık birçok platform birkaç belirteç ile size istediğiniz veya istediğinize en yakın sesleri üretebiliyor.
Yapay zekâ ile müzik oluşturma platformları
Bu alanda en sık kullanılan birkaç platformdan da bahsetmeden geçmeyelim.
Amper Music, kullanımı en kolay yapay zekâ ile müzik üreteçlerinden biri. Amper, önceden kaydedilmiş örneklerden müzik parçaları oluşturduğu için kullanmak için derin müzik teorisi veya beste bilgisi gerektirmiyor. AIVA da bir başka yapay zekâ destekli müzik oluşturucu. Bu platform ile reklamlar, video oyunları, filmler ve daha fazlası için müzik bestelemek mümkün. AIVA ile önceden ayarlanmış bir stil seçerek kolayca birçok tür ve stilde müzik oluşturulabiliyor. Ecrett Music ise yüzlerce saatlik mevcut şarkı üzerinde eğitim alarak herkesin müzik klipleri oluşturmasına olanak tanıyor. Anlaşılır arayüze sahip platform, hem amatörler hem de profesyoneller tarafından kullanılabiliyor.
Soundraw, şarkıyı yapay zekâ tarafından oluşturulan cümlelerle özelleştirmenizi sağlıyor. Araç, kolaylıkla yeni müzik oluşturmanızı ve özelleştirmenizi sağlayan yapay zekâ ve onun manuel araçlar derlemesinin birleşiminden oluşuyor. Boomy, orijinal şarkıları saniyeler içinde oluşturmanızı sağlıyor. Şarkılar benzersiz olduğu için daha sonra bu şarkılardan gelir elde etmek de mümkün hale geliyor. OpenAI, MuseNet adında kendi online yapay zekâ müzik üretme aracına sahip. Araç, on adede kadar farklı enstrümanla şarkılar ve 15 adede kadar farklı tarzda müzik üretebiliyor. Hatta OpenAI'ın Soundcloud hesabından bu müziklere göz atabilirsiniz. Amadeus Code ise dünyanın en ünlü şarkılarından bazılarının akor ilerlemelerini içeren bir yapay zekâ motoru olarak hizmet veriyor. Daha sonra bunları yeni müzik bestesi yapıları oluşturmak için kullanabilmek mümkün.
Bunlar temel olarak en fazla tercih edilen platformlar arasında sayılsa da aslında bu alanda hizmet veren araç sayısı inanılmaz ve hepsine tek yazıda yer vermek mümkün değil. Yapay zekânın bu denli talep görmesi ile artan yapay zekâ ile müzik oluşturma araçlarına Webrazzi'de de sıklıla yer veriyoruz ve vermeye devam edeceğiz.
Temel olarak kullanıcının bu platformlarda yaptığı çok basit. Bir platforma giriyor, gerekiyorsa üye oluyor, istediğiniz müzik türünü, müziğin ne amaçlı kullanılacağını, oluşturulacak şarkının veya sesin modunu (üzgün, mutlu, sinirli vs.) seçiyorsunuz. Daha sonra halihazırda eğitilmiş seslerden sizin için en uygun olanı seçiliyor, bir araya getiriliyor. Diyelim ki oluşan sesteki enstrümanlar içinize sinmedi, aynı sesin üzerinden enstrüman ekleyip çıkarabiliyor, hızı azaltıp artırabiliyor, istediğiniz sonuca ulaşana kadar çeşitli denemeler yapabiliyorsunuz. Çıkan sonuç sizi gerçek biri tarafından bestelenmiş müzik kadar mutlu eder mi, bilemem. Ancak buradaki avantaj oluşan "şarkının" anında değiştirilebiliyor olması, ya da bunu da geçelim, şarkının "anında" oluşturulabilirken aynı zamanda "kişiye özgün" olması.
Adorno'ya göre sanat, bireyin kendi öznel yaratıcılığına dayanır
Bu noktada akıllardaki en önemli soru şu: "Yapay zekâ bir müzisyenin işini alabilir mi?" Kişisel fikrim böyle bir şeyin hiçbir zaman olmayacağı yönünde. Önder Kulak'ın "Theodor Adorno: Kültür Endüstrisinin Kıskacında Kültür" adlı doktora tezinde şöyle bir ifade var; "Adorno, enstrüman ve sanatçı arasındaki ilişkinin, bir eserin değeri açısından son derece önemli olduğuna işaret eder. Örneğin enstrümanların sanatçıları yönetmeye başladıkları bir yapıt için, sanatsal değerden bahsedilemeyeceği gibi, bir kitsch olma halinden fazlası da beklenemez. Bunun başlıca nedeni sanatın, “bireyin kendi öznel yaratıcılığına” dayanmasıdır."
Bu ifade demek istediğimi tam olarak anlatıyor. Enstrümanlar insanları yönetirse sanatsal değer ortadan kalkar, zira sanat bireyin kendi öznel yaratıcılığına dayanır. Bu nedenle bana göre yapay zekâ ile üretilen müzikler insanın ruhuna dokunmaktan ziyade bir tüketim ürünü görevinde olabilir. Nedir bu tüketim ürünleri? Bir sosyal medya videosunun müziği olabilir, bir reklamda kullanılabilecek müzik olabilir. Kısacası yapay zekâ ile etkisi uzun sürmeyecek, kişilerin "aa bu şarkı neymiş, hemen dinleyeyim" diyemeyeceği bir eserlerin ortaya çıkması daha muhtemel. Ancak burada da "popüler kültür" devreye giriyor. Son dönemde popüler olan müzik türleri genelde bilgisayar ile oluşturulmaya uygun. Özellikle sözsüz içeriklerde bu durum böyle. Yani Adorno da ben de yanılıyor da olabiliriz. Nitekim bunu zaman gösterecek.
Son olarak şunu ifade etmek isterim ki yapay zekâ insanın karşında değil, insanın yanında olduğu süre fayda sağlayacaktır. Bu düşüncem müzik sektörü için de geçerli. Yani müzisyenlerin, sanatçıların teknolojiyi reddetmek yerine bundan yararlanması kendilerine kolaylık sağlayacaktır. Belki ileride hiç beklemediğimiz formatlarda aklımıza gelmeyecek şarkıları, insan beyni ve yapay zekânın birleşimi sayesinde dinliyor oluruz, kim bilir?
Kaynak : Webrazzi