Yapay zeka tarafınca üretilen ses teşebbüsleri internet trollerinin oyunu haline gelmesi yalnızca an sorunuydu. Eski Google ve Palantir çalışanları tarafınca kurulan yapay zeka tabanlı konuşma teşebbüsü ElevenLabs’in beta sürümü makûs kullanım ile gündemde.
4chan üyeleri, Emma Watson, Joe Rogan ve öbür ünlü isimlerin ırkçı, transfobik ve şiddet içeren şeyler söyleyen sahte seslerini yapmak için ElevenLabs’i kullandı. Şirket kısa bir süre evvel Twitter’dan açıklama yaparak “ses klonlamanın berbata kullanılması hadiselerinin sayısında artış” yaşandığını ve ek güvenlik tedbirleri uygulayarak sorunu çözmeye çalıştıklarını bildirdi.
Ünlülerin oluşturulmuş düzmece sesleri ırkçı telaffuzlarda kullanıldı
4chan’a yüklenen klipler genel olarak ünlüleri bahis alıyor lakin oluşturulan seslerin yüksek kalitesi ve insanların bunları oluşturmadaki bariz kolaylığı göz önüne alındığında “deepfake” ses kliplerinin riskleri çabucak hemen yolun başında. ElevenLabs’in beta aracını kullanarak oluşturulan ses kliplerinde ünlü oyuncu Emma Watson‘a birebir benzeyen oluşturulmuş bir ses Mein Kampf’tan (Kavgam) bir kısım okuyor. Bir öteki örnekte Ben Shapiro’ya hayli benzeyen bir ses ırkçı kelamlar söylüyor. Öbür bir örnekte ise Rick & Morty’deki Rick Sanchez’in Morty’ye yönelik şiddet telaffuzları bulunuyor. (Rick & Morty’yi seslendiren Justin Roiland, yakın vakitte ağır aile içi şiddet ile suçlanmıştı)
Klipler zararsızdan şiddete, transfobikten homofobiye ve ırkçılığa kadar geniş bir yelpazede yer alıyor. Çok çeşitli klipleri içeren bir 4chan gönderisi, ElevenLabs’in beta sürümüne bir irtibat da içeriyordu, bu da ElevenLabs’ın yazılımının sesleri oluşturmak için kullanılmış olabileceğini düşündürüyor. ElevenLabs, resmi web sitesinde hem “konuşma sentezi” birebir vakitte “ses klonlama” özellikleri sunuyor. Ses klonlama için ElevenLabs, bir dakikadan daha uzun olan pak bir örnek kayıt ile ilgili sesin klonunu oluşturuyor.
İnternette gördüklerimize ve duyduklarımıza inanmak daha da zorlaşıyor
Belki de “deepfake” ses kliplerinin bu ortaya çıkışı sürpriz olmamalı, zira birkaç yıl evvel benzeri bir fenomenin gerçekleştiğini gördük. Yapay zeka ve makine tahsilindeki gelişmeler ünlülerin düzmece görüntülerinin üretilmesinde kullanılmıştı.
Sahte görüntüler, uydurma sesler geçersiz mimikler derken internette gördüğümüz ve duyduğumuz şeyler giderek gerçeklikten uzaklaşıyor. elbette bu teknolojiler bu hedefler için geliştirilmiyor. Örneğin ElevenLabs resmi web sitesinde, sesli haber bültenleri, sesli kitap okuma ve görüntü üzere maksat kullanım alanlarından bahsediyor. Geldiğimiz noktada ise akıllara Edgar Allan Poe’nun “Gördüklerinizin sadece yarısına inanın, duyduklarınızın hiç birine.” söylemi geliyor.
4chan üyeleri, Emma Watson, Joe Rogan ve öbür ünlü isimlerin ırkçı, transfobik ve şiddet içeren şeyler söyleyen sahte seslerini yapmak için ElevenLabs’i kullandı. Şirket kısa bir süre evvel Twitter’dan açıklama yaparak “ses klonlamanın berbata kullanılması hadiselerinin sayısında artış” yaşandığını ve ek güvenlik tedbirleri uygulayarak sorunu çözmeye çalıştıklarını bildirdi.
Ünlülerin oluşturulmuş düzmece sesleri ırkçı telaffuzlarda kullanıldı
4chan’a yüklenen klipler genel olarak ünlüleri bahis alıyor lakin oluşturulan seslerin yüksek kalitesi ve insanların bunları oluşturmadaki bariz kolaylığı göz önüne alındığında “deepfake” ses kliplerinin riskleri çabucak hemen yolun başında. ElevenLabs’in beta aracını kullanarak oluşturulan ses kliplerinde ünlü oyuncu Emma Watson‘a birebir benzeyen oluşturulmuş bir ses Mein Kampf’tan (Kavgam) bir kısım okuyor. Bir öteki örnekte Ben Shapiro’ya hayli benzeyen bir ses ırkçı kelamlar söylüyor. Öbür bir örnekte ise Rick & Morty’deki Rick Sanchez’in Morty’ye yönelik şiddet telaffuzları bulunuyor. (Rick & Morty’yi seslendiren Justin Roiland, yakın vakitte ağır aile içi şiddet ile suçlanmıştı)
Klipler zararsızdan şiddete, transfobikten homofobiye ve ırkçılığa kadar geniş bir yelpazede yer alıyor. Çok çeşitli klipleri içeren bir 4chan gönderisi, ElevenLabs’in beta sürümüne bir irtibat da içeriyordu, bu da ElevenLabs’ın yazılımının sesleri oluşturmak için kullanılmış olabileceğini düşündürüyor. ElevenLabs, resmi web sitesinde hem “konuşma sentezi” birebir vakitte “ses klonlama” özellikleri sunuyor. Ses klonlama için ElevenLabs, bir dakikadan daha uzun olan pak bir örnek kayıt ile ilgili sesin klonunu oluşturuyor.
İnternette gördüklerimize ve duyduklarımıza inanmak daha da zorlaşıyor
Belki de “deepfake” ses kliplerinin bu ortaya çıkışı sürpriz olmamalı, zira birkaç yıl evvel benzeri bir fenomenin gerçekleştiğini gördük. Yapay zeka ve makine tahsilindeki gelişmeler ünlülerin düzmece görüntülerinin üretilmesinde kullanılmıştı.
Sahte görüntüler, uydurma sesler geçersiz mimikler derken internette gördüğümüz ve duyduğumuz şeyler giderek gerçeklikten uzaklaşıyor. elbette bu teknolojiler bu hedefler için geliştirilmiyor. Örneğin ElevenLabs resmi web sitesinde, sesli haber bültenleri, sesli kitap okuma ve görüntü üzere maksat kullanım alanlarından bahsediyor. Geldiğimiz noktada ise akıllara Edgar Allan Poe’nun “Gördüklerinizin sadece yarısına inanın, duyduklarınızın hiç birine.” söylemi geliyor.