OpenAI, 15 saniyelik ses kaydını klonlayabilen teknolojisini tanıttı
OpenAI, "Voice Engine" adını verdiği yeni teknolojisinin duyurusunu yaparak, bu teknolojinin yalnızca yazılı metin ve 15 saniyelik tek ses örneği kullanarak, orijinal konuşmacıya çok benzeyen doğal bir konuşma üretebildiğini açıkladı.
OpenAI, 15 saniyelik ses kaydını klonlayabilen teknolojisini tanıttı
OpenAI, "Voice Engine" adını verdiği yeni teknolojisinin duyurusunu yaparak, bu teknolojinin yalnızca yazılı metin ve 15 saniyelik tek ses örneği kullanarak, orijinal konuşmacıya çok benzeyen doğal bir konuşma üretebildiğini açıkladı.
Açıklamada, Voice Engine'in yalnızca yazılı metin ve 15 saniyelik tek bir ses örneği kullanarak konuşmacının sesine çok benzeyen bir konuşma üretebildiği belirtildi. Teknolojinin 2022'de geliştirildiği ve kötüye kullanım potansiyeli nedeniyle daha geniş bir sürüm için temkinli ve bilinçli bir yaklaşım benimsendiği ifade edildi.
Açıklamada, insanların seslerine benzeyen konuşmaların özellikle seçim yılında ciddi riskler taşıdığının farkında olunduğu ve bu nedenle çok sayıda uluslararası ortakla birlikte çalışılarak geri bildirim toplandığı vurgulandı. Güvenlik endişelerine ilişkin olarak, Voice Engine'in test aşamasındaki kullanıcı partnerlerine kişi veya kuruluşların kimliğini kullanmanın yasaklandığı, orijinal konuşmacının rızasının gerektiği ve seslerin yapay zeka tarafından üretildiğinin izleyicilere açıkça bildirilmesinin zorunlu kılındığı belirtildi.
Ayrıca, açıklamada Voice Engine'in orijinal konuşmacının sesini koruyarak çeviri yapabileceği ve video veya podcast gibi içerik üreticilerinin kendi sesleriyle dünyaya ulaşabileceği, çevrilen seste orijinal konuşmacının aksanının da korunabileceği bilgisinin paylaşıldığı ifade edildi.
0 YORUM