Microsoft Ignite 2023 etkinliğinde piyasaya sürülecek en beklenmedik ürünlerden biri, bir kişinin fotogerçekçi bir avatarını oluşturabilen ve bu avatarın, kişinin mutlaka söylemediği şeyleri söylemesini canlandırabilen bir araçtır
genel-24
Avatarlar birden fazla dilde konuşabilir
Son SAG-AFTRA grevindeki en önemli anlaşmazlık noktalarından biri, dijital benzerlikler oluşturmak için yapay zekanın kullanılmasıydı
Microsoft, bir blog yazısında “Ses modeli kullanımı bir uygulama içinde kalmalı ve çıktı, uygulamadan yayınlanamaz veya paylaşılamaz olmalıdır” diye yazıyor “[C]Sınırlı erişim uygunluk kriterlerini karşılayan kullanıcılar, ses modellerinin ve bunların çıktılarının oluşturulması, bunlara erişim ve bunların kullanımı üzerinde tek kontrole sahip olurlar “Avatar’ı konuşma aracıları, sanal asistanlar, sohbet robotları ve daha fazlasını oluşturmak için kullanabilirsiniz [where it concerns] Yalnızca eğlence senaryoları için film, TV, video ve ses dublajı
Microsoft’un özel sinirsel ses hizmetindeki yeni bir yetenek olan kişisel ses, bir dakikalık konuşma örneğini sesli komut olarak sağlayarak kullanıcının sesini birkaç saniye içinde kopyalayabilir Stüdyolar sonunda oyunculara yapay zeka tarafından oluşturulan benzerlikler için ödeme yapmayı kabul etti (Yapay zeka girişimi Synthesia’nın benzer avatar oluşturma teknolojisi, kötüye kullanılmış Venezuela’da propaganda üretmek ve YANLIŞ Çin yanlısı sosyal medya hesapları tarafından tanıtılan haber raporları
Azure AI Konuşma metninden konuşmaya avatar olarak adlandırılan ve bugün itibarıyla genel önizlemeye sunulan yeni özellik, kullanıcıların, avatarın benzemesini istedikleri bir kişinin resimlerini yükleyerek ve bir komut dosyası yazarak konuşan bir avatarın videoları oluşturmasına olanak tanıyor
Kişisel sesMicrosoft’un, aynı zamanda Ignite’ta piyasaya sürülen ilgili bir üretken yapay zeka aracı olan kişisel ses etrafında daha fazla korkuluğa sahip olduğu görülüyor ) Çoğu Azure abonesi, lansman sırasında yalnızca önceden oluşturulmuş (özel değil) avatarlara erişebilecek; Microsoft, özel avatarların şu anda yalnızca kayıt yoluyla ve “yalnızca belirli kullanım durumları için” kullanılabilen “sınırlı erişim” özelliği olduğunu söylüyor 5’i gibi yapay zeka modellerinden faydalanabilirler Şirket yanıt vermedi ve şirketlerin avatarları yapay zeka tarafından üretilmiş olarak etiketlemesinin gerekip gerekmeyeceğini söylemedi
Artık böyle bir aracın kötüye kullanılmasının sayısız yolu var; Microsoft da bunun farkında Microsoft bunu kişiselleştirilmiş sesli asistanlar oluşturmanın, içeriği farklı dillere kopyalamanın ve hikayeler, sesli kitaplar ve podcast’ler için özel anlatımlar oluşturmanın bir yolu olarak sunuyor ”
Microsoft, TechCrunch’ın aktörlerin kişisel ses katkılarının karşılığını nasıl alabilecekleri ya da yapay zeka tarafından üretilen seslerin daha kolay tanımlanabilmesi için herhangi bir filigran teknolojisi uygulamayı planlayıp planlamadığı hakkındaki sorularını yanıtlamadı Ayrıca sohbet robotu senaryolarında müşterilerden gelen senaryo dışı sorulara yanıt vermek için OpenAI’nin GPT-3
Olası hukuki sıkıntıları ortadan kaldırmak için Microsoft, bir müşterinin kendi sesini sentezlemek için kişisel sesini kullanabilmesi için kullanıcıların kayıtlı bir beyan şeklinde “açık izin” vermesini şart koşuyor Microsoft’un aracı, animasyonu yürütmek için bir modeli eğitirken, önceden oluşturulmuş veya kişinin sesiyle eğitilmiş ayrı bir metinden konuşmaya modeli, senaryoyu yüksek sesle “okur”
Daha fazla Microsoft Ignite 2023 kapsamı için:
Bu hikaye ilk olarak 15 Kasım sabah saat 8’de (PT) yayınlandı ve saat 15:30’da (PT) güncellendi Bu özelliğe erişim şimdilik bir kayıt formuyla sağlanıyor ve müşterilerin kişisel seslerini yalnızca “ses kullanıcı tarafından oluşturulan veya açık uçlu içeriği okumadığı” uygulamalarda kullanmayı kabul etmeleri gerekiyor
Ancak bu özellik bir dizi rahatsız edici etik soruyu gündeme getiriyor Peki ya Microsoft ve müşterileri?
Microsoft’a, aktörlerin görüşlerine göre uygun bir tazminat ve hatta bildirimde bulunulmadan, aktörlerin benzerlerini kullanan şirketler hakkındaki tutumunu sordum
“Kullanıcılar, metinden konuşmaya avatarla daha verimli bir şekilde video oluşturabilir… eğitim videoları, ürün tanıtımları, müşteri referansları oluşturabilirler [and so on] sadece metin girişiyle” Microsoft bir blog yazısında yazıyor