新華社廣州11月10日電? 題:輕松飆外語,AI視頻翻譯“走紅”背后
新華社記者胡夢雪、熊嘉藝
近日,“知名相聲演員用英語表演”“Taylor Swift講地道中文”等一批由人工智能(AI)翻譯軟件生成的視頻在社交平臺引發熱議。視頻翻譯流暢,足以“以假亂真”,刷新了人們對AI應用邊界的認知。
如何看待此類視頻的走紅?技術可及性將為生活帶來哪些變化?“AI嘴替”又可能涉及哪些法律和倫理風險?記者對此進行了采訪。
相聲演員化身“英語母語者”
“還以為他真能說英文相聲!”北京上班族王路(化名)看到某知名相聲演員的表演視頻被AI翻譯成英文后“十分上頭”。更令她感到震撼的是,這些AI合成視頻聲線擬真、語氣自然,甚至口型都能做到“天衣無縫”。
多名視頻創作者透露,這項技術來自某款AI視頻翻譯平臺。
圖為一款AI視頻翻譯平臺網頁截圖。
用戶只需提交滿足要求的初始視頻,支付一定訂閱費用,即可實現十余種語言的“一鍵翻譯”,呈現自然的克隆聲音和真實的說話風格。
基于此技術,一些網絡博主嘗試翻譯自拍VLOG,或對明星的經典片段進行二次創作。視頻創作者周天(化名)告訴記者,他的工作效率得到很大提升,“不僅省掉了瑣碎的翻譯過程,還能擬合原聲、改變口型。”
人物在不同語言間“絲滑”切換,毫不“違和”,究竟是如何實現的?業內人士表示,看似娛樂的背后,涉及“換臉”“重現”等深度偽造技術,以及大語言模型在多語種翻譯方面的應用。
“其實是將相對成熟的各項技術綜合了起來。”中科院深圳先進技術研究院研究員燕楠表示,視頻制作需要的文字翻譯、語音克隆、視頻生成等模塊,均可由AI輕松完成。例如人物圖像,大模型可直接生成目標人物臉部和嘴部的運動序列,讓神情、口型趨于逼真。
技術下放,“嘗鮮”AI有風險
“名人說外語”風靡之下,不少人表示看好AI技術在影片譯制、文化交流、打破語言壁壘等方面進一步發力。一位提供AI視頻翻譯幫助服務的中介透露,相比發布“二創”明星素材,針對原創內容翻譯出海的咨詢近來有所升溫。
不僅是專業的內容生產者,從“AI歌手”,到可以生成數字分身的小程序,技術門檻的降低,讓越來越多普通人也可以輕松使用AI技術。
那么,如果想“嘗鮮”使用AI視頻翻譯技術,哪些風險值得注意?
多位律師表示,從法律層面來說,制作并發布AI翻譯視頻,可能侵害被模仿者的姓名權、肖像權、名譽權、表演者權等。
“依據民法典規定,未經肖像權人同意,不得制作、使用、公開肖像權人的肖像,因此AI視頻翻譯可能涉嫌侵犯肖像權。”廣東環球經緯律師事務所律師鄧鑫說,由于相聲、歌曲等源視頻均屬于著作權法保護的作品范疇,若未經授權使用,還涉嫌著作權侵權。此外,對聲音進行修改和替換,或提取被模仿者的敏感信息,也有相應法律風險。
法律人士同時指出,如果只是單純地進行翻譯,未將翻譯后的生成物公開傳播的,一般可以認為是個人的合理使用。
“粗一看挺逗樂,可深入一想,今天被換臉的是‘名人’,明天被換的是自己該怎么辦?萬一有人利用技術歪曲事實、冒充詐騙,又該怎么辦?”互聯網上,一些視頻彈幕表達了憂慮。“眼見不再為實”,AI視頻翻譯技術一旦被濫用,后果難以想象。
培育向上向善技術環境
事實上,此前單一維度的AI“換臉”“擬聲”已帶來一定風險,互聯網不是法外之地。截至今年8月初,公安機關通過專項會戰,偵破“AI換臉”案件79起,抓獲犯罪嫌疑人515名。
知情人士介紹,此類案件的發生,AI技術是手段,關鍵還要基于大量掌握目標對象的語音圖片素材和社會身份信息。在鄧鑫看來,“AI技術本身并不是原罪,技術發展帶來的后果取決于如何使用、用于何處以及使用代價的考量。”
我國已經發布《互聯網信息服務深度合成管理規定》與《生成式人工智能服務管理暫行辦法》等多項辦法,對人工智能相關技術規范、義務主體與責任作出規定,強調技術開發、服務提供者的主體責任。
多位受訪對象建議綜合施策。專家提示,應強化對視頻制作源頭約束、建立平臺審核機制,同時加強深度偽造檢測技術研發,通過提取表征等技術方式識別真偽,防止AI濫用。
一些視頻發布平臺也在積極行動。如上線標識功能,要求創作者發布包含人工智能生成的內容時,應聲明“該視頻使用人工智能合成技術”,避免誤導觀眾。
圖為某視頻發布平臺“主動添加內容標識”公告截圖。
業內人士認為,在可以預見的未來,將會有更多有創造力的AI應用案例涌現,社會也應營造向上向善的應用環境,讓AI技術真正帶來美好。