打擊AI語音合成Deep Fake詐騙 臺科大研發「護聲符 APP」獲競賽佳績

記者李喬智/臺北報導

近年來深度偽造(Deep Fake)技術迅速發展,有不法分子利用 AI 語音合成技術進行語音詐財,對社會造成重大隱患。針對這一問題,國立臺灣科技大學資訊管理系學生王玟雅、蔡婷玗、陳俞縕及毛世鑫共同開發「應用音訊浮水印於對抗式攻擊與深度學習之數位護聲符系統」,提供語音防護與真偽辨識。他們設計的「護聲符 APP」在第29屆大專院校資訊應用服務創新競賽中也榮獲資安應用組第二名及資訊應用組第三名的佳績。

隊長王玟雅表示,親友曾經接過陌生來電,被誘導進行對話的經歷,再加上看到關於語音詐騙的新聞,讓她萌生設計語音防護系統的想法,希望以科技手段保障聲音權益。「護聲符APP」具備語音真偽辨別及數位音訊防護兩大功能,除了可以分辨語音是AI還是真人,還能為聲音加上特殊的「音訊浮水印」,也就是人類聽不見的音頻或標記,防止聲音被AI軟體進行二次合成利用,音訊浮水印也能作為保障聲音版權的依據。


▲「護聲符APP」可在音檔上加上人類聽不見的雜訊或標記,防止聲音被AI軟體進行二次合成利用,音訊浮水印也能作為保障聲音版權的依據。(圖/臺科大提供)

在語音真偽辨識方面,團隊蒐集公開的真人語音資料庫與 AI 合成音訊,利用偵測模型整合與分類,分析真實語音與合成語音的特徵與差異,最終訓練出辨識系統。在背景音乾淨的情況下,該系統對真人語音的辨識準確率高達 99.99%,對 AI 合成音的辨識準確率則為 99.94%。王玟雅表示,此次團隊的共同合作開發也在軟硬實力上帶給她比預期中更多的成長與收穫。

目前APP 支援音檔上傳與錄製功能,使用者可藉此辨別語音真偽或添加浮水印。王玟雅也將規劃完整開發即時通話中的語音辨識與防護功能。同時,因為目前訓練模型用的語音資料大多為英文,團隊也預計擴展模型的語音數據庫,蒐集更多中文語音樣本進行模型訓練,增強對中文語音的支持,以符合台灣民眾的使用需求。未來,希望可以將「護聲符 APP」發展成合規性工具,應用於通信、聲音版權保障、生物特徵驗證、影視製作等領域,成為具有公信力、保障聲音版權的工具。


▲臺科大資管系學生王玟雅、蔡婷玗、陳俞縕及毛世鑫開發「應用音訊浮水印於對抗式攻擊與深度學習之數位護聲符系統」,榮獲第29屆大專院校資訊應用服務創新競賽資安應用組第二名及資訊應用組第三名。(圖/臺科大提供)

團隊成員毛世鑫分享,儘管他原本對語音相關的資安技術不熟悉,但為了完成語音模型的開發,他也特意去進修相關課程,拓展知識層面。來自印尼的成員陳俞縕一開始對於得獎並沒有抱太大的期待,聽到獲獎的消息時,她感到相當驚喜,「得獎對我來說是一種鼓勵,讓我更堅定想要朝資安的領域繼續努力。」成員蔡婷玗也說,競賽得獎讓她更有動力去面對未來的各種挑戰,能更有信心迎難而上。

指導老師黃政嘉助理教授指出,聲音權益在近年逐漸受到重視。例如,公眾人物的聲音可能被不法分子利用,製作出虛假言論,嚴重影響其聲譽;日本甚至有聲優因聲音遭竊取而影響工作權,但目前聲音版權保障相關法規仍不完善。

黃政嘉也提到,「護聲符APP」使用的技術具有高度市場需求,但開發具公信力的系統面臨諸多挑戰,包括語音樣本的蒐集與模型建構等。黃政嘉透過引導的方式,鼓勵學生從日常生活中發掘問題與解決方案,保持創造力與熱忱,逐步實現構想,成為業界亟需的專業即戰人才。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *