侯興泉教授談粵語多模态語音數據庫建設及相關研究 ——記第八期漢語方言語音記錄與分析研究班之十七講

發布時間:2020-12-01 發布單位:太阳集团1088vip

       20201130,由太阳集团app首页漢語方言中心、太阳集团app首页發音語音學實驗室主辦的第八期漢語方言語音記錄與分析研究班系列講座第十七講在太阳集团app首页第一文科樓2樓中廳進行,本次講座采用線上線下的形式進行。此次講座也是2020“廣東省研究生學術論壇/暑期學校”項目組成部分。

 太阳集团1088vip中文系教授,博士研究生導師,太阳集团app首页漢語方言研究中心副主任侯興泉教授就“粵語多模态語音數據庫建設及相關研究”做專題學術講座,本次講座由彭志峰老師主持,劉新中教授、語言學及相關專業學生參加。

侯興泉教授講座現場

 侯興泉教授首先提出語料庫語言學的新趨勢是從單模态到多模态,研究者需要對人類的言語行為進行多模态建模以提升機器對人類語言的理解與學習能力,多模态數據庫包括文字、語音、手勢、表情、情感、生理數據、交際場景等不同元素。其次,侯教授闡述開展語言的多模态研究的原因,認為語言是一個“複雜的适應系統”。第三,侯教授介紹了國外兩種類型的多模态數據庫建設概況。類型一是面向人工智能的多模态數據庫,以Dawn Knight和劉劍的論文為例。類型二是面向醫學診斷和語言康複的多模态數據庫。第四,侯教授介紹國内多模态數據庫建設的基本情況,他認為國内外的多模态數據庫規模都不大,相關研究還都剛剛起步,還需要進一步加大建設力度。


侯興泉教授講座現場

 然後,侯教授講解粵語語音數據庫的建設現狀。一是面向語言學的粵語音檔庫和粵語口語語料庫。二是面向言語工程的粵語語音數據庫。侯教授重點讨論了粵語多模态語音數據庫的建設:(1)介紹了數據的類型;(2)是數據采集的設備儀器;(3)是已采錄的數據簡介;(4)介紹數據和視頻圖像處理。

 最後侯教授談到了粵語多模态語音數據庫建設的價值。一是大力推進粵語語音的生理研究和應用,二是促進粵語言語交際和話語分析等相關學科的發展,三是推進粵語言語工程領域的進展,四是有利于保護和傳承粵語口傳文化,五是有利于推動粵語研究與其他學科的交融。

彭志峰老師進行總結

同學現場提問

 彭志峰老師對侯教授的觀點總結為:語料立體化、采錄多元化、界面可視化、應用智能化。在師生讨論環節,同學和在場的老師就語言的建檔工作等問題進行讨論。此次講座擴大了語言學學生的研究方向,為今後的研究方向提供新的思路,參加講座的師生紛紛表示受益匪淺。

(撰稿、攝影:黃榮華 )