線上客語有聲詞典與合成系統之研究與建置(二)


  • 年度: 99年
  • 作者: 黃豐隆
  • 獎助金額(萬元): 25
       語言是文化傳承與推廣的首要工具,因此任何一種語言均有保存之必要性,尤其是少數族群的語言;如台灣的客語或原住民語言。台灣客家族群約佔台灣總人口七分之一,為閩南語族群外第二大之族群。根據民國93年度客語使用狀況調查報告指出,阻礙客語傳承之主因是:不太會講,由於台灣教育學習環境使然,導致連客籍家庭的學童亦少能以客語說話、交談,具有聽、說客語能力者逐年下降,能說客語的人口大量減少,台灣出現了客語失聲、客家文化失傳之危機。 2009年度,主持人所提之計劃「線上客語有聲詞典與合成系統之研究與建置」,經貴會核可並已順利進行,目前依計劃書內容執行,且已有相當之成果;建置約8000筆之客語詞彙資訊,採用自然語言處理技術完成線上客語有聲詞典模組,並有二篇論文發表。在此線上客語有聲詞典系統中,使用者介面提供國客英三種查詢、檢索功能,可以顯示出相關之詞語與詞彙資訊(如拼音與例句),並可作客語之語音播放,此一線上系統已具備初步之數位學習有聲詞典之功能。
     電腦輔助之語言數位學習系統(Computer Aided Language Learning, CALL)所涉及的技術相當廣泛,如詞典建置,主機架設、語音錄製、資料庫建置與自然語言處理等,並非短期可以全部完成的,因此,在第一年所建構完成之基礎上,繼續設入相關之研究人力,使本計劃沿續目前之成果,並完成更具實用之電腦輔助語學學習之客語數位學習平台,對廣大學習者與客語國際化將有很大的助益。
      本計劃之研究語言延續2009年之計劃,以客語苗栗四縣腔為主,再錄製常用之客語雙字與三字詞合計1500個,經錄製並完成每一音之切音與能量正規化處理。而客語詞彙詞目再擴充7000筆,總數達15000筆。線上客語語音合成系統與有聲詞典即以此為基準,處理完成後可供線上作客語語音之合成與播放,具有良好之擴充性與較低人力之維護性,對日後之系統擴充與維護均比現有系統更具優勢。 本計劃完成的重點項目包含有下列幾項: 一、擴充客語詞典(Hakka’s Dictionary) 二、錄製客語雙字詞與三字詞語音(Word speech) 三、韻律訊息處理(Speech Prosody) 四、擴充客語有聲詞典系統(Phonetic Dictionary System) 五、線上客語語音合成系統(HTTS) 此系統的功能可提供準備客委會客語認證考試者、一般人士學習、認識客家文化者,學生亦可有效學習客語之聲母與母之音節發音與拼音系統,國際人士亦能以英文詞彙查詢,瞭解國語與客語之發音與語彙、語義文字,進而認識我國文化。本計劃之線上客語語音合成系統功能具有客語文轉語音之語音合成平台,將可提供相關客家語譯使用,如客語104查號台,客語有聲書、客語導覽系統、線上客語發音與翻譯機等應用,用途廣泛。 本計劃之研究語言將延續2009年之計劃,以客語苗栗四縣腔為主,再錄製完成常用之客語雙字與三字詞合計1500個,經錄製並完成每一音之切音與能量正規化處理。而客語詞彙詞目將再擴充7000筆,總數可達15000筆。線上客語語音合成系統與有聲詞典即以此為基準,處理完成後可供線上作客語語音之合成與播放,具有良好之擴充性與較低人力之維護性,對日後之系統擴充與維護均比現有系統更具優勢。 關鍵字: 電腦輔助語言學習系統、客語有聲詞典、客語語音合系統、韻律訊息預估。