郭志忠幫電腦裝上嘴巴,與人類對談

 首頁 院友點滴 工研院小故事 Vol. 3 郭志忠幫電腦裝上嘴巴,與人類對談

工研院電通所“智慧型人機互動技術”的計畫主持人郭志忠副主任開玩笑說,在他有生之年,人類可能都無法做到”星際爭霸戰”電影STAR TREK中,科克艦長以人類身份和機器人無所不談的”境界”。

但令人感到振奮的是,電通所這支國內最完整的人機互動研發團隊,嘗試運用人類的語音語言和影像視覺的介面處理,透過機器自動獲得各種生活化的數位服務,例如資訊家電語音介面、語音代理人、虛擬聲音教授、各種人物的識別門禁系統、自動櫃員機人臉遮蔽偵測系統等多項成果。

電通所目前已經成功開發出全球第一套自動櫃員機臉形遮蔽即時偵測技術和雛型系統,積極拓展國際市場。其中的語音辨識技術超越國際領導廠商Nuance,同時 與國內最大電信設備製造商東訊公司合作開發出全球第一套具自動總機及語音信箱嵌入式交換機,實際應用在台塑,統一,中鋼,經濟部,甚至工研院自家人等50 多家企業,醫院和金融單位,市佔率超過60%。舉例而言,像是使用自動總機轉機系統,透過來電者提供的語音,迅速找到受訪者的姓名,您可能不會感到陌生, 但是郭志忠的研發團隊還研發出類似聲控電腦的語音辨識功能,聽聽看,是怎麼一回事(T)。

對人類 極其簡單的肢體動作和認知能力,對目前還只能進行邏輯運算的電腦來說,的確是難度超高,例如要電腦提醒您股價何時開盤?什麼時候開會?郭志忠的團隊必須針 對”上市上櫃公司”,”開會”等字句,建立關鍵詞萃取辨識,語言理解模型,語言認知和文法解析等核心技術。過去五年內,電通所申請國內外相關專利件數總計 已經111件,建構出國內2千多筆語音語料庫。對於這些一步一腳印累積出來的成果,郭志忠笑說,獲獎雖然不怎麼樣,但他還是以團隊為榮,同時希望這支團隊 能激勵出有同樣熱情的同仁,一起做出更多真正偉大的成就,好讓歷史頒出更有意義的獎項來,郭志忠說(T)

根據GIA調查報告指出,今年全球語音市場產值有27億美元,在2010年可上達123億美元,年成長率高達34%,而亞太地區的市佔率約有6%,年成長率 高達36%。而美國受到911事件的影響,意外帶動視訊監控產業的發展,也有刺激產業加溫的意味。電通所本項技術成果也已經獲波音公司延攬為國際合作的重 要對象,將進行與機場安全相關的人臉辨識技術研發計畫。此外,美國MIT也已經將電通所的中文轉音技術,整合納入MIT有名的多語言口語對話系統中。

當生產製造業走向紅海型的價格廝殺戰場時,高科技服務型產業因具有市場開創性,降低人力勞動成本等優勢,逐漸主導企業轉型藍海策略發展的主流趨勢,而智慧型人機互動技術與此特質不謀而合,更將因此具有關鍵性的地位,主導高科技服務型產業發展。