便利的「第三隻手」
劉利誠指出,在國外,有許多醫生使用語音系統開藥方;忙碌的工廠裡,工人在雙手不得空閒的情況下,可以用簡單的語言指令指示電腦動作;簡單的銀行電話語音系統供客戶查詢帳戶;雙手不方便,而無法操作電腦鍵盤的人,可以口代手……,電腦語音輸入法的發明可以為大家帶來極大的便利。
不過劉利誠也承認,在現在的技術水準下,他們的產品銷路仍有限,「目前我們賣出去的語音系統軟體只有一、兩百套,主要的顧客以研究單位居多」,他說這顯示買這套軟體的人大多不是拿來「用」的,而是拿來再研究的。
雖然市場仍有限,但劉利誠對語音系統的未來還是充滿信心,畢竟一旦成功,全世界華人人口的市場,可是以「億」計量的。
欠缺資料庫
雖然世界各國都有人在費心鑽研電腦語音輸入系統,然而其間交流卻不多。「各國的語言文法、發音、思考都不同,所以可供參考的經驗其實並不多」,王小川說,研究語音輸入的人,在國際上其實是滿孤單的。
至於在電腦語音輸入系統中,那種語言比較佔優勢?王小川認為:「很難說。」他表示,英文的優勢在於它沒有音調的問題,但是卻有單字太多的麻煩。電腦要先輸入上萬個單字才夠用,而且其單字還在與日俱增中。至於中文常用的音節雖只有千餘個,比英文單純,但卻有四個音調的問題,使電腦系統不易分辨。他說,「其實只要電腦不能了解人類的思考方式,每種語言在語音輸入上都有它難以突破的瓶頸。」
此外,在國內研究語音輸入時,不見得只有技術上的問題,「語音資料庫」的欠缺才是大麻煩。
由於電腦很「笨」,使用的資料都要人們先輸入,因此有一個完備的資料庫供電腦使用,就顯得非常重要。
「愛」你,別「害」你
比如說,電腦「聽」人講話,其實並非像人一樣地用耳朵收音,而是靠分析聲音的聲調、頻率等資料判斷人在說什麼。一位語音輕柔的妙齡小姐說:「我愛你」,與另一位缺牙講話「漏風」的八十歲阿媽同樣也來一句:「我愛你」,你我人類雖然都可以聽懂,但在電腦的聲音分析上,由於欠缺阿媽的聲音資料,它可能把話聽成「我害你」,一之字差,結果卻是南轅北轍。
要讓電腦搞清楚「愛你」不要「害你」,就只有多告訴它「愛」要怎麼說。女孩的愛、阿婆的愛、少男、阿公……,把他們說「愛」的語調都輸進電腦裡,電腦得到「愛」的資訊越多,就能判斷出大家說「愛」的共同特點何在。只要你說的是國語,縱使是「台灣國語」、「浙江國語」、「新疆國語」,電腦習慣了使用者的語調,而且使用者也用正確的國語語法,電腦還是能正確地接受你的「愛」。這點電腦倒比人腦強,沒有語音的「省籍情結」,而且語音資料越多,以後只要有人對它說「愛」,它能正確感受到「愛」的機率就越高。
完美的情人
但是就國內的「語音資料庫」而言,目前只有交通部電信研究所建立了一些語音資料庫,但其中國人聲音特質資料,只收集了一百人左右;而同樣的資料庫在國外收集數目最少要超過一千人才夠用。
「如果資料庫完備,再加上一本語法、詞庫完整的電子詞典輔助,電腦語音輸入應該是很有前途的」,王教授表示,已經有許多教授要合力共同建立一套可用且具公信力的語音資料庫。
電腦語音輸入的研究雖逐步進行,然而卻仍有其瓶頸待突破。不過也別太洩氣,畢竟期待一部會聽話的電腦誕生的心情,可以是很浪漫的。幻想看看——一部聽話的電腦,完全地溫馴服從,就像完美的情人……。
〔圖片說明〕
P.44
給電腦更多人類聲音特質資料,將來它所能辯識的語音正確率就更高。(李淑玲繪圖)
P.45
研究電腦語音輸入,分析聲音的頻率特質是很重要的步驟。
P.46
語音電腦還很笨,千萬別對它七嘴八舌,否則電腦會「不知所云」。(李淑玲繪圖)
P.47
一支麥克風,就可以代替繁複的鍵盤,電腦語音輸入法實在誘人。
P.47
電腦語音輸入法對雙手忙碌的生產線工人幫助很大,有些機械性的動作只要透過簡單的口令,就可以完全由電腦代勞。
P.47
就是這麼一塊小小的PC板,語音輸入系統全包含在內,將來我們希望它能取代鍵盤輸入法。
P.48
語音輸入法若研發成功,對視力不良的人會是一大福音,只要對電腦開口,它就會順從地回應你。