中文的語音辨識比較容易?
語音處理也有類似問題。每個人、甚至同一個人在不同地方、不同狀況、不同情緒時,說話的語氣、音調都會不一樣,是電腦辨識上的一大難題。
而且,音波屬高低波,為類比信號,需先轉換成電腦能接受的數據信號;然後據以運算,再化成電腦可以辨識的符號,「過程比手寫字的辨識更複雜,因此連英文、日文的語音系統,實用也還有一大段距離。」臺大資訊系主任李琳山說。
中文是一字一音,以語音輸入是否較英語容易呢?
李教授說:「中文雖是單音,但人們說話都非只說一個字,而是一串字;加上中文的同音字很多,只憑一個音通常無法判斷說的是那個字,因此還須看上下文;但若將常用詞彙全輸入電腦,數量又太多,以目前的電腦設備處理起來速度很慢、且造價極高,因此中文的語音輸入,並不比英文容易。」
「輸出方面,一字一音、且四聲固定的中語,是比重音、音節不固定的英語佔便宜。」李教授說。
目前國內在中文語音輸出的研究,已可使電腦「答覆」問題,雖然沒有人說得自然、悅耳,但水準不下於英語、日語系統,不過要順暢地與人溝通、為人服務,還得相當時日。
「鍵盤文化」不會被淘汰
因此,在仍是第四代電腦時代的現在,仍得涵蓋在「鍵盤文化」之下。
而且,「輸入法未來必然會走上多樣化」,銘傳商專電算科主任黃克東說:「但無論手寫或語音,速度都比按鍵慢,因此鍵盤是不會被淘汰的。」
據統計,一般人的手寫速度,一分鐘可寫廿八個國字;而熟練的鍵盤操作者,每分鐘可輸入五十個國字。
中文非拼音字,構造複雜,因此中文的鍵盤輸入方式,不若英文固定、單純。國內業者各自研究、開發出許多不同的方法,讓使用者各取所需。
中文按鍵輸入法,可大分為幾類:
大鍵盤:類似中文打字機,將字鍵按部首、筆劃排列。缺點是字鍵太多,一般人不易使用;優點為一字一鍵,由專業人員操作,輸入速度極快。中央社的中文通訊系統即採此法。
小鍵盤:也就是字根法,將字根視同英文字母。小鍵盤的好處是易學易用,適於推廣;但平均一字得按三次鍵。
數字代號:包括三角號碼、四角號碼、電報明碼等法,皆是依字的結構,每字有一數碼代號,適合專業人員使用。
注音符號:以拼音方式輸入,十分方便,但因同音字多,須以「詞」為單位。目前臺北市電信局查號臺,因資料是人名,非單字,同音的機會不多,採用此法。
輸入法需不需要統一?
在上述大分類下,各種方法依字鍵排列順序、字根拆解方式等的不同,又有不同。據統計,到民國七十三年底,國產中文電腦採用的輸入法共有廿二種,以小鍵盤居多,其中又以倉頡輸入法最多。
然而,仍有不少人埋頭研究更簡便的輸入方式,最近發表的就有:旅美學人李鑫矩的「檢字法」,已獲美國政府專利;電腦博士范光陵的「中文電腦四筆輸入法」等。清大教授梅廣也正申請國科會補助,計畫發展一套注音符號拼音、藉前一個字的音決定字體,以解決同音字問題的輸入法。
輸入法「百家爭鳴」,消費者反而無所適從,因此有人主張將輸入法統一,最多每大類一種。
但大部分學者認為,輸入法牽涉到使用者與電腦的關係,應讓使用者有選擇的機會,主張讓市場自由競爭。而且,輸入法是否統一沒有大礙,重要的是,電腦與電腦間要能交換資訊,且最好功能互通——可以使用相同的軟體。
而目前各廠牌在自行開發輸入法時,也各自定一套內碼(控制電腦內部運作的符號,每字有一碼),各種廠牌「自說自話」;不同廠牌的電腦,就好比不同國家的人,語言不通。「因此,往往要花很多功夫在使電腦與其他廠牌產品的溝通上,十分不經濟。」神通電腦總經理侯清雄說。
如何使電腦間能溝通及互通?
內碼不同,也使得電腦無法完全互通。
「就和錄音機、錄影機的發展過程一樣,先是各家紛起、漫無標準,後來漸歸出標準規格:卡式與夾式、Beta與VHS。有了標準後,一卷錄音(影)帶就可以在許多廠牌的機器上播放,錄音(影)帶業於是興起;電腦也須規格統一、軟體能互通,軟體業方能發展。軟體充足、用戶便利,電腦才會普及。」宏碁電腦總經理施振榮說。
如何才能使內碼統一?
一位熟悉日本資訊業情況的教授指出:日本早年發展日文、尤其是漢字輸入法時,也是群雄紛起的戰國時代;一九七八年日本政府製定了一套標準交換碼(JIS),規定所有電腦在與其他電腦溝通時,都先將資料轉成標準交換碼。
內碼與標準碼不同的電腦,對外溝通時需多一套轉換手續,所以後來許多業者就將標準交換碼採用為內碼,內碼就逐漸統一了。
中文電腦的海外市場潛力多大?
國內也很早就有製定標準交換碼之議,前年行政院公佈以「全漢字」及「通用漢字」二套碼為標準,試用兩年。
業者多認為,二套標準等於有的講中文、有的講英文,還是很多人無法溝通。雖然二套碼各有長短,但重要的是先訂出一個做標準,希望今年十月試用期滿後,此事能塵埃落定。
「訂出標準碼,促進軟體發展;有充足的軟體配合,能加強我國中文電腦在海外華人市場的競爭力。」宏碁電腦副理陳承光說。
華人市場以東南亞為主,但東南亞許多國家,如新加坡、馬來西亞、香港等都使用雙語文,當地華人也熟諳英語,不太需要用中文電腦;且大部分地區通用的中文字型與我們不同,因此海外中文電腦市場的潛力其實有限。
但中文電腦仍是值得、且必須發展,因為,「一來中文是我們自己的語文,必須有便利、好用的中文電腦,供國內各行各業使用,以提高生產力;且中文是世界上結構最複雜的文字,有了處理中文的技術,再去開發其他象形文字系統就很容易了。」資訊工業策進會海外部副主任柯志升說。
「象形文字」是非一次元、直線式排列的文字,除中文外,還有韓文、泰文、馬來西亞文、阿拉伯文……等。目前宏碁公司已與泰國電腦業者接觸,將合作開發泰文系統。
廿一世紀電腦,是中國人的電腦?
象形文字原被認為在電腦上較難處理,但最近的發展卻顯示未必比拼音字麻煩。
就拿構造最複雜的中文字來說,據研究,目前以字根法輸入一個中文字,平均需按三次鍵;英文則平均需按五次鍵,即使一個英文字表達的意義為中文字的1.5倍,中文資料的輸入速度仍較英文快。
「而且」,臺大教授江德曜指出:「英文若由五個字母組成,顯示或儲存就得佔五個位子,中文則每個字必定只佔一個位子,以中文儲存與顯示資料可以節省許多空間。」
鍵盤輸入速度不下於英文、不慣用鍵盤的發展瓶頸將解決、儲存與顯示資料又較英文有利,因此有人說:「廿一世紀的電腦,是中國人的電腦。」
但要達到這個目標,還有很長的路要走。中央研究院研究員謝清俊說:「即使輸入的問題解決、儲存佔優勢,但若是腦袋裏空空的,也不過是個『白癡』電腦,對我們沒有幫助。」
要電腦變聰明,必須各方面的學者專家一起來「科技整合」,「各行各業的專家,才瞭解他們的語彙及需要,將各類知識輸入,並開發處理的能力,把電腦『調教』成各種事業的好幫手。」黃克東教授說。
這項工作,不僅影響智慧型中文電腦的發展,也是各行各業能否提昇生產力的關鍵。