用族語與TAIDE聊天
國網中心同步開發原住民的AI語料。國網中心主任張朝亮說:「我可以很自豪地講,從人文與理想概念上,這在全球AI的發展上,是非常獨特的。」在國際會議上說起這項應用,大家都舉起大姆指,稱讚台灣注意到少數族群的公平性,並且對文化的保留做出貢獻。
負責族語計畫的國網中心研究員蕭一豪指出,這兩年做下來,總計太魯閣語已收錄了61,000筆的語音資料,總時數約125個小時,語料量是原住民族語言研究發展基金會(簡稱「原語會」)資料量的五倍;鄒語一共錄了71,000多筆,總時數約240個小時,是原語會收錄的13倍。
蕭一豪說:「接下來要做的是卑南語的四種方言,包括南王、知本、西群與建和;還有台灣原住民族語裡極度瀕危語言噶瑪蘭語,全台灣目前1,700多位噶瑪蘭族人中,會講噶瑪蘭語的人更是少數。」