跳到主要內容區塊

【轉知】教育部「臺灣主權 AI 訓練語料庫」 

 

【轉知】原民會函轉數發部「臺灣主權 AI 訓練語料庫」

一、依據原民會115年1月19日原民綜字第1150001774號函辦理
二、為推動臺灣主權AI發展,數位發展部打造「臺灣主權AI訓練語料庫」(下稱語料庫),廣納高品質正體中文語料,支援AI模型訓練更貼近臺灣語言、文化與生活情境,促進AI模型具備更高的本土辨識力與語意理解能力。
三、語料庫目前已上架累計超過3,000筆資料集,語料規模超過10億詞元(token)並持續擴充。其收錄內容涵蓋語言、文化、交通、教育、生物及地理環境等領域,皆為具臺灣文化特色之高品質資料集。
四、歡迎有AI模型訓練需求之機關(構)、公私法人、研究機構、學校、非法人團體或自然人申請使用,用臺灣的語料,打造理解臺灣的AI!
五、檢附「申請須知」及「使用規範」各一份。

檔案名稱 檔案大小
臺灣主權AI訓練語料庫申請須知及使用規範.pdf 97KB
instagram(另開新視窗) Line(另開新視窗) Youtube(另開新視窗) Facebook