台灣版ChatGPT來了!聯發科攜中研院開放最大繁中語言模型資料庫
人工智慧(AI)聊天機器人ChatGPT 短短4個月全球爆紅,累計達1億用戶。台灣AI 生成內容國家隊也就位! 聯發科攜手中央研究院詞庫小組和國家教育研究院,今日開放全球第一款繁體中文語言模型到開源網站提供測試。繁體中文大型語言模型(large language model),比目前開源可用的最大繁體中文模型大1000倍。
台灣版ChatGPT 來了!聯發科攜中研院開放最大繁中語言模型資料庫。資料照
本次公開釋出以開源語言模型BLOOM開發的繁體中文大型語言模型(large language model),比目前開源可用的最大繁體中文模型大1000倍,所使用的訓練資料也多1000倍。該模型已公開讓外界下載,可應用於問答系統、文字編修、廣告文案生成、華語教學、客服系統等。
聯發創新基地負責人許大山說,大型語言模型是近年人工智慧技術亮點,更是未來技術進步不可或缺的基石。聯發科這次結合中研院及國教院,成為台灣極少數能訓練大型語言模型的團隊,以透明、開放和包容方式,善用技術、人才及資源,既發展自主訓練大型人工智慧模型的能力,也讓繁體中文的大型語言模型研究及應用更普及。
目前開放原始碼釋出的大型語言模型,多數仍以英文為主要優化的對象,繁體中文的語言模型相對不足。鑑於開放原始碼繁體中文大型語言模型的重要性與迫切性,去年5月聯發創新基地、中央研究院和國家教育研究院展開合作計畫,使用大型語言模型BLOOM的繁體中文模型再訓練與優化。
目前開放系列中第一個有量級跳躍意義的繁體中文語言模型,聯發科創新基地也暫備一個手機網頁的介面,供語言模型研究者試用。此模型系列的評量指標,以及參數量更大(176B)的模型,將陸續開放下載。