nStock_icon
《半導體》專為台灣設計的AI語音模型!聯發科端MR Breeze ASR 25
(圖片來源:freepik)
發布時間:2025-07-01 12:24:18
分享
作者:時報新聞

【時報記者王逸芯台北報導】聯發科(2454)集團旗下的前瞻技術研究單位——聯發創新基地(MediaTek Research)近期發布基於OpenAI Whisper的AI語音辨識開源模型——MediaTek Research Breeze ASR 25(後略MR Breeze ASR 25)。相比於OpenAI Whisper,該模型對台灣用語及口音有更好的理解,並在台灣常見的中英混合語境下,達到了更高的精準度。
此外,該模型以Apache 2.0條款開源,旨在促進各行各業在創意AI領域的應用。 聯發創新基地負責人許大山博士表示,儘管開源語音辨識模型逐年進步,但對於在地用語和口音的辨識仍存在不足之處。例如,語音辨 識系統可能會將「發生什麼事」聽成「花生什麼事」。
他指出,語音辨識是AI應用的關鍵啟動功能,因此此次特別釋出「聽得懂在地語言」的ASR模型MR Breeze ASR 25。該模型的精準度較OpenAI Whisper提升了近10%,而在中英語轉換(Code-switching)表現方面,則增進了56%。
這一舉措使聯發創新基地能夠推進繁體中文AI的創新,並普及該模型在地端及裝置端的應用。 聯發創新基地自2025年起,已逐步開源全套繁體中文AI模型,包括整合視覺功能的語言模型(Visual Large Language Models, V-LLM)、針對台灣口音調整的文字轉語音模型(Text to Speech, TTS)以及能調用外部資訊的函式呼叫(Function Calling)模型。
此次釋出的MR Breeze ASR 25是MR Breeze系列的第二代語音辨識開源模型,能即時將語音轉換為文字,並強化台灣語料及台灣口音,以滿足本土應用需求。MR Breeze ASR 25目前已在HuggingFace上架。
☞警語:以上媒體報導,非任何形式之投資建議,投資前請獨立思考、審慎評估。nStock網站所有內容僅供APP使用教學參考,並無任何推介買賣之意,投資人應自行承擔交易風險。
熱門排行
上市
上櫃
合併
漲幅
跌幅
成交值

讀取中....

© 2020. 凱衛資訊股份有限公司(統編:21261212) All Rights Reserved.
1
nStock is one brand of K WAY Information. V2.0.3.6