Mistral AI 最近推出了兩款新的 AI 模型,Ministral 3B 和 Ministral 8B。這些模型專為邊緣設(shè)備和本地計(jì)算設(shè)計(jì),適合在智能手機(jī)、平板電腦和物聯(lián)網(wǎng)設(shè)備上使用,目標(biāo)是實(shí)現(xiàn)低延遲和高效的 AI 推理。
1.設(shè)計(jì)與應(yīng)用
這兩款模型被稱為 "les Ministraux",由于它們體積小,非常適合本地部署,可以滿足對(duì)隱私保護(hù)的需求。例如,用戶可以在設(shè)備上進(jìn)行翻譯,使用無(wú)需網(wǎng)絡(luò)的智能助手,或者進(jìn)行本地的數(shù)據(jù)分析。Ministral 3B 和 8B 都支持長(zhǎng)達(dá) 128,000 個(gè) token 的上下文長(zhǎng)度,其中 Ministral 8B 還加入了特殊的滑動(dòng)窗口注意力機(jī)制,進(jìn)一步提升了速度和內(nèi)存效率。
2.模型特點(diǎn)
高效的邊緣計(jì)算:Ministral 3B 和 8B 針對(duì)低功耗和高效率進(jìn)行了優(yōu)化,特別適合在邊緣設(shè)備上進(jìn)行推理,如智能手機(jī)和物聯(lián)網(wǎng)設(shè)備。
功能調(diào)用能力:這兩款模型都具備強(qiáng)大的功能調(diào)用能力,能夠在多步驟任務(wù)中充當(dāng)代理,幫助管理任務(wù)分配和處理輸入,從而降低整體計(jì)算成本。
Ministral 8B 的增強(qiáng)功能:Ministral 8B 具備“交錯(cuò)滑動(dòng)窗口注意力機(jī)制”,顯著提升了推理速度和內(nèi)存利用效率,使其在處理大量上下文任務(wù)時(shí)更加高效。
可調(diào)量化支持:模型支持無(wú)損量化,可以根據(jù)具體使用場(chǎng)景進(jìn)行優(yōu)化,以確保在性能和效率之間實(shí)現(xiàn)平衡。
3.模型性能
在多任務(wù)語(yǔ)言理解評(píng)估中,Ministral 3B 和 8B 的表現(xiàn)超過(guò)了其他同類模型,如 Google 的 Gemma 2 和 Meta 的 Llama 3.2。它們的發(fā)布為那些需要本地推理和高效計(jì)算的用戶提供了新的選擇,尤其適合在移動(dòng)和邊緣設(shè)備上的應(yīng)用場(chǎng)景。
來(lái)源:AI數(shù)智圈