久久久91-久久久91精品国产一区二区-久久久91精品国产一区二区三区-久久久999国产精品-久久久999久久久精品

ABB
關注中國自動化產業發展的先行者!
CAIAC 2025
2025工業安全大會
OICT公益講堂
當前位置:首頁 >> 資訊 >> 行業資訊

資訊頻道

邊側大模型基準測試:政務大模型初探
  • 點擊數:457     發布時間:2025-03-10 17:14:04
  • 分享到:
隨著大模型進入應用時代,針對個性化、合規、實時性需求,邊側大模型服務成為大趨勢。其中,政務大模型是最為典型的邊側大模型行業應用之一。

中國科學院大學 陳孟卓

華為云 鄭子木

摘要:隨著大模型進入應用時代,針對個性化、合規、實時性需求,邊側大模型服務成為大趨勢。其中,政務大模型是最為典型的邊側大模型行業應用之一。在各地政府,政務領域應用該模型能推進業務辦理智能化,幫助政府機構提升處理效率和服務質量。然而,現有大模型基準測試大多集中于評估模型的通用能力或者特定學科任務的性能,而對于模型在特定行業中的應用能力,例如處理政務的能力評測方面,卻缺乏相應的評測數據集。為填補這一空白,本文提出了一種新的中文政務理解基準測試(A Chinese Government Affairs Understanding Evaluation Benchmark,CGAUE)。本基準是開放、社區驅動的,不僅包含對模型的客觀能力測試集,還提供對模型主觀能力的測試集。具體來說,本基準旨在評估大模型在處理政務相關任務時的表現,包括但不限于對外部知識的利用以及對實際市民問題的響應能力,更真實地反映模型在實際政務場景中的應用效果。此外,本文還提出了一種新的測試集參考格式。該格式在大模型領域具有通用性和兼容性,可促進不同測試集的相互交換、集成和處理,以及不同模型之間的比較和評估,推動了大模型評測產業發展。總的來說,本工作通過構建全新的中文政務理解評估基準和評測數據集參考格式,推動了大模型在實際政務領域的應用和評測。這不僅有助于提高模型在行業中的實用性,也為大模型的研究和開發提供了新的方向和挑戰。

關鍵詞:大模型;基準測試;政務大模型

在線預覽:邊側大模型基準測試:政務大模型初探.pdf

摘自《自動化博覽》2025年2月刊

熱點新聞

推薦產品

x
  • 在線反饋
1.我有以下需求:



2.詳細的需求:
姓名:
單位:
電話:
郵件:
主站蜘蛛池模板: 天天干影院 | 国产理论自拍 | 国产三级黄色 | 国产精品免费看久久久麻豆 | 国产精品爱久久久 | 国产下药迷倒白嫩美女网站 | 91久久精品在这里色伊人6882 | 国产欧美日韩三级 | 国产日本亚洲欧美 | 成人免费网址在线 | 亚洲精品一区久久狠狠欧美 | 性感美女香蕉视频 | 精品国产免费第一区二区 | 黄色影院免费 | 黄色一级片中国 | 91影视在线看免费观看 | 国产成人自拍在线 | 日韩中文字幕一在线 | 国产高清一区二区三区四区 | 沈樵在线观看国产专区 | 99久久精品国产亚洲 | 精品国产亚洲一区二区在线3d | 国产综合久久久久久 | 欧美精品区 | 青草视频久久 | 国产精品1区2区 | 日本一级成人毛片免费观看 | 国产日韩亚洲欧洲一区二区三区 | 毛片免费观看的视频在线 | 日本一级二级三级久久 | 黄色a级网站 | 国产欧美日本亚洲精品一4区 | 国产美女自拍 | 国产91激情对白露脸全程 | 国产码欧美日韩高清综合一区 | 奶茶视频污 | 日本亚州视频在线八a | 成免费网站| 91精品欧美一区二区综合在线 | 国产区香蕉精品系列在线观看不卡 | 中文字幕亚洲欧美 |