傳動網 > 新聞頻道 > 行業資訊 > 資訊詳情

中國信通院啟動AI大模型幻覺評測

時間:2025-03-20

來源:電子技術應用

導語:3 月 19 日消息,IT之家從中國信通院官方微信公眾號獲悉,為摸清大模型的幻覺現狀,推動大模型應用走深走實,中國信息通信研究院人工智能所基于前期的 AI Safety Benchmark 測評工作,發起大模型幻覺測試。

  3 月 19 日消息,IT之家從中國信通院官方微信公眾號獲悉,為摸清大模型的幻覺現狀,推動大模型應用走深走實,中國信息通信研究院人工智能所基于前期的 AI Safety Benchmark 測評工作,發起大模型幻覺測試。

  大模型幻覺(AI Hallucination)是指模型在生成內容或回答問題時,產生了看似合理,實則與用戶輸入不一致(忠實性幻覺)或者不符合事實(事實性幻覺)的內容。隨著大模型在醫療、金融等關鍵領域廣泛應用,大模型幻覺帶來的潛在應用風險日益加劇,正得到業界的廣泛關注。

  本輪幻覺測試工作將以大語言模型為測試對象,涵蓋了事實性幻覺和忠實性幻覺兩種幻覺類型,具體測評體系如下:

  測試數據包含 7000 余條中文測試樣本,測試形式包括對應于忠實性幻覺檢測的信息抽取與知識推理兩類題型,以及對應事實性幻覺檢測的事實判別題型。總體涉及人文科學、社會科學、自然科學、應用科學和形式科學五種測試維度。

  中國信通院邀請各相關企業參與模型測評,共同推動大模型安全應用。


AI
中傳動網版權與免責聲明:

凡本網注明[來源:中國傳動網]的所有文字、圖片、音視和視頻文件,版權均為中國傳動網(www.siyutn.com)獨家所有。如需轉載請與0755-82949061聯系。任何媒體、網站或個人轉載使用時須注明來源“中國傳動網”,違反者本網將追究其法律責任。

本網轉載并注明其他來源的稿件,均來自互聯網或業內投稿人士,版權屬于原版權人。轉載請保留稿件來源及作者,禁止擅自篡改,違者自負版權法律責任。

如涉及作品內容、版權等問題,請在作品發表之日起一周內與本網聯系,否則視為放棄相關權利。

關注伺服與運動控制公眾號獲取更多資訊

關注直驅與傳動公眾號獲取更多資訊

關注中國傳動網公眾號獲取更多資訊

最新新聞
查看更多資訊

熱搜詞
  • 運動控制
  • 伺服系統
  • 機器視覺
  • 機械傳動
  • 編碼器
  • 直驅系統
  • 工業電源
  • 電力電子
  • 工業互聯
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機界面
  • PLC
  • 電氣聯接
  • 工業機器人
  • 低壓電器
  • 機柜
回頂部
點贊 0
取消 0