手机版二维码

中文科技资讯 CWX中文科技资讯官方网站！

时事快闻

当前位置：中文科技 > 手机游戏 > 正文内容

中国信通院开启大模型幻觉测试，涵盖人文社科等五大维度

时间：2025-03-19 16:50 来源：ITBEAR作者：冯璃月

近日，中国信息通信研究院（中国信通院）通过其官方微信公众号发布了一项重要举措，旨在深入探索大型人工智能模型（大模型）的“幻觉”现象，并推动其在实际应用中的安全与可靠性。该举措基于前期AI Safety Benchmark的测评经验，正式启动了针对大模型的幻觉测试项目。

所谓大模型幻觉（AI Hallucination），是指当这些模型在生成文本或回答问题时，可能会创造出看似合理但实际上与用户输入不符（即忠实性幻觉）或违背事实（即事实性幻觉）的内容。随着大模型在医疗、金融等关键行业的广泛应用，这种幻觉现象所带来的潜在风险日益凸显，引起了业界的广泛关注。

本次幻觉测试主要针对的是大语言模型，测试内容涵盖了忠实性幻觉和事实性幻觉两大类型。为了全面评估这些模型，测试数据包含了超过7000条中文测试样本，测试形式则分为信息抽取、知识推理（针对忠实性幻觉）以及事实判别（针对事实性幻觉）等题型。测试维度广泛，涵盖了人文科学、社会科学、自然科学、应用科学和形式科学等多个领域。

具体来看，测试体系的设计旨在通过多样化的题型和丰富的测试样本，准确捕捉大模型在不同情境下的幻觉表现。这不仅有助于揭示模型潜在的缺陷，也为后续的优化和改进提供了重要依据。

为了推动大模型的安全应用，中国信通院诚挚邀请相关企业积极参与此次模型测评。通过共同的努力，旨在提升大模型的准确性和可靠性，降低幻觉现象带来的应用风险。

中国信通院还强调了测试工作的重要性，指出这不仅是对大模型性能的一次全面检验，更是推动人工智能领域健康发展的重要一环。通过持续的测试和评估，将有助于提高整个行业对大模型幻觉现象的认识和应对能力。

更多>同类内容

2025清明假期购票攻略及全年节假日安排出炉！

03-19

苹果自研5G芯片C2将亮相iPhone 18 Pro，通信性能再升级

03-19

豆包编程大升级：HTML实时预览，Python一键执行，轻松打造小游戏

03-19

乐高宝可梦积木套装2026年来袭，皮卡丘尾巴抢先曝光！

03-19

《刺客信条：影》M站评分揭晓，PC版78分，IGN评价褒贬不一

03-19

宝马新世代车型来袭！超感智控方向盘配主动触觉反馈技术

03-19

ID@Xbox助力独立游戏：50亿美元打造开发者经济保障梦工厂

03-19

乐道L60智能钥匙3月24日发售，已提车车主专享339元特惠！

03-19

Mistral Small 3.1发布：240亿参数，本地运行高效，性能超GPT-4o mini

03-19

联想AMD大会上预告：5月创新科技大会将亮相神秘“人形机器人”？

03-19

微软50周年复古壁纸上线，丑萌设计唤醒你的怀旧情怀！

03-19

隆平高科与深开鸿联袂，共筑农业开源鸿蒙生态，开启数字农业新篇章

03-19

Win11预览版新特性曝光：配置答疑区域助力用户了解性能影响

03-19

华硕无畏Pro14酷睿版京东开约，国补优惠至4879元，配置强劲引关注！

03-19

科学新突破！科学家首次捕获含锫有机金属分子“锫茂”

03-19

点击查看更多 +

全站最新

Meta Llama模型下载量破10亿，扎克伯格展望AI未来新蓝图

Meta Llama模型下载量破10亿，扎克伯格展望AI未来新蓝图

OPPO Find X8s力压iPhone 16 Pro：轻薄设计，相机更平，智能按键抢镜

OPPO Find X8s力压iPhone 16 Pro：轻薄设计，相机更平，智能按键抢镜

特斯拉Autopilot挑战泡沫墙，竟直接撞穿引争议！

特斯拉Autopilot挑战泡沫墙，竟直接撞穿引争议！

我国首发职业主播标准：三级划分品德失信一票否决

我国首发职业主播标准：三级划分品德失信一票否决

联想moto小折叠手机再夺冠，AI至尊版即将来袭引热潮！

联想moto小折叠手机再夺冠，AI至尊版即将来袭引热潮！

TCL科技圆满收官：成功并购LGDCA与LGDGZ，半导体显示版图再扩张！

TCL科技圆满收官：成功并购LGDCA与LGDGZ，半导体显示版图再扩张！

热门内容

本栏最新

2025清明假期购票攻略及全年节假日安排出炉！

2025清明假期购票攻略及全年节假日安排出炉！

苹果自研5G芯片C2将亮相iPhone 18 Pro，通信性能再升级

苹果自研5G芯片C2将亮相iPhone 18 Pro，通信性能再升级

乐高宝可梦积木套装2026年来袭，皮卡丘尾巴抢先曝光！

乐高宝可梦积木套装2026年来袭，皮卡丘尾巴抢先曝光！

《刺客信条：影》M站评分揭晓，PC版78分，IGN评价褒贬不一

《刺客信条：影》M站评分揭晓，PC版78分，IGN评价褒贬不一

宝马新世代车型来袭！超感智控方向盘配主动触觉反馈技术

宝马新世代车型来袭！超感智控方向盘配主动触觉反馈技术

乐道L60智能钥匙3月24日发售，已提车车主专享339元特惠！

乐道L60智能钥匙3月24日发售，已提车车主专享339元特惠！

中文科技资讯 - 网界传媒旗下网站 / 中国（山东）自由贸易试验区 / 合作咨询微信：netspread（注明:中文科技资讯） / 鲁ICP备2022032383号
Copyright © CWX中文科技资讯 2012-2022 CWX.COM.CN All rights reserved.