手机版二维码

中文科技资讯 CWX中文科技资讯官方网站！

时事快闻

当前位置：中文科技 > 家电产品 > 正文内容

AI评测新招：让AI在《我的世界》中比拼建筑创意

时间：2025-03-22 16:24 来源：ITBEAR作者：钟景轩

在探索人工智能（AI）能力边界的过程中，传统的基准测试方法正面临挑战。为了更全面、直观地评估AI模型的能力，开发者们正转向一些非传统途径，其中，《我的世界》这款沙盒建造游戏成为了备受瞩目的测试平台。

据TechCrunch报道，一位名叫阿迪·辛格的高三学生，凭借对AI评测的独到见解，创建了名为Minecraft Benchmark（简称MC-Bench）的网站。该网站利用《我的世界》作为竞技场，让AI模型在相同的提示下生成建筑作品，并通过用户投票的方式评选出优秀作品。投票结束后，才会揭晓每幅作品的创作者——即哪款AI模型。

辛格表示，选择《我的世界》并非因为其游戏性，而是其广泛的知名度和独特的方块风格。这种风格使得即便是非玩家也能轻松分辨出哪个方块状的建筑更加逼真。“《我的世界》为我们提供了一个直观的窗口，让我们能够清晰地看到AI发展的进步。大家对这款游戏的视觉风格非常熟悉，这使得评估过程更加直接和有效。”

目前，MC-Bench网站已经吸引了8名志愿贡献者的加入。Anthropic、谷歌、OpenAI和阿里巴巴等科技巨头为该项目提供了宝贵的AI计算资源支持，尽管他们并未直接参与网站的开发工作。

辛格进一步解释说，MC-Bench目前的测试还处于基础阶段，主要用于观察AI从GPT-3时代到现在的进步。然而，他展望了未来可能的拓展方向：“我们或许可以将测试扩展到更复杂的目标导向任务和长期规划能力评估。游戏作为一种测试平台，具有安全性和可控性的优势，是评估AI智能体推理能力的理想选择。”

从严格意义上讲，MC-Bench属于编程基准测试的一种变体，因为AI模型需要编写代码来生成建筑，如“霜雪人”或“热带风情的海滨小屋”等。这种测试方式相较于传统的代码分析更具直观性，因为大多数用户更容易通过作品本身来评判AI的表现。

尽管关于这些测试结果是否能真正反映AI的实际应用价值仍存在争议，但辛格认为这些数据仍然具有重要的参考价值。“MC-Bench的排行榜与我在实际使用中的体验高度一致，这在许多传统的文本基准测试中并不常见。因此，我相信它能够帮助AI开发者判断自己是否正在朝着正确的方向前进。”

更多>同类内容

我国科研团队发布蛋白质“精准设计”大模型，开启功能“定向进化”新篇章

03-22

奇瑞星途FLY EYE车载无人机预售：6999元，一键起飞伴你行！

03-22

宇宙婴儿照曝光！ACT望远镜捕捉宇宙最早瞬间

03-22

捷途山海T2四驱荒野版顶配来袭，限时特惠仅需21.49万！

03-22

云南红河电厂：全球首台700MW超超临界CFB燃煤机组并网发电成功

03-22

复古冒险游戏《Amerzone：探险者遗产》Steam/GOG平台免费领取

03-22

惠普2025新品大爆发：60余款PC主打端侧AI，全新OmniBook系列登场

03-22

摩托罗拉Moto Watch Fit智能手表细节曝光：方形设计配5W充电

03-22

AMD发布GAIA开源AI项目，专为Windows打造本地化大语言模型运行方案

03-22

苹果Apple Arcade游戏服务未来何去何从？

03-22

《哪吒之魔童闹海》全球票房跻身前五，IP授权费跃升至900万

03-22

微软DirectX Raytracing 1.2发布：两项新技术引领实时渲染新纪元

03-22

Calibre 8.0.1重磅升级：Kobo支持强化，文件夹连接更便捷！

03-22

AMD MI355X来袭，甲骨文能否打破英伟达AI芯片市场垄断？

03-22

微软Exchange Online反垃圾邮件系统出错，用户邮件遭误隔离

03-22

点击查看更多 +

全站最新

比亚迪海鸥变身海豚Surf登陆英国，性价比能否征服欧洲市场？

比亚迪海鸥变身海豚Surf登陆英国，性价比能否征服欧洲市场？

奇瑞星途FLY EYE车载无人机预售：6999元，一键起飞伴你行！

奇瑞星途FLY EYE车载无人机预售：6999元，一键起飞伴你行！

vivo进军机器人领域，成立LAB专注家务机器人研发

vivo进军机器人领域，成立LAB专注家务机器人研发

宇宙婴儿照曝光！ACT望远镜捕捉宇宙最早瞬间

宇宙婴儿照曝光！ACT望远镜捕捉宇宙最早瞬间

捷途山海T2四驱荒野版顶配来袭，限时特惠仅需21.49万！

捷途山海T2四驱荒野版顶配来袭，限时特惠仅需21.49万！

家电以旧换新热潮！近9000万台换新，国补政策真香预警！

家电以旧换新热潮！近9000万台换新，国补政策真香预警！

热门内容

本栏最新

奇瑞星途FLY EYE车载无人机预售：6999元，一键起飞伴你行！

奇瑞星途FLY EYE车载无人机预售：6999元，一键起飞伴你行！

宇宙婴儿照曝光！ACT望远镜捕捉宇宙最早瞬间

宇宙婴儿照曝光！ACT望远镜捕捉宇宙最早瞬间

捷途山海T2四驱荒野版顶配来袭，限时特惠仅需21.49万！

捷途山海T2四驱荒野版顶配来袭，限时特惠仅需21.49万！

云南红河电厂：全球首台700MW超超临界CFB燃煤机组并网发电成功

云南红河电厂：全球首台700MW超超临界CFB燃煤机组并网发电成功

复古冒险游戏《Amerzone：探险者遗产》Steam/GOG平台免费领取

复古冒险游戏《Amerzone：探险者遗产》Steam/GOG平台免费领取

惠普2025新品大爆发：60余款PC主打端侧AI，全新OmniBook系列登场

惠普2025新品大爆发：60余款PC主打端侧AI，全新OmniBook系列登场

中文科技资讯 - 网界传媒旗下网站 / 中国（山东）自由贸易试验区 / 合作咨询微信：netspread（注明:中文科技资讯） / 鲁ICP备2022032383号
Copyright © CWX中文科技资讯 2012-2022 CWX.COM.CN All rights reserved.