中文科技资讯 CWX中文科技资讯官方网站！

时事快闻

微软开源OmniParser，GPT-4V秒解析屏幕截图，智能新突破！

时间：2024-10-29 10:38 来源：ITBEAR作者：杨凌霄

微软近日宣布了一项重大开源项目——OmniParser，这是一款专为解析和识别屏幕上可交互图标设计的AI工具。传统自动化方法受限于HTML或视图层次结构，而现有的视觉语言模型在处理复杂GUI元素时又显得力不从心。为此，微软推出了这款纯视觉基础的工具，旨在解决当前屏幕解析技术的局限性。

OmniParser结合了可交互区域检测模型、图标描述模型和OCR模块，无需依赖HTML标签或视图层次结构等显式基础数据。这一特性使得它能够在桌面、移动设备和网页等多种平台上跨平台工作，显著提高了用户界面的解析准确性。OmniParser还能将识别出的屏幕元素转换成结构化的数据。

在实际测试中，OmniParser展现出了卓越的性能。在ScreenSpot数据集中，它的准确率提高了73%，远超依赖HTML解析的模型。同时，当GPT-4V使用OmniParser的输出后，图标的正确标记率从70.5%提升至93.8%。这些改进充分证明了OmniParser在解决当前GUI交互模型根本缺陷方面的有效性。

微软已在Hugging Face上发布了OmniParser，这一举措将有助于普及这一前沿技术，进一步推动多模态AI的发展，特别是在无障碍、自动化和智能用户辅助等领域。

更多>同类内容

微信鸿蒙原生版更新，云控解锁红包转账引关注！

10 月 29 日消息，微信鸿蒙原生版已于 10 月 12日上架鸿蒙原生应用市场，通过华为应用市场的“尝鲜专区”开启测试，该应用近日已多次放量提供下载，版本号为 1.0.0.44。博主 @Ada…

10-29

苹果iOS/iPadOS 17.7.1正式推送，专注安全修复亮点何在？

10 月 29 日消息，苹果今天发布了一系列软件更新，除了 iOS 18.1、macOS Sonoma 15.1等之外，还有可能被很多人忽视的 iOS / iPadOS 17.7.1 正式版更新，…

10-29

AT&T与康宁携手，10亿美元光纤协议达成！

10 月 28 日消息，据路透社报道，美国运营商 AT&T 于当地时间 10 月 28 日表示，已经与康宁公司达成了一项价值10 亿美元（备注：当前约 71.4 亿元人民币）的多年协议，以…

10-29

成都游戏公司新作获力挺，明末剧情游戏即将登场！

2024-10-28 18:00:53 作者：姚立伟在交流过程中，灵泽公司创始人郭心怡表示目前开发过程中遇到了一些场景设计的问题。她希望通过在游戏中更多地借鉴四川地区名胜古迹的想法，并开放更多的古迹让团队…

10-28

周鸿祎获小鹏X9，何小鹏亲交车：车友会迎新成员！

2024-10-2821:47:52作者：姚立伟周鸿祎亲自从何小鹏手中接过小鹏汽车X9的消息引起了业界的关注。此外，他还表示在拿到驾照后，很期待能亲自体验一下小鹏X9的智驾功能。他认为小鹏汽车的智能驾驶系统非…

10-28

宝马X5黑焰限量版来袭，全国限量1000台售83万！

10月28日消息，据“宝马客”公众号消息，本月中旬，宝马宣布在中国市场限量推出1000台宝马X5黑焰限量版，售价83万元。近期，这款新车开始到店并同步开启交付。注意到，宝马X5黑焰特别版整车采…

10-28

大眼橙C1D高亮版上新！1080P仅1499元，700流明够亮吗？

10 月 28 日消息，大眼橙在 10 月 25 日发布了 C1D 高亮版投影仪，目前这款投影仪已上架京东，其主打“1080P 700流明”，将于 10 月 31 日开售，首发价 1499 元。 …

10-28

京东物流牵手天猫后，菜鸟紧跟接入，两大平台互通新时代！

快科技10月28日消息，继京东物流接入淘宝天猫之后，近日，菜鸟也全面接入京东平台，为商家和消费者提供全球快递和全球供应链服务，双方系统已基本完成对接。菜鸟的自营快递—菜鸟速递、菜鸟大件家装供应链等都在接入之…

10-28

比亚迪SHARK 6电动皮卡东南亚首秀，柬埔寨市场正式上市！

10月28日消息，比亚迪于10月26日在柬埔寨举办了全新电动皮卡比亚迪SHARK6的发布会，并推出了比亚迪的DM技术（插电式混合动力技术）。▲图源比亚迪，下同据报道，比亚迪于今年5月在墨西哥首…

10-28

众擎机器人新作亮相：全尺寸通用人形机器人SE01登场！

10 月 28 日消息，深圳市众擎机器人科技有限公司于 10 月 24 日发布了其首款全尺寸通用人形机器人 SE01。众擎对SE01 的主定位为工业机器人，这台通用智能体身高 170cm，体重约…

10-28

华勤技术2024Q3营收达366.1亿，同比增长45.4%

10 月 28 日消息，华勤技术昨晚披露了 2024 年第三季度业绩报告。报告显示，2024 年前三季度，该公司实现营业收入760.1 亿元，同比增长 17.2%，净利润 20.5 亿元，同比增长…

10-28

《最后生还者3》缺艾比引热议，作者有何应对策略？

2024-10-28 16:00:26 作者：姚立伟在《最后生还者2》中，艾比与艾莉展开了激烈的对抗，最终艾莉选择了宽恕艾比并和她一起乘坐小船出海。最近，有媒体指出如果《最后生还者3》没有艾比和勒弗将会是…

10-28

荣耀手表5新上架！方形设计三色可选，10月30日见！

其设计延续了荣耀手表4的方形风格，并配备了旋钮表冠，内置MagicOS操作系统。 - 电池：480mAh电池，支持磁吸触点充电，在官方测试中续航时间约为15天此外，手表还配备有旋钮设计的表冠，并支持智能振动反…

10-28

生存游戏新境界：无战斗也能挑战高难度？

近日，国外知名游戏媒体盘点了8款没有战斗元素的最佳生存游戏。其中，《冰汽时代》和《这是我的战争：最终剪辑版》等游戏入选榜单。这8款生存游戏中并没有过多的战斗元素，更多地考验玩家对于资源管理、建设和生存策略的…

10-28

苹果M5芯片即将亮相！新款iPad Pro或将同步发布？

与此同时，根据Mark Gurman在其最新专栏文章中的透露，苹果可能会在2025年底发布M5芯片，并有可能同期推出新的iPadPro系列。考虑到这一变化，预计下一代M5芯片也将由iPad Pro率先搭载。…

10-28

点击查看更多 +

全站最新

中国载人月球车初样研制启动，两款并行比测谁更优？

华为Mate 70 RS镜头盖亮相：八边形设计成真！

Linux之父批AI泡沫：九成皆为营销噱头？

《勇敢者游戏3》定档2026，影迷期待再掀冒险狂潮！

小米SU7 Ultra量产版亮相，年轻人的超跑梦成真？

微软指责谷歌：误导监管与公众，涉嫌诋毁引争议

热门内容

本栏最新

微软开源OmniParser，GPT-4V秒解析屏幕截图，智能新突破！

微信鸿蒙原生版更新，云控解锁红包转账引关注！

苹果iOS/iPadOS 17.7.1正式推送，专注安全修复亮点何在？

成都游戏公司新作获力挺，明末剧情游戏即将登场！

大眼橙C1D高亮版上新！1080P仅1499元，700流明够亮吗？

京东物流牵手天猫后，菜鸟紧跟接入，两大平台互通新时代！