手机版二维码

中文科技资讯 CWX中文科技资讯官方网站！

时事快闻

当前位置：中文科技 > APP应用 > 正文内容

Hugging Face新推SmolVLM AI模型，20亿参数助力设备端高效推理

时间：2024-11-27 14:18 来源：ITBEAR作者：苏婉清

Hugging Face平台近期在科技界掀起波澜，发布了一款名为SmolVLM的AI视觉语言模型（VLM），这款模型以其精简的20亿参数设计，专为设备端推理打造，凭借超低的内存占用，在众多同类模型中独树一帜。

SmolVLM AI模型的核心优势在于其小巧的体积、惊人的处理速度以及高效的内存利用。更重要的是，该模型完全开源，所有相关的模型检查点、VLM数据集、训练配方和工具，均在Apache 2.0许可证下向公众开放。

SmolVLM提供了三个版本以满足不同需求：SmolVLM-Base，适用于下游任务的微调；SmolVLM-Synthetic，基于合成数据进行微调；以及SmolVLM-Instruct，这是一个指令微调版本，可直接应用于交互式应用中。

该模型在架构设计上的巧妙之处，是其借鉴了Idefics3的理念，并采用了SmolLM2 1.7B作为语言主干。通过创新的像素混洗策略，SmolVLM将视觉信息的压缩率提升了9倍，从而实现了更高效的视觉信息处理。

在训练数据集方面，SmolVLM涵盖了Cauldron和Docmatix，并对SmolLM2进行了上下文扩展，使其能够处理更长的文本序列和多张图像。这一优化不仅提升了模型的性能，还有效降低了内存占用，解决了大型模型在普通设备上运行缓慢甚至无法运行的问题。

在内存使用方面，SmolVLM展现出了卓越的能力。它将384x384像素的图像块编码为81个tokens，这意味着在相同的测试图片下，SmolVLM仅需使用1200个tokens，而相比之下，Qwen2-VL则需要1.6万个tokens。这一显著的内存节省，使得SmolVLM在设备端推理上更具优势。

在性能表现上，SmolVLM同样令人瞩目。它在多个基准测试中，如MMMU、MathVista、MMStar、DocVQA和TextVQA等，均展现出了出色的处理能力。与Qwen2-VL相比，SmolVLM在预填充吞吐量上快了3.3到4.5倍，而在生成吞吐量上更是快了7.5到16倍。

这款创新模型的发布，无疑为AI视觉语言模型领域带来了新的活力和可能性。随着SmolVLM的广泛应用和深入发展，我们有理由期待它在未来能够发挥更大的作用，为人工智能技术的发展贡献更多的力量。

更多>同类内容

七部门联手！医疗机构检查检验结果将实现全国互认

11-27

真我Neo7性能爆棚，起售价竟不到2500元？

11-27

何小鹏：特斯拉FSD入华将促进行业发展，小鹏华为或迎正面机遇

11-27

蔚来“萤火虫”内饰抢先看：简约悬浮风，主副驾竟能“牵手”？

11-27

惠普Prodesk 600 G4升级Win11 24H2遇音频失效问题？用户求解

11-27

科学家突破！高功率阿秒X射线脉冲，兆赫兹频率下实现无损探测

11-27

超薄iPhone 17 Air来袭，但你必须接受的五大规格缩水

11-27

2025 IEEE ISSCC日程揭晓：三星等巨头将展示最新存储技术突破

11-27

PlayStation老将吉田修平宣布2025年从索尼退休，31载光阴见证游戏变迁

11-27

纵目科技回应薪资调整：正常运转，薪资短期调整后将补偿

11-27

华为Mate 70系列新成员亮相，UFCS融合快充协议再添新军

11-27

AMD ROCm 6.3重磅更新：加速AI推理，Fortran编译器亮相

11-27

5G规模化应用提速！三年内个人用户普及率目标超85%

11-27

一加Ace 5系列曝光：1.5K直屏+短焦指纹，充电功率最高达100W？

11-27

Neuralink新试验：瘫痪患者或可通过脑机接口控制机械臂

11-27

点击查看更多 +

全站最新

保时捷员工与货拉拉司机搬运费纠纷，货拉拉称未封号处理

保时捷员工与货拉拉司机搬运费纠纷，货拉拉称未封号处理

国产手机电池容量飙升，7000mAh时代即将到来，为何越来越大？

国产手机电池容量飙升，7000mAh时代即将到来，为何越来越大？

长虹百寸巨幕电视100Q10T Max上市，XDR Mini LED仅售19997元！

长虹百寸巨幕电视100Q10T Max上市，XDR Mini LED仅售19997元！

特斯拉Cybertruck入华在即，专为中国市场打造新方案引期待

特斯拉Cybertruck入华在即，专为中国市场打造新方案引期待

黄仁勋获港科大荣誉博士，抽奖送4060 Ti显卡引网友热议

黄仁勋获港科大荣誉博士，抽奖送4060 Ti显卡引网友热议

中国移动小面额话费充值服务在多地微信支付宝下架

中国移动小面额话费充值服务在多地微信支付宝下架

热门内容

本栏最新

PS5 Pro SSD升级引热议：速度提升还是色彩更佳？

PS5 Pro SSD升级引热议：速度提升还是色彩更佳？

Netflix撤下AI疑云《英雄联盟：双城之战》海报，引发热议

Netflix撤下AI疑云《英雄联盟：双城之战》海报，引发热议

《Braise》奇幻冒险登陆Steam，2025年第一季玩家可探索龙谷谜团

《Braise》奇幻冒险登陆Steam，2025年第一季玩家可探索龙谷谜团

《黑神话：悟空》金摇杆奖夺冠，国内外玩家意见不一

《黑神话：悟空》金摇杆奖夺冠，国内外玩家意见不一

2024金摇杆奖揭晓：《最终幻想7重生》等佳作斩获多项大奖

2024金摇杆奖揭晓：《最终幻想7重生》等佳作斩获多项大奖

雷神银翼F60投影仪预售，搭载海思处理器，原生1080P仅售1499元！

雷神银翼F60投影仪预售，搭载海思处理器，原生1080P仅售1499元！

中文科技资讯 - 网界传媒旗下网站 / 中国（山东）自由贸易试验区 / 合作咨询微信：netspread（注明:中文科技资讯） / 鲁ICP备2022032383号
Copyright © CWX中文科技资讯 2012-2022 CWX.COM.CN All rights reserved.