火山引擎新品发布：全方位赋能企业，加速大模型应用落地

时间：2024-12-19 18:25 来源：ITBEAR作者：朱天宇

随着人工智能技术的迅猛发展，每一次技术变革都预示着行业的跃迁式进步。面对以AI为核心的新一轮技术浪潮，企业如何在技术支撑上做好准备，迎接通用人工智能时代的到来，成为了亟待解决的问题。

近日，在2024火山引擎FORCE原动力大会冬季技术主论坛上，一系列创新产品及升级方案亮相，旨在解决企业在落地大模型过程中遇到的实际难题。字节跳动基础架构负责人赵鹏伟在会上表示，为了迎接通用人工智能时代，企业需要在性价比、创新及安全等多个维度进行布局。火山引擎为此提供了AI云原生式的全链路产品服务能力，涵盖豆包大模型、大模型服务、AI基础设施、数据和安全等多个方向的新成果，致力于与企业和开发者共同推进AI的创新变革。

赵鹏伟进一步指出，过去十年中，云原生架构以其弹性、存算分离及服务化等能力，为企业构建大规模业务系统提供了有力支持。然而，随着AI时代的到来，计算模式逐渐转向以GPU为核心，传统架构难以充分发挥GPU的高算力及高带宽优势。同时，GPU在训练和推理场景中对高速互联、在线存储及隐私安全提出了更高要求。因此，火山引擎提出，下一个十年的计算范式应进入AI云原生的新时代，以GPU为核心重新优化计算、存储与网络架构，实现GPU直接访问存储和数据库，显著降低IO延迟，并提供更高规模的高速互联及端到端的安全保护。

在计算层面，火山引擎推出了新一代GPU实例，通过vRDMA网络支持大规模并行计算和P/D分离推理架构，显著提升了训练和推理效率，降低了成本。在存储方面，新推出的EIC弹性极速缓存能够实现GPU直连，使大模型推理时延降低至原来的五十分之一，成本降低20%。在安全层面，火山引擎将推出PCC私密云服务，构建大模型的可信应用体系，实现用户数据在云上推理的端到端加密，且性能优越，推理时延与明文模式相比差异在5%以内。

作为一站式大模型服务平台，火山方舟通过Cache、离线推理模式等产品升级，以及全新发布的Prompt优解，加速了大模型能力的落地。Prompt优解通过“自动+互动”的方式协助用户编写提示词，使用户在互动中表达需求，快速上手。利用机器实现类似人类的反思、类比及错误总结能力，全自动优化prompt，助力企业以低成本高效率获得高质量prompt。目前，Prompt优解已通过火山方舟全面开放公测。

火山引擎始终坚持提供更低成本、更高质量的服务。为践行“人人用得起，才是好模型”的理念，火山引擎发布了离线批量推理方案和上下文缓存，帮助用户实现更为精细化和低成本的运营。全新发布的扣子1.5和HiAgent1.5，助力企业打造AI原生应用，跨越从通用大模型到企业AI应用落地的三道鸿沟。

豆包大模型也发布了多个新版本，包括豆包·视觉理解模型、豆包·文生图模型2.1和豆包·音乐模型，这些模型可以通过扣子以插件的方式体验，有助于更多多模态AI应用的诞生。在数据智能方面，火山引擎发布了数据飞轮2.0，通过AI创新重新定义企业数据智能，全面注入大模型，带来前所未有的决策洞察。通过一体化数智研发与一站式数据智能运营，简化工作流程，快速处理结构与非结构数据资产，激发企业更多潜在数据资产，实现更大动力。

数据飞轮2.0围绕企业数据建设与数据应用的各个环节，全系产品迎来了全面实现AI创新的新阶段。同时，火山引擎发布了两大核心方案：一是Data Fabric驱动下的ChatBI智能体，使数据消费更加简单直接，通过构建完整的智能数据服务体系，打破数据“专业”壁垒，帮助企业内每个业务定制专属智能体，降低数据使用门槛，提升大模型能力下的数据反馈效率和准确率；二是多模态数据湖，拓宽数据资产的边界，实现海量结构化、半结构化及非结构化数据的统一精细化管理，全方位兼容各类数据格式，为LLM预训练、持续训练和微调提供全程支持。