自国产开源大模型DeepSeek问世以来,创新的模型架构及强大的推理能力使其迅速在政务、金融、教育、医疗等领域广泛应用,加速了大模型普惠化进程。尽管DeepSeek凭借混合专家架构(MoE)及算法优化大幅降低了用户应用开发成本,但百亿级推理参数量依旧需要用户通过服务器集群为其提供海量显存,因此不仅用户现有IT基础设施难以为DeepSeek提供理想的硬件支持,即便是中、小规模云服务商也难以为DeepSeek规模化落地提供充足“弹药”。
作为由中国移动自主建立的运营商云,移动云拥有得天独厚的资源建设能力。针对人工智能技术规模化落地过程中智算算力紧缺问题,移动云以“N+X”布局不断加速智算中心建设,先后在全国各地上线13个智算中心节点,智算算力规模高达28.6EFlops。在DeepSeek上线后,移动云基于自研算力原生平台,全面接入了DeepSeek,并能以云主机、裸金属服务器、智算一体机三大核心弹性计算产品,为用户各类业务场景下部署DeepSeek提供了多样化算力解决方案。
GPU云主机——灵活、弹性的轻量级DeepSeek部署方案
作为当下炙手可热的大模型,DeepSeek巨大的访问需求量导致用户调用服务时经常遇到宕机、网络繁忙等情况,而选择第三方API服务时也存在调用次数限制及数据安全隐患。同时,自建IT设施部署DeepSeek又存在投入成本高,资源利用率低,部署技术难度大等问题。
为推动大模型应用规模化落地,移动云基于异构计算架构打造了COCA算力原生平台,该平台能够无缝兼容英伟达A800、A100、T4、V100,华为910B,昆仑芯P800等六大主流算力生态,并能通过加速套件、集合通信库、推理加速引擎等自研软件栈为用户提供训推加速、参数优化等核心能力。基于此,移动云能够以GPU云主机、裸金属服务器、智算一体机三大核心弹性计算产品为用户部署、应用DeepSeek提供多样化算力支撑。
针对中小企业部署DeepSeek需求,移动云GPU云主机具有单卡即可开通的灵活规格设计,其GPU实例支持分钟级弹性扩容,因此能够为用户提供高性价比算力方案并助力用户灵活应对业务流量洪峰。此外,移动云GPU云主机可提供集成了DeepSeek模型的公共镜像及各类配置工具,用户既可根据自身需求自主配置DeepSeek应用,也可通过一键开箱服务快速体验DeepSeek,抢占AI先机。
裸金属服务器——专属算力服务充分释放大模型应用潜能
投入应用以来,DeepSeek强大的推理能力与语义解析能力有力地推动了数据治理、数据分析等业务的革新。但此类业务对IT设施性能和安全都提出了极高的要求。为此,移动云通过裸金属服务器为用户部署DeepSeek提供了高性能算力方案,以应对金融风险预测、基因测序、医疗影像分析等大规模计算业务。
移动云裸金属服务器是一种可弹性扩展的专属计算服务,其支持用户独占服务器的全部计算资源,因此能够避免虚拟化开销,为用户提供更加强劲的计算性能,并以物理级安全隔离保障数据安全。此外,该服务具有超低的网络时延,数据传输更加高效,因此能够满足8卡以上大规模计算类业务对IT基础设施高性能、安全性和稳定性的使用诉求,助力用户充分释放大模型应用潜能。
智算一体机——一站式支撑AI应用本地部署
随着DeepSeek持续落地应用,政务、金融、制造、教育、医疗等行业领域逐步深化AI应用与自身业务的融合,用户侧对AI算力的效率、成本、供给方式等建设需求不断提升。为满足用户本地推理需求,降低AI应用部署难度,移动云基于边缘智能小站服务,为用户打造了边缘专属服务——智算一体机。
移动云智算一体机采用本地化部署,不仅能够以独享的计算、存储、网络资源满足用户AI应用部署、推理等需求,同时还能以私有化AI平台满足政务服务、工业制造、金融等行业级用户数据不出场、安全合规等“高阶”要求。不仅如此,该服务深度集成了DeepSeek满血版、蒸馏版等模型及成熟的行业智能体,并内置了模型微调、模型推理、知识库构建、智能体编排等丰富的工具,因此能够助力用户一站式构建个性化AI应用,打造智能化转型升级“加速器”。
在DeepSeek等通用大模型日趋成熟之际,AI应用也正式迈向规模化应用之路。不难预测,未来经济社会对算力的使用需求将逐步从大模型训练向AI应用推理转变,算力服务也将逐步多元化发展。而移动云作为云计算“国家队”,将不断加速智算中心建设,完善智算服务体系,以云主机、裸金属、智算一体机乃至智算集群等弹性计算服务为千行百业数智化转型提供有力支撑。
版权声明
本文来自投稿,不代表蓝鲸日报立场,如若转载,请注明出处:www.lanjing.org