近日,在华为全联接大会2024(HUAWEI CONNECT 2024)期间,华为云举办以“AI Native Cloud 全新为AI负载和应用设计的云基础设施”为主题的专题论坛。论坛上,华为云携手来自各行业的 AI 创新先锋企业,共同探讨AI在相关行业的前沿应用和未来发展。多家行业领军企业,包括徐工集团、网易伏羲、墨境天合、金山办公、网智天元等应邀出席,并分享了他们在各自领域的 AI 创新成果。这些行业领袖的分享不仅展示了 AI 技术在各个领域的广泛应用,也为与会者提供了宝贵的实践经验和创新思路。
华为云首席产品官方国伟:AI Native Cloud 全栈系统性的持续创新
当前,全新一代的AI技术将驱动全行业进一步加速数字化、智能化升级已成为产业共识。随着人工智能进入大模型时代,云基础设施所面临诸多挑战。
华为云首席产品官 方国伟
方国伟以业界趋势和华为云自身实践,总结出AI时代的云基础设施面临五大关键挑战,包括AI算力资源建设与管理挑战、极致性能与成本挑战、稳定性与快速恢复挑战、工具链完备性与易用性挑战、大模型安全风险挑战。
针对云基础设施面临的五大挑战,为了更好的支撑AI模型和应用生于云、长于云。方国伟提出,华为云AI原生云基础设施围绕五大方面持续创新“全景算力、高性价比、稳定可靠、开箱即用、安全可信”。
1.全景算力:华为云将算力平台从传统的单体、通用算力,升级到基于CloudMatrix的下一代AI原生云算力平台,通过全栈系统性设计,突破算力边界和网络边界,为客户提供一切可池化、一切皆对等、一切可组合的云矩阵算力。同时,进一步推进全场景分布式云的构建,让算力可以无处不在,并实现全局调度。
2.高性价比:华为云首创EMS弹性内存存储服务,在NPU显存和持久化存储两层间增加弹性内存存储层。基于Memory Pooling专利技术,通过显存扩展、算力卸载、以存代算三大创新来打破内存墙。
3.稳定可靠:华为云昇腾AI云服务,通过搭建覆盖全链路场景的可观测性和可靠性管理方案,实现故障可诊断、可衡量、可恢复。华为云已实现千卡集群长稳训练40天以上,故障自动恢复,无需人工介入,故障端到端恢复时长小于30分钟。下一步华为云还将持续优化,预计24年底端到端故障恢复时长将降低至 10 分钟以内。
4.开箱即用:为了方便客户获取和使用AI算力,更好的基于百模千态进行业务创新,华为云全新升级了ModelArts Studio,聚焦优质大模型全场景性能精度提升,构建云上大模型一站式模型开发托管服务,践行大模型即服务MaaS(Model-as-a-Service)理念。同时,华为云基于OBS对象存储服务之上提供了构建了实现语义向量化的知识湖存储,简化客户针对海量非结构化数据实现RAG方案的难度。读、写、算分离,千亿数据毫秒级查询,成本降低50%。
5.安全可信:人工智能进入大模型时代,引入了新的攻击面,平台、插件、环境、工具链等都面临新的威胁风险,结合安全权威机构OWASP的总结及华为的自身实践,从全栈和大模型生命周期关键阶段视角看大模型安全风险,总结了四大安全风险,包括:基础运行环境安全风险、训练数据安全风险、模型内生安全风险、内容应用安全风险。针对大模型四大安全风险,华为云推出4+1大模型安全解决方案。
最后,方国伟总结到:“华为云在过去数年中专注于云基础设施的全栈系统性创新,为即将到来的企业智能化浪潮做好了充分准备。今天,向大家分享了华为云AI原生云基础设施在‘全景算力、高性价比、稳定可靠、开箱即用、安全可信’等五个关键维度所取得的重大突破。华为云的愿景是让 AI 业务在云端蓬勃发展,为客户提供持续创新的沃土,助力客户在这个 AI 驱动的新世界中保持领先地位。”
徐工研究总院高明博士:徐工工程机械AI战略与实践
在制造领域,徐工集团作为中国工程机械产业的奠基者、开创者、引领者,是全球工程机械行业领先品牌。徐工研究总院作为徐工集团的核心研发机构,是中国工程机械前沿技术研究的主阵地,探索工程机械AI战略布局与应用。
徐工研究总院 高明博士
徐工研究总院的高明博士,为我们揭示了AI技术在制造业中的挑战与机遇、应用与实践,讲述了徐工集团在AI领域的研究与应用实践,并指出华为云作为其坚实的合作伙伴,自2019年起便与徐工集团在高性能计算(HPC)和人工智能大模型领域展开了深入的合作。目前已广泛应用于产品开发、研发创新等业务领域,并在四大关键场景:自主施工场景、自动驾驶场景中、自主作业场景、工程机械垂直领域大模型场景,取得了显著成效。
展望未来,徐工集团与华为云将继续携手合作,充分发挥云计算的优势,全面赋能集团的业务发展,共同开创制造业的新篇章。
网易伏羲语音技术负责人莫名:AI x 游戏,可实时语音交互的游戏队友
作为中国首个游戏人工智能实验室,网易伏羲自成立以来就持续在探索AI技术在游戏行业的落地场景及能力边界。今年,网易伏羲推出了全球首创的游戏Copilot AI队友,为玩家带来丝滑的多模态游戏交互体验。其中,为了实现近乎真人的问答效果,时延成了一大挑战。
网易伏羲语音技术负责人 莫名
网易伏羲语音技术负责人莫名在演讲中表示,“我们与华为云联合创新,在伏羲的多轮对话和公共前缀场景使用EMS内存存储进行体验优化,真正地做到了以存强算,让Copilot AI队友可以实现如真人般的流畅对话。”测试结论显示了4大优化:
1.更大的容量,有了EMS,算力卡可以搭配TB级的虚拟显存。
2.更高的吞吐,测试结果显示,QPS请求数提升了40%。
3.更低的时延,EMS使能首字节时延降低84%。
4.更高的效率,P95时延降低了32%。
墨境天合AI算法工程师负责人李晨阳:AI x 视效制作,探索人工智能在影视制作中的应用与突破
近年来国产制作的科幻电影持续火爆,让大家看到了国内CG(计算机图形学)技术的日新月异。作为国内头部的电影视效公司,墨境天合创新地将大语言模型及图像模型应用到视效制作中。
墨境天合AI算法工程师负责人 李晨阳
墨境天合AI算法工程师负责人李晨阳表示:“在剧本拆解、镜头规划场景中,墨境天合使用AI辅助加速传统人工工作内容,显著提升了视效制作效率。在剧本拆解应用中,将剧本内容作为同样的文本多次输入,受显存限制,每一轮与LLM的交互均需重新计算,越问越慢,且剧本内容越长,对时延的影响越大。我们与华为云存储进行了联合创新测试,结果显示:使用EMS后首字节时延降低了75%,吞吐量增加了22%,大大提高了剧本拆解和镜头规划工具应用的效率。”
金山办公助理总裁朱熠锷:AI x 办公,WPS AI高效智慧办公助力企业提效
WPS AI是金山办公旗下基于大语言模型的人工智能办公助手,锚定AIGC(内容创作)、Copilot(智慧助理)、Insight(知识洞察)三个战略方向发展。如果把大模型比做发动机,那么企业知识就是燃料。为了更好地搭建企业知识与大模型之间的桥梁,金山办公提出了AI Docs智能文档库解决方案,使能全程闭环的可控智能。
金山办公助理总裁 朱熠锷
金山办公助理总裁朱熠锷在演讲中指出:“今天的企业AI知识库,仍然面临众多的技术挑战。其中如何支持千亿规模的文档量级、在大并发请求的同时保持高效检索、消减数据幻觉是数据存储面临的挑战。为了解决传统向量数据库明显的读写性能和成本问题。AI Docs目前在和华为云OBS知识湖存储进行共创,探索能够支持更大规模的文档量级、检索更精准、速度更快的使用体验,给企业AI提供更好的赋能。”
网智天元创始人莫倩:AI x 金融,盘古开天,金鹏展翅,金融大模型的行业实践
在金融领域,北京网智天元大数据科技有限公司以其在金融大模型领域的卓越成就,引领着金融行业大数据智能的创新潮流。该公司致力于挖掘大数据的深层价值,为个人、组织以及企业带来网络智能生活的全新体验。
北京网智天元大数据科技有限公司创始人 莫倩
网智天元的创始人莫倩强调,金融大模型的训练关键在于数据的专业度、训练的深度、专业场景的适应能力以及全自研AI基础设施的构建。网智天元拥有高质量的数据要素和一站式的大模型训练研发平台,构建了一个全方位、多层次、穿透式的金融风险信息管理全流程框架。在基础设施层面依托华为云,实现了多维度数据处理性能的显著提升。在云服务应和运维方面,成功实现了成本降低30%。在此基础上,网智天元开发了高质量的多模态金融大模型——WiseGPT,并推出了四大主力产品:金鹏——专注于风险管控;星图——知识管理的专家;战鹰——关联挖掘的先锋;银河——智能感知的领航者。这些产品共同赋能三大应用场景:运营助手、数据资产、风控报告,为金融行业的智能化转型提供了强有力的支持。
展望未来,网智天元计划基于华为云下一代基础设施CloudMatrix进行联合创新,以支撑大模型训练效率的提升(预计提升68%以上)。在产品层面打造金融大模型一体机,基于华为云CloudPond的昇腾AI算力,为客户提供了本地金融业务智能化的一站式解决方案。网智天元在金融大模型领域的创新之路将更加宽广,为金融行业的智能化发展贡献更多的智慧和力量。
华为云AI原生云基础设施通过在“全景算力、高性价比、稳定可靠、开箱即用、安全可信”等五个关键维度的持续创新,使企业能够将最先进的AI技术无缝集成到其核心业务中,更好支撑企业AI业务的创新生于云、长于云。