添加链接
link管理
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接

【亿邦原创】2023年4月10日,商汤科技举办技术交流日活动,分享了以“大模型+大算力”推进AGI(通用人工智能)发展的战略布局,发布“日日新SenseNova”大模型体系,推出自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。

商汤大模型效果如何?近期还有哪些企业将发布大模型?大模型的落地有哪些新进展?我们一探究竟。

徐立现场演示日日新大模型

商汤大模型名为“日日新”,取自《礼记·大学》:“汤之盘铭曰:苟日新,日日新, 又日新 。”

商汤CEO徐立花大量时间演示日日新大模型下的自然语言模型“商量”如何编程、写广告词、写邀请函、创作故事、咨询财务知识/法务知识/金融知识。

在对话场景,徐立展示了“商量”如何在医疗场景中,提供负责任的对话和引导。该应用已经在新华医院落地,徐立认为,随着大语言能力的逐步的迭代和演进的话,能够做更多随访、健康咨询、互联网问诊、辅助诊疗,商汤大语言能力也会进一步推动在瑞金医院、华西医院等。

日日新研发始于2019年,目前包括五大AI应用:

自然语言模型“商量”,Slogan“商量商量,都能解决。”商量是一个1800亿参数的中文大语言模型,支持问答、理解和生成等中文语言能力,支持超长文本知识理解。

文生图模型“秒画”,定位AI内容创作平台,超10亿参数,支持二次元、三次元多种风格。2秒生成一张图。

AI数字人生成平台“如影”,由“商量”命名,取自如影随形。如影平台旨在帮助企业和个人快速高效地制作高质量的视频内容,只需要手机录制5分钟视频,消费者或企业就可以拥有一个属于自己的数字人。如影平台创作的每个数字人都经过认证,确保其不被盗用或篡改。

场景3D生成平台“琼宇”,可以实现高精度的场景生成,大场景实时渲染与互动。琼宇2天可以实现一万人一天的工作量。场景涵盖城市园区的数字孪生、建筑设计、影视创作、文旅和电商等。

物体3D生成平台“格物”,可以进行人、物、场便捷编辑创作。可以将物品生成的综合效率提升400%,综合成本降低95%,覆盖全品类室内物品。

大模型的尽头是算力,商汤还推出智算中心Sense Core,中文名“商汤AI大装置”。大装置目前有27,000块GPU,输出5000p总算力,500p的国产化算力,是亚洲最大的智算中心之一,可以同步支持20个千亿规模参数量的大模型同时训练。2022年商汤的Sense Core AI大装置已支持了超过10个大模型训练项目。

基于AI大装置SenseCore和“日日新SenseNova”大模型体系,商汤面向行业伙伴提供涵盖自动化数据标注、自定义大模型训练、模型增量训练、模型推理部署、开发效率提升等多种大模型即服务(Model-as-a-Service)。

商汤科技联合创始人、首席科学家王晓刚介绍, 基于预训练大模型的自动化数据标注可实现相较于人工数据标注近百倍的效率提升。

大模型并行训练和模型增量训练服务能够帮助客户快速利用自有数据训练模型,包括在预训练大模型之上进行垂域行业模型的开发,生产千行千面的自定义模型。

模型推理部署服务可将大模型推理效率提高100%以上,降低用模型提供服务的成本。

商汤也向行业开发人员开放大量预训练模型及AI开发工具链,全面赋能客户提升开发效率。

继续亏损,继续投入

值得注意的是,大模型需要的研发成本成为商汤亏损的根源。不久前,商汤发布2022年业绩,财报显示,商汤2022年实现营收38.08亿元,年度亏损60.92亿元。 亏损主要用于AI模型研发。

2022年,商汤集团研发支出40亿元,同比增长11%,集团研发人员3466人,占员工总数的68%。截至2022年底累计商用模型数达到了6.7万个,较前年提高了93%。

同时,商汤在2022年也取得一系列成果,包括人工智能底层基础设施SenseCore通用大装置、320亿参数量的全球最大的通用视觉模型、多个文生图大模型的训练,研发千亿参数量预训练大模型,研发一系列高效的决策智能模型,还研发了数款高性能、低功耗的AI推理芯片及AI ISP芯片。

此外,大模型研发也让商汤实现业务结构出现调整——商汤四大业务板块包括智能汽车、智慧生活、智慧商业、智慧城市,2021年,智慧商业41.7%、智慧城市45.6%、智慧生活8.8%、智能汽车3.9%,2022年变为38.4%、28.8%、25.1%、7.7%。

大模型密集发布,AI+大时代到来

在商汤发布日日新之前, 阿里云刚开始邀请用户测试类ChatGPT产品“通义千问”。

在一天前的 人工智能大模型技术高峰论坛上, 华为 介绍了盘古大模型的效果。 华为云人工智能领域首席科学家田奇表示,华为云盘古大模型推动人工智能开发从“作坊式”到“工业化”升级。

同在该论坛上,科大讯飞副总裁、研究院执行院长刘聪透露,科大讯飞“1+N认知智能大模型”将在5月6日发布。

与商汤同一天发布AI应用的还有有赞。有赞发布类ChatGPT产品加我智能,这一产品可以帮助有赞商家快速制作朋友圈、微博、小红书平台图文种草内容。

此外,各企业的大模型发布会也进入倒计时。4月11日,阿里云大模型发布会;4月14日,同花顺AI产品发布会;4月18日,阿里云行业类模型发布……

不难看出,大厂将在近期密集发布各自的大模型体系。有从业者开玩笑,模型比投资人还要多。只不过AI领域的投资逻辑一直都是“投资前置,收益后置”,投资规模大,盈利周期长。

大模型与具体行业的结合,才能形成确定性的商业模式,这也是长期投入带来的“高技术门槛,强竞争壁垒”,大模型不停留在讲故事层面,如何落地更加任重道远。