添加链接
link管理
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接
相关文章推荐
还单身的烈马  ·  win10 ...·  3 月前    · 
坚强的南瓜  ·  Power BI与Excel ...·  4 月前    · 
痴情的墨镜  ·  Getting "Unsupported ...·  6 月前    · 
快乐的板凳  ·  Apache POI Word - Style·  10 月前    · 

21世纪经济报道见习记者肖潇 北京报道

就在圣诞前夕,OpenAI CEO 山姆·奥特曼在社交平台上送出了一份“圣诞礼物”:2024年的OpenAI愿望清单。

这份清单来自奥特曼在12月24日向网友征集的回答“你希望Open AI明年能完成哪些事情?”奥特曼除了否认AGI通用人工智能的请求(在旁边备注着:还需要更多耐心),对其他请求并没有作出额外评价。

在这12项发展目标中,开源也许是最引人关注的一项。虽然OpenAI一直在推进开源项目——语音识别模型Whisper、文生3D模型Shap-e、解码器Consistency Decoder,但它们都不是ChatGPT。而此次回应似乎暗示着,公众翘首以盼的GPT开源模型正在提上日程。

作为自称“开放AI”的OpenAI,自GPT-3不再公开源代码以来,一直面临开源压力。这种压力一面来自竞争对手Meta、法国黑马公司Mistral AI为开源大模型的造浪,另一面则来自监管侧对开源大模型的宽容态度。而ChatGPT坚持闭源的一个官方理由是:为了安全。

开源不仅仅是OpenAI头顶盘旋的幽灵,也是业内众说纷纭的一道安全选择题。大模型开源意味着什么?开源、闭源大模型能否在安全性上一分高下?

OpenAI的开源压力

尽管大模型前期发展由闭源大模型主导,但开源军团来势汹汹。

如果回看大模型的开源浪潮,能发现两个明显的分水岭:一个是2022年11月,闭源大模型产品ChatGPT向公众开放。根据同济大学法学院助理教授、上海市人工智能社会治理协同创新中心研究员朱悦的观察, 在ChatGPT流行之前,更多时候开源是默认,不开源才是例外。随着GPT的发展,整个 AI 领域变得更加商业化,情况有了明显变化。

另一个则是今年7月,Meta的开源大模型Llama 2公开商用,开源大模型重新引领风向。有诸多应用厂商和初创公司随后站上了这一风口。21世纪经济报道记者检索到,截至今年12月底,开源社区Hugging Face上公开的模型数量已经超过了40万个,与半年前的20万个预训练模型相比,数量增长了近一倍。

开源,字面上指的是公开源代码。从监管目前使用的定义来看,朱悦表示大模型开源还指向权重等核心参数和使用信息,属于模型架构的核心。如果开源,通常意味着模型是公开透明、即插即用的。

不过,北京邮电大学人工智能学院副教授陈光告诉21记者,“我们现在更倾向于叫开放模型,而不是开源模型。”

陈光长期研究模式识别和机器学习,在他看来, 大模型的“开源”往往是有限的公开——普遍公开的是模型架构、训练方法,但很少公开训练数据和过程。 以开源界的明星Llama 2为例,具体用了哪些训练数据,如何组织、控制训练过程,两个关键信息并未公开。再加上算力限制,大模型即使公开了源代码,要完全重构、复现目标模型也几乎不可能,只能在参数范围内小幅调整。

“可以把大模型想象成一个调音盒,盒子上有很多旋钮,通过调试不同的旋钮发出千差万别的声音,公开的参数就是最终的声音状态。但重要的是旋钮要怎么调?需要调到什么状态?这些取决于没有公开的训练数据,还有训练过程中大量经验性的工程技巧。”陈光进一步解释。

正因如此,大模型开源与传统的开源软件并不一样,开源界对此的争议声不小。开放源代码促进会(Open Source Initiative)就指出,对于传统的开源软件,一个核心定义是源代码公开、可用、可复现任何目的。但对于大模型,如果要复现能力,还需要公开训练数据、推理代码等一系列可能牵扯隐私和版权问题的信息。 “开源 AI 的概念目前没有定义,不同的组织用它表示不同公开程度的东西,这会让人们对开源感到困惑。” 该组织的执行董事此前表示。

一个更重要的问题也许是,这种“有限的开放”为什么有如此大的吸引力?

陈光提到,开源模型通常会发布不同的参数版本,内部可能会训练一个大规模模型,但公开的一般是中等或小规模的模型。记者梳理发现,开源模型的参数控制在6B-70B之间。陈光解释,除了商业竞争因素, 考虑到算力、计算资源等成本问题,大部分研究机构、初创企业、应用厂商“跑不动”更大参数的模型,因此参数小的开源模型一般更受欢迎。

而更关键的是,开源模型的性能在不断提升。众所周知,开源这一“众包”方式,能不断改进、提升研发效能,长期则能盘活研发社区,促进整个生态发展。这一经验在大模型上也已经有了初步佐证:在上文方舟投资为开源模型与闭源模型绘制的散点图中,两者性能的差距越来越小。Meta 首席 AI 科学家对此感叹:“开源人工智能模型正走在超越专有模型的路上。” 换句话说,用更少的成本达到跟专有模型相差不远的性能,将是开源模型越来越显著的优势。

除此之外,监管也往往对开源模型持有更宽容的态度。比如,正在谈判中的欧盟《人工智能法案》就增设了开源例外。“对于AI生态来说,开源是一个通行做法,也是大家比较认可的理想规范。无论是欧洲还是美国,通常把开源大模型视为一种规制程度较轻的研发活动。”朱悦说。

知道了这些,就不难理解OpenAI面临的外界压力,以及“开源模型步步紧逼专有模型”的说法了。

业内的安全争议

如果再深入一步开源、闭源大模型的战火,可以发现两方都执矛“安全性”。

开源方的主要观点是,计算机技术领域早已验证开源更安全。开源运动的“座右铭”林纳斯定律(Linus's Law)可以很好地解释安全性,该定律表示:“有足够多的眼睛,就可让所有问题浮现。” 鲜明举起这一旗帜的有法国黑马公司Mistral AI——Mistral 坚信,生成式 AI 技术应该是开源的, 广泛分享大模型的源代码是最安全的途径,因为有更多的人可以审查这项技术、发现缺陷,并通过社区修复或减轻威胁。 持同样观点的还有a16z风投公司的合伙人,该合伙人在采访中表示:“没有一个工程团队能找出每一个错误。开源社区擅长构建更便宜、更快、更安全的软件。”

闭源方的观点也逻辑扎实。OpenAI 和谷歌都曾警告,在开源领域发布能力如此强大的大模型是非常危险的,因为技术可能落入恶意人士之手。兰德智库最新的一份研究报告《保护人工智能模型权重》列出了40种不同的攻击向量,该报告强调,一旦获得模型权重,恶意行为者可以用很少的代价利用完整的模型。

在安全性的天秤上,谁的份量更重?

一位网络安全领域的资深人士向21记者指出,大模型开源与软件开源并不一样,其安全风险的范围也更为复杂。

陈光认为,安全风险主要体现在五个维度:审查和修复机制、透明度、责任分配、恶意使用、恶意攻击。 在修复机制和透明度上,开源模型能吸纳更多社区成员参与修复,模型构造也相对透明、可信,其优势不必赘述。而对于传统网络安全领域的恶意攻击,“可以类比开源的linux操作系统和闭源的windows操作系统,linux系统有很多用户给它挑bug,可以不断改进。从这个角度来看,开源模型能更及时地发现和修补漏洞。”

而开源模型最大的弊端恐怕在于,容易被恶意使用,以及责任分配不明。 相比有后台监测人员的闭源模型,开源模型的一个特性体现在,只要不主动报告漏洞,通常可以一直利用。此外,还可以在公开代码的基础上修改出不设限的版本,比如创建黑客工具、网络钓鱼页面和无法检测的恶意软件。

目前在暗网流行的DarkGPT、DarkBERT 和 DarkBARD就是恶意使用的典型例子。据外媒报道,它们是“专为欺诈者、黑客、垃圾邮件发送者和志同道合的个体设计的新型专有模型”。这些非法改编大模型一年收取500到700美元的订阅费用,正逐渐发展为一种商业模式。 这样来看,对开源大模型的滥用担忧并非杞人忧天。

开源模型的责任分配也是一个问题。陈光解释,“开源通常意味着责任更分散,而闭源责任集中于提供者,可能促使公司更积极地维护产品的安全性。”

在陈光看来,开源、闭源模型各有利弊,需要根据实际的场景做出判断:“使用场景是什么,可能有哪些风险,开源和闭源哪一类更利于规避风险?从自身的资源看,有没有能力组建足够强的安全团队?如果开发团队只有10个人,即使监测到了漏洞,内部想及时修复也很难,这种情况还不如开源。”

朱悦补充道,以欧盟的《人工智能法案》为例,在针对开源大模型制定监管政策时,仍然根据风险做了分级设计。比如通用目的或者高风险的人工智能即使开源,也不是完全豁免。此外,如果自身开源社区发展有限,那么开源还涉及对国外社区的依赖度,以及自主创新问题。可以说商业能力、整体开源文化和实际发展生态,都是开源技术背后更复杂的影响因子。

由此来看,即使只用安全性这一个标准衡量,开源、闭源模型也没有高下之分。两者不必然通向安全,都需要付出大量努力。

而回到大模型的明星厂商身上,比起用技术制造更多的营销噱头,付出实际行动似乎更加必要。就像网友在评论区对山姆·奥特曼回复的那样——让产品按承诺运行就好。(just make the product work aspromised)

返回21经济网首页 >>
  • 4 国产操作系统步入爆发期
  • 5 广东最新通知:暂停办理城乡居民基本养老保险和城乡居民基本医疗保险参保缴费业务
  • 6 独家|四川信托兑付方案出炉:4到8折兑付,设置3.5%早签奖励!对比安信、新时代,有何不同?
  • 7 独家专访WTO前总干事拉米:贸易已在美国政治中成为有毒话题
  • 8 美国三季度GDP终值超预期下修至4.9%,经济软着陆希望几何?
  • 9 专访民生银行投行部总经理杨鲲鹏:用好科技手段 做好科技金融大文章
  • 10 全国新一轮大型医院巡查本月启动,巡查常态化、精准化、全覆盖成趋势
  •