Meta AI 推出千亿参数大模型OPT-IML「升级版」，完整模型和代码公布

link管理

链接快照平台

输入网页链接，自动生成快照
标签化管理网页链接

相关文章推荐

想发财的炒粉 · 怎么获取整形的长度-百度经验· 1 年前 ·

大力的充值卡 · Qt QObject::connect: ...· 2 年前 ·

严肃的面包 · django模型中auto_now和auto ...· 2 年前 ·

飘逸的作业本 · python3在word文档中查找多行文字是 ...· 2 年前 ·

闷骚的跑步鞋 · iOS URL编码(百分号编码)研究 - 简书· 2 年前 ·

这次的OPT-IML创建了两种模型尺寸，分别是30B和175B。与旧版OPT模型相比，OPT-IML在14个标准NLP评估任务中的平均表现均优于OPT。在零次学习任务上两种模型大小分别好7%~ 和32-shot 任务分别好4%~ 和 0.4%~。

在这项研究中，研究人员描述了增加模型和基准大小如何影响指令调整决策对下游任务性能的影响。为此他们开发了 OPT-IML Bench，这是一个相当大的指令元学习 (IML) 基准，包含2000个NLP任务，这些任务根据现有的八个基准分为任务类别。

为训练OPT-IML 30B和175B，研究人员首先从该框架的角度对应用于 OPT-30B 的指令调优决策提出了见解。在具有不同目标和输入格式的四个评估基准（PromptSource、FLAN、Super-NaturalInstructions 和 UnifiedSKG）上，OPT-IML 在两个尺度上展示了所有三种泛化技能。

它不仅在所有基准测试中显著优于OPT，而且以极具竞争力的方式优于针对该特定基准优化的现有模型。

Github链接： https://github.com/facebookresearch/metaseq/tree/main/projects/OPT-IML

接下来通过论文来一起了解一下OPT-IML。

论文链接： https://github.com/facebookresearch/metaseq/blob/main/projects/OPT-IML/optimal_paper_v1.pdf

推荐文章

想发财的炒粉 · 怎么获取整形的长度-百度经验

1 年前

大力的充值卡 · Qt QObject::connect: Cannot queue arguments of type ‘uint16_t‘_斗转星移3的博客-CSDN博客

2 年前

严肃的面包 · django模型中auto_now和auto_now_add的区别_davidsu33的博客-CSDN博客

2 年前

飘逸的作业本 · python3在word文档中查找多行文字是否存在 - 金天牛 - 博客园

2 年前

闷骚的跑步鞋 · iOS URL编码(百分号编码)研究 - 简书

2 年前