添加链接
注册
登录
link管理
链接快照平台
输入网页链接,自动生成快照
标签化管理网页链接
相关文章推荐
有爱心的煎鸡蛋
·
python正态分布随机数生成的三种方式 ...
·
3 月前
·
完美的领带
·
专业技术人员(职称)服务
·
3 月前
·
慷慨大方的铁板烧
·
everything 本地文件搜索工具 ...
·
6 月前
·
独立的冰棍
·
Adobe Photoshop CS5: ...
·
9 月前
·
刚毅的抽屉
·
Clickjacking ...
·
12 月前
·
link管理
›
谷歌提出Flan-T5,一个模型解决所有NLP任务 - 智源社区
谷歌
nlp
https://hub.baai.ac.cn/view/22219
慷慨大方的泡面
4 月前
</div></div></div></div></div> <nav class="nav"><span><a href="/events" target="" class="nav-item"><i class="icon iconimage icon-activity" style="background-image:url(/_nuxt/img/activity.510a855.svg);"/> <span>活动</span> <!----></a></span><span><a href="/papers" target="" class="nav-item"><i class="icon iconimage icon-paper" style="background-image:url(/_nuxt/img/paper.57acc81.svg);"/> <span>论文</span> <i class="icon icon-nav_new iconimage" style="background-image:url(/_nuxt/img/nav_new.c7ef205.svg);"/></a></span><span><a href="/projects" target="" class="nav-item"><i class="icon iconimage icon-project" style="background-image:url(/_nuxt/img/project.7e171b3.svg);"/> <span>项目</span> <!----></a></span><span><a href="/" target="" class="nav-item nav-item__active"><i class="icon iconimage icon-zhuanlan" style="background-image:url(/_nuxt/img/zhuanlan.7cec52f.svg);"/> <span>专栏</span> <!----></a></span><span><a href="https://baai.org/l/linklocal" target="_blank" class="nav-item"><i class="icon iconimage icon-lion_black" style="background-image:url(/_nuxt/img/lion_black.558e15a.svg);"/> <span>社交</span> <!----></a></span> <span><a href="https://baai.org/l/24baai" target="_blank" class="nav-item__conference" style="margin-left: 10px;"><img src="/_nuxt/img/BAAI_CONFERENCE.06ae51b.svg" alt="智源大会" style="height: 34px;"/></a></span></nav> <div id="header-search" class="header-search"><div class="header-search-main"><!----> <form action="javascript:return true" class="header-search-form" style="display:;"><label class="header-search-input"><input type="search" maxlength="100" placeholder="AI日报" value=""/> <i class="icon icon-search iconfont"/></label></form> <span class="header-search-cancel" style=";">取消</span></div> <div class="van-overlay header-search-overlay" style="animation-duration:0s;;"/></div> <div class="header-right"><div class="header-btns"><button class="van-button van-button--default van-button--small"><div class="van-button__content"><span class="van-button__text">注册</span></div></button> <button class="van-button van-button--primary van-button--small"><div class="van-button__content"><span class="van-button__text">登录</span></div></button></div></div></section> <!----></header> <main class="main"><div class="view-page" data-v-37540d46=""><div class="main-container" style="display:;" data-v-37540d46=""><div class="main-container_body" data-v-37540d46=""><div class="text-center" data-v-37540d46=""><h1 id="post-title" data-v-37540d46="">谷歌提出Flan-T5,一个模型解决所有NLP任务</h1> <div class="meta-box" data-v-37540d46=""><div class="tag-container" data-v-37540d46=""><span class="tag-item" data-v-37540d46=""><a href="/?tag_id=20" class="tag storiesTag" data-v-37540d46=""><span data-v-37540d46="">自然语言处理</span></a></span></div> <div class="author-container fl" data-v-37540d46=""><div class="author-name author-item clearfix" data-v-37540d46=""><div id="post-author" class="show-pop moucehand fl author-label show-pop" data-v-37540d46=""><span class="avatar fl avatar-circle avatar-default" data-v-37540d46=""><img src="https://sso-user-avatar.baai.ac.cn/v1/f61331a19c9cbcca2c4dd91e04925052.png"/></span> <span class="author-label-text" data-v-37540d46="">刘爽 2022-12-05 12:35 分享</span></div> <div class="person-popover" style=";" data-v-d97d1d3e="" data-v-37540d46=""><div class="personage-wrap moucehand" data-v-d97d1d3e=""><div class="personage-head" data-v-d97d1d3e=""><div class="personage-head-left" data-v-d97d1d3e=""><div class="personage-avatar" data-v-d97d1d3e=""><span class="avatar avatar-circle" style="width:60px;height:60px;" data-v-d97d1d3e=""><img src="https://sso-user-avatar.baai.ac.cn/v1/f61331a19c9cbcca2c4dd91e04925052.png"/></span></div></div> <div class="personage-head-right" data-v-d97d1d3e=""><div class="have-cont" data-v-d97d1d3e=""><div class="have-cont-head text-center" data-v-d97d1d3e=""><span class="span-h3" data-v-d97d1d3e="">刘爽</span></div> <div class="user-count text-center" data-v-d97d1d3e=""><span data-v-d97d1d3e="">帖子数:1710</span></div> <div class="user-more text-center" data-v-d97d1d3e=""><span class="btn" data-v-d97d1d3e="">个人主页</span></div></div></div></div></div></div></div></div> <div class="clearfix" data-v-37540d46=""/> <a href="javascript:;" data-v-37540d46=""><div class="article-source" data-v-37540d46=""> 以下文章来源于mp.weixin.qq.com </div></a></div></div> <div id="post-content" class="post-content" data-v-37540d46=""><p style="line-height: 1.7; text-align: justify;">作者: nghuyong<br/>知乎: <a href="https://zhuanlan.zhihu.com/p/580468546">https://zhuanlan.zhihu.com/p/580468546</a></p> <p style="line-height: 1.7; text-align: justify;"><strong>「论文」</strong>: Scaling Instruction-Finetuned Language Models<br/><strong>「地址」</strong>: <a href="https://arxiv.org/abs/2210.11416">https://arxiv.org/abs/2210.11416</a><br/><strong>「模型」</strong>: <a href="https://huggingface.co/google/flan-t5-xxl">https://huggingface.co/google/flan-t5-xxl</a></p> <p style="line-height: 1.8; text-align: justify;"><strong>「Flan-T5」</strong>是Google最新的一篇工作,通过在超大规模的任务上进行微调,让语言模型具备了极强的泛化性能,做到单个模型就可以在1800多个NLP任务上都能有很好的表现。这意味着模型一旦训练完毕,可以直接在几乎全部的NLP任务上直接使用,实现<strong>「One model for ALL tasks」</strong>,这就非常有诱惑力!</p> <p style="line-height: 1.8; text-align: justify;">这里的Flan指的是(Instruction finetuning),即"基于指令的微调";T5是2019年Google发布的一个语言模型了。注意这里的语言模型可以进行任意的替换(需要有Decoder部分,所以<strong>「不包括BERT这类纯Encoder语言模型」</strong>),论文的核心贡献是提出一套多任务的微调方案(Flan),来极大提升语言模型的泛化性。</p> <p style="line-height: 1.8; text-align: justify;">例如下面文章中的例子,模型训练好之后,可直接让模型做问答:</p> <blockquote data-tool="mdnice编辑器"><strong>「模型输入」</strong>是:"Geoffrey Hinton和George Washington这两个人有没有交谈过?在回答之前想一想原因。“</blockquote> <blockquote data-tool="mdnice编辑器"><strong>「模型返回」</strong>是:Geoffrey Hinton是一个计算机科学家,出生在1947年;而George Washington在1799年去世。所以这两个不可能有过交谈。所以答案时“没有”。</blockquote></div> <div class="button-list" data-v-37540d46=""><div class="paper-actions-container" data-v-22c07518="" data-v-37540d46=""><div class="paper-action" data-v-22c07518=""> <span class="paper-action-item" data-v-22c07518=""><i class="icon icon-like iconimage" style="background-image:url(/_nuxt/img/like.1ce29c7.svg);" data-v-22c07518=""/>
推荐文章
有爱心的煎鸡蛋
·
python正态分布随机数生成的三种方式 - Philbert - 博客园
3 月前
完美的领带
·
专业技术人员(职称)服务
3 月前
慷慨大方的铁板烧
·
everything 本地文件搜索工具 完胜WIndows搜索 速度99% 超级给力-阿里云开发者社区
6 月前
独立的冰棍
·
Adobe Photoshop CS5: Beginner Level |百度网盘|rapidgator|nitroflare
9 月前
刚毅的抽屉
·
Clickjacking Protection | Django documentation | Django
12 月前