添加链接

注册登录

link管理

链接快照平台

输入网页链接，自动生成快照
标签化管理网页链接

相关文章推荐

直爽的黄花菜 · typescript ...· 1 周前 ·

打篮球的汽水 · 第6章 6.2.1 文本数据的导入操作 ...· 3 周前 ·

奔放的包子 · Linux内核 | 进程管理 - 世至其美· 2 月前 ·

严肃的牙膏 · 生成共享链接-对象存储（经典版）I型-API ...· 2 月前 ·

傲视众生的桔子 · 深入探索Glide图片加载框架：做了哪些优化 ...· 3 月前 ·

下载App
扫一扫，下载

 登录/注册

小鹰666 ()

发布于2023-04-13 14:09 来自雪球 · 湖南

 关注

来源：雪球App，作者：小鹰666，（https://xueqiu.com/9327859514/247316359）

微软发布的deepspeed大大降低了算力需求。可能是今天算力调整的原因。逻辑上可能出现了瑕疵

DeepSpeed Chat具有以下三大核心功能：
1. 简化ChatGPT类型模型的训练和强化推理体验
开发者只需一个脚本，就能实现多个训练步骤，并且在完成后还可以利用推理API进行对话式交互测试。
2. DeepSpeed-RLHF模块
DeepSpeed-RLHF复刻了InstructGPT论文中的训练模式，并提供了数据抽象和混合功能，支持开发者使用多个不同来源的数据源进行训练。
3. DeepSpeed-RLHF系统
团队将DeepSpeed的训练（training engine）和推理能力（inference engine) 整合成了一个统一的混合引擎（DeepSpeed Hybrid Engine or DeepSpeed-HE）中，用于RLHF训练。由于，DeepSpeed-HE能够无缝地在推理和训练模式之间切换，因此可以利用来自DeepSpeed-Inference的各种优化。
DeepSpeed-RLHF系统在大规模训练中具有无与伦比的效率，使复杂的RLHF训练变得快速、经济并且易于大规模推广：
高效且经济：
DeepSpeed-HE比现有系统快15倍以上，使RLHF训练快速且经济实惠。例如，DeepSpeed-HE在Azure云上只需9小时即可训练一个OPT-13B模型，只需18小时即可训练一个OPT-30B模型。
这两种训练分别花费不到300美元和600美元



推荐文章

直爽的黄花菜 · typescript addeventlistener scroll 没效果_mob64ca12e8a030的技术博客_51CTO博客

1 周前

打篮球的汽水 · 第6章 6.2.1 文本数据的导入操作（MATLAB入门课程） - 哔哩哔哩

3 周前

奔放的包子 · Linux内核 | 进程管理 - 世至其美

2 月前

严肃的牙膏 · 生成共享链接-对象存储（经典版）I型-API参考-存储桶（Bucket）和文件(Object）-关于Object的操作 - 天翼云

2 月前

傲视众生的桔子 · 深入探索Glide图片加载框架：做了哪些优化?如何管理生命周期?怎么做大图加载? - Button123 - 博客园

3 月前

Link管理 · 51好读 · Sov5搜索 · 小百科

link管理 - 链接快照平台