RWKV

由知乎科技答主 PENG Bo 设计的人工智能架构。在此基础上搭建的 ChatRWKV 开源项目对标 ChatGPT,每个人都可以在电脑和手机直接运行。
管理

RWKV "Raven"模型的跑团能力:14B英文很强,7B中文也好玩。RWKV将对GPT实施降维打击。

发布几个RWKV的Chat模型(包括英文和中文)7B/14B欢迎大家玩

RWKV进展:一键生成论文,纯CPU高速INT4,纯CUDA脱离pytorch,ctx8192不耗显存不变慢

RWKV 14B 无微调无RLHF就能遵循各种指令,且在 3090 速度已达 23 token/s

RWKV和ExponentialDecay的历史(参考RWKV没问题,但请勿攻击RWKV)

RWKV是通往1T+模型的强力候选:RNN完全有能力建模长程相关性

RWKV-5 的训练进展,与 SOTA GPT 模型的性能对比

rwkv.cpp: CPU 也能跑的 RNN 中文语言大模型

RWKV的微调教学,以及RWKV World:支持世界所有语言的生成+对话+任务+代码

RWKV CHNtuned 7B 开源中文模型(对话、小说、角色扮演)炼完了v1,欢迎大家玩

RWKV语言模型从入门到放弃,保姆级Training、Fine-tuning、Lora入坑教程

谈谈 RWKV 系列的 prompt 设计,模型选择,解码参数设置

RWKV:一个大模型小团队,要做 AI 时代的安卓

微调大语言模型,如何设计数据格式?【解答最常见的初学者问题】