本项目旨在消除大语言模型的使用门槛,全自动为你处理一切,你只需要一个仅仅几MB的可执行程序。此外本项目提供了与OpenAI API兼容的接口,这意味着一切ChatGPT客户端都是RWKV客户端。
RWKV官方文档 | 视频演示 | 疑难解答 | 预览 | 下载 | 懒人包 | 简明服务部署示例 | 服务器部署示例 | MIDI硬件输入
你可以在服务器部署
backend-python
,然后将此程序仅用作客户端,在设置的
API URL
中填入你的服务器地址
如果你正在部署并对外提供公开服务,请通过API网关限制请求大小,避免过长的prompt提交占用资源。此外,请根据你的实际情况,限制请求的 max_tokens 上限: https://github.com/josStorer/RWKV-Runner/blob/master/backend-python/utils/rwkv.py#L567 , 默认le=102400, 这可能导致极端情况下单个响应消耗大量资源
预设配置已经开启自定义CUDA算子加速,速度更快,且显存消耗更少。如果你遇到可能的兼容性(输出乱码)
问题,前往配置页面,关闭
使用自定义CUDA算子加速
,或更新你的显卡驱动
如果 Windows Defender
说这是一个病毒,你可以尝试下载
v1.3.7_win.zip
,
然后让其自动更新到最新版,或添加信任 (
Windows Security
->
Virus & threat protection
->
Manage settings
->
Exclusions
->
Add or remove exclusions
->
Add an exclusion
->
Folder
->
RWKV-Runner
)
对于不同的任务,调整API参数会获得更好的效果,例如对于翻译任务,你可以尝试设置Temperature为1,Top_P为0.3
git clone https://github.com/josStorer/RWKV-Runner
cd RWKV-Runner
python ./backend-python/main.py #后端推理服务已启动, 调用/switch-model载入模型, 参考API文档: http://127.0.0.1:8000/docs
cd RWKV-Runner/frontend
npm ci
npm run build #编译前端
cd ..
python ./backend-python/webui_server.py #单独启动前端服务
python ./backend-python/main.py --webui #同时启动前后端服务
# 帮助参数
python ./backend-python/main.py -h
ab -p body.json -T application/json -c 20 -n 100 -l http://127.0.0.1:8000/chat/completions
body.json:
"messages" : [ "role" : " user " , "content" : " Hello "注意: 1.4.0 版本对embeddings API质量进行了改善,生成结果与之前的版本不兼容,如果你正在使用此API生成知识库等,请重新生成
如果你在用langchain, 直接使用
OpenAIEmbeddings(openai_api_base="http://127.0.0.1:8000", openai_api_key="sk-")
import numpy as np
import requests
def cosine_similarity(a, b):
return np.dot(a, b) / (np.linalg.norm(a) * np.linalg.norm(b))
values = [
"I am a girl",
"我是个女孩",
"私は女の子です",
"广东人爱吃福建人",
"我是个人类",
"I am a human",
"that dog is so cute",
"私はねこむすめです、にゃん♪",
"宇宙级特大事件!号外号外!"
embeddings = []
for v in values:
r = requests.post("http://127.0.0.1:8000/embeddings", json={"input": v})
embedding = r.json()["data"][0]["embedding"]
embeddings.append(embedding)
compared_embedding = embeddings[0]
embeddings_cos_sim = [cosine_similarity(compared_embedding, e) for e in embeddings]
for i in np.argsort(embeddings_cos_sim)[::-1]:
print(f"{embeddings_cos_sim[i]:.10f} - {values[i]}")
小贴士: 你可以下载
https://github.com/josStorer/sgm_plus
, 并解压到程序的
assets/sound-font
目录, 以使用离线音源. 注意,
如果你正在从源码编译程序, 请不要将其放置在源码目录中
如果你没有MIDI键盘, 你可以使用像
Virtual Midi Controller 3 LE
这样的虚拟MIDI输入软件,
配合
loopMIDI
, 使用普通电脑键盘作为MIDI输入
小贴士: 你可以下载
https://github.com/josStorer/sgm_plus
, 并解压到程序的
assets/sound-font
目录, 以使用离线音源. 注意,
如果你正在从源码编译程序, 请不要将其放置在源码目录中