如何使用通义千问API_大模型服务平台百炼(Model Studio)-阿里云帮助中心

通义千问模型具有强大的自然语言处理能力，您可以通过API接口调用通义千问模型，将通义千问模型集成到您的业务中。

前提条件

请您参考获取API-KEY ，开通百炼服务并获得API-KEY。
请在模型概览中选择您需要使用的模型。

您可以使用OpenAI Python SDK、DashScope SDK或HTTP接口调用通义千问模型，请您根据您的需求，参考以下方式准备您的计算环境。

调用方式	准备条件
通过OpenAI Python SDK调用	您可以通过以下命令安装或更新OpenAI SDK： `# 如果下述命令报错，请将pip替换为pip3 pip install -U openai` 您需要配置的base_url如下： `https://dashscope.aliyuncs.com/compatible-mode/v1`
通过OpenAI兼容-HTTP调用	如果您需要通过OpenAI兼容的HTTP方式进行调用，需要配置的完整访问endpoint如下： `POST https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions`
通过DashScope SDK调用	DashScope SDK提供了Python和Java两个版本，请参考安装SDK ，安装最新版SDK。
通过DashScope HTTP调用	如果您需要通过DashScope的HTTP方式进行调用，需要配置的完整访问endpoint如下： `POST https://dashscope.aliyuncs.com/api/v1/services/aigc/text-generation/generation`

from openai import OpenAI
import os
def get_response():
    client = OpenAI(
        api_key=os.getenv("DASHSCOPE_API_KEY"), # 如果您没有配置环境变量，请在此处用您的API Key进行替换
        base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",  # 填写DashScope服务的base_url
    completion = client.chat.completions.create(
        model="qwen-turbo",
        messages=[
            {'role': 'system', 'content': 'You are a helpful assistant.'},
            {'role': 'user', 'content': '你是谁？'}]
    print(completion.model_dump_json())
if __name__ == '__main__':
    get_response()

{
  "id": "chatcmpl-ee338a7c-b5b3-9139-a726-b7b749d6b49d",
  "choices": [
      "finish_reason": "stop",
      "index": 0,
      "logprobs": null,
      "message": {
        "content": "我是阿里云开发的一款超大规模语言模型，我叫通义千问。",
        "refusal": null,
        "role": "assistant",
        "function_call": null,
        "tool_calls": null
  "created": 1725005215,
  "model": "qwen-turbo",
  "object": "chat.completion",
  "service_tier": null,
  "system_fingerprint": null,
  "usage": {
    "completion_tokens": 17,
    "prompt_tokens": 22,
    "total_tokens": 39
}

curl --location "https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions" \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header "Content-Type: application/json" \
--data '{
    "model": "qwen-turbo",
    "messages": [
            "role": "system",
            "content": "You are a helpful assistant."
            "role": "user", 
            "content": "你是谁？"
}'

{
  "choices": [
      "message": {
        "role": "assistant",
        "content": "我是通义千问，由阿里云开发的AI助手。我被设计用来回答各种问题、提供信息和与用户进行对话。有什么我可以帮助你的吗？"
      "finish_reason": "stop",
      "index": 0,
      "logprobs": null
  "object": "chat.completion",
  "usage": {
    "prompt_tokens": 22,
    "completion_tokens": 36,
    "total_tokens": 58
  "created": 1721044596,
  "system_fingerprint": null,
  "model": "qwen-turbo",
  "id": "chatcmpl-94149c5a-137f-9b87-b2c8-61235e85f540"
}

import random
from http import HTTPStatus
# 建议dashscope SDK 的版本 >= 1.14.0
from dashscope import Generation
def call_with_messages():
    messages = [{'role': 'system', 'content': 'You are a helpful assistant.'},
                {'role': 'user', 'content': '你是谁？'}]
    response = Generation.call(model="qwen-turbo",
                               messages=messages,
                               # 将输出设置为"message"格式
                               result_format='message')
    if response.status_code == HTTPStatus.OK:
        print(response)
    else:
        print('Request id: %s, Status code: %s, error code: %s, error message: %s' % (
            response.request_id, response.status_code,
            response.code, response.message
if __name__ == '__main__':
    call_with_messages()

{
  "status_code": 200,
  "request_id": "902fee3b-f7f0-9a8c-96a1-6b4ea25af114",
  "code": "",
  "message": "",
  "output": {
    "text": null,
    "finish_reason": null,
    "choices": [
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "我是阿里云开发的一款超大规模语言模型，我叫通义千问。"
  "usage": {
    "input_tokens": 22,
    "output_tokens": 17,
    "total_tokens": 39
// 建议dashscope SDK的版本 >= 2.12.0
import java.util.Arrays;
import com.alibaba.dashscope.aigc.generation.Generation;
import com.alibaba.dashscope.aigc.generation.GenerationParam;
import com.alibaba.dashscope.aigc.generation.GenerationResult;
import com.alibaba.dashscope.common.Message;
import com.alibaba.dashscope.common.Role;
import com.alibaba.dashscope.exception.ApiException;
import com.alibaba.dashscope.exception.InputRequiredException;
import com.alibaba.dashscope.exception.NoApiKeyException;
import com.alibaba.dashscope.utils.JsonUtils;
public class Main {
    public static GenerationResult callWithMessage() throws ApiException, NoApiKeyException, InputRequiredException {
        Generation gen = new Generation();
        Message systemMsg = Message.builder()
                .role(Role.SYSTEM.getValue())
                .content("You are a helpful assistant.")
                .build();
        Message userMsg = Message.builder()
                .role(Role.USER.getValue())
                .content("你是谁？")
                .build();
        GenerationParam param = GenerationParam.builder()
                .model("qwen-turbo")
                .messages(Arrays.asList(systemMsg, userMsg))
                .resultFormat(GenerationParam.ResultFormat.MESSAGE)
                .build();
        return gen.call(param);
    public static void main(String[] args) {
        try {
            GenerationResult result = callWithMessage();
            System.out.println(JsonUtils.toJson(result));
        } catch (ApiException | NoApiKeyException | InputRequiredException e) {
            // 使用日志框架记录异常信息
            // Logger.error("An error occurred while calling the generation service", e);
            System.err.println("An error occurred while calling the generation service: " + e.getMessage());
        System.exit(0);
}

{
  "requestId": "86dd52a9-23ec-9804-8f82-85f4c7fd5114",
  "usage": {
    "input_tokens": 22,
    "output_tokens": 17,
    "total_tokens": 39
  "output": {
    "choices": [
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "我是阿里云开发的一款超大规模语言模型，我叫通义千问。"
}

curl --location "https://dashscope.aliyuncs.com/api/v1/services/aigc/text-generation/generation" \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header "Content-Type: application/json" \
--data '{
    "model": "qwen-turbo",
    "input":{
        "messages":[      
                "role": "system",
                "content": "You are a helpful assistant."
                "role": "user",
                "content": "你是谁？"
    "parameters": {
        "result_format": "message"
}'

{
  "output": {
    "choices": [
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "我是通义千问，由阿里云开发的AI助手。我被设计用来回答各种问题、提供信息和与用户进行对话。有什么我可以帮助你的吗？"
  "usage": {
    "total_tokens": 58,
    "output_tokens": 36,
    "input_tokens": 22
  "request_id": "39377fd7-26dd-99f5-b539-5fd004b6ecb5"
}

from openai import OpenAI
import os
def get_response(messages):
    client = OpenAI(
        # 如果您没有配置环境变量，请在此处用您的API Key进行替换
        api_key=os.getenv("DASHSCOPE_API_KEY"), 
        # 填写DashScope服务的base_url
        base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
    completion = client.chat.completions.create(
        model="qwen-turbo",
        messages=messages
    return completion
messages = [{'role': 'system', 'content': 'You are a helpful assistant.'}]
# 您可以自定义设置对话轮数，当前为3
for i in range(3):
    user_input = input("请输入：")
    # 将用户问题信息添加到messages列表中
    messages.append({'role': 'user', 'content': user_input})
    assistant_output = get_response(messages).choices[0].message.content
    # 将大模型的回复信息添加到messages列表中
    messages.append({'role': 'assistant', 'content': assistant_output})
    print(f'用户输入：{user_input}')
    print(f'模型输出：{assistant_output}')
    print('\n')

curl --location "https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions" \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header "Content-Type: application/json" \
--data '{
    "model": "qwen-turbo",
    "messages":[      
            "role": "system",
            "content": "You are a helpful assistant."
            "role": "user",
            "content": "你好"
            "role": "assistant",
            "content": "你好啊，我是通义千问。"
            "role": "user",
            "content": "你有哪些技能？"
}'

{
  "choices": [
      "message": {
        "role": "assistant",
        "content": "作为一个人工智能助手，我有多种技能，包括但不限于：\n\n1. **语言理解与生成**：能够理解和生成自然语言文本，进行对话交流。\n2. **信息检索**：帮助用户查找和提供相关的信息。\n3. **知识问答**：解答各类问题，涵盖各种主题领域。\n4. **翻译**：支持多种语言之间的翻译。\n5. **文本总结**：对长篇文章或段落进行概括。\n6. **写作辅助**：提供建议、修改句子结构等写作帮助。\n7. **情感分析**：识别和理解文本中的情感倾向。\n8. **代码解释和辅助**：对编程问题进行解答和指导。\n\n请告诉我你需要什么帮助，我会尽力提供支持。"
      "finish_reason": "stop",
      "index": 0,
      "logprobs": null
  "object": "chat.completion",
  "usage": {
    "prompt_tokens": 43,
    "completion_tokens": 155,
    "total_tokens": 198
  "created": 1721098376,
  "system_fingerprint": null,
  "model": "qwen-turbo",
  "id": "chatcmpl-eccf185f-ed9f-9476-a664-a97d9534b0d5"
}

from dashscope import Generation
def get_response(messages):
    response = Generation.call(model="qwen-turbo",
                               messages=messages,
                               # 将输出设置为"message"格式
                               result_format='message')
    return response
messages = [{'role': 'system', 'content': 'You are a helpful assistant.'}]
# 您可以自定义设置对话轮数，当前为3
for i in range(3):
    user_input = input("请输入：")
    # 将用户问题信息添加到messages列表中
    messages.append({'role': 'user', 'content': user_input})
    assistant_output = get_response(messages).output.choices[0]['message']['content']
    # 将大模型的回复信息添加到messages列表中
    messages.append({'role': 'assistant', 'content': assistant_output})
    print(f'用户输入：{user_input}')
    print(f'模型输出：{assistant_output}')
    print('\n')

import java.util.ArrayList;
import java.util.List;
import com.alibaba.dashscope.aigc.generation.Generation;
import com.alibaba.dashscope.aigc.generation.GenerationParam;
import com.alibaba.dashscope.aigc.generation.GenerationResult;
import com.alibaba.dashscope.common.Message;
import com.alibaba.dashscope.common.Role;
import com.alibaba.dashscope.exception.ApiException;
import com.alibaba.dashscope.exception.InputRequiredException;
import com.alibaba.dashscope.exception.NoApiKeyException;
import java.util.Scanner;
public class Main {
    public static GenerationParam createGenerationParam(List<Message> messages) {
        return GenerationParam.builder()
                .model("qwen-turbo")
                .messages(messages)
                .resultFormat(GenerationParam.ResultFormat.MESSAGE)
                .topP(0.8)
                .build();
    public static GenerationResult callGenerationWithMessages(GenerationParam param) throws ApiException, NoApiKeyException, InputRequiredException {
        Generation gen = new Generation();
        return gen.call(param);
    public static void main(String[] args) {
        try {
            List<Message> messages = new ArrayList<>();
            messages.add(createMessage(Role.SYSTEM, "You are a helpful assistant."));
            for (int i = 0; i < 3;i++) {
                Scanner scanner = new Scanner(System.in);
                System.out.print("请输入：");
                String userInput = scanner.nextLine();
                if ("exit".equalsIgnoreCase(userInput)) {
                    break;
                messages.add(createMessage(Role.USER, userInput));
                GenerationParam param = createGenerationParam(messages);
                GenerationResult result = callGenerationWithMessages(param);
                System.out.println("模型输出："+result.getOutput().getChoices().get(0).getMessage().getContent());
                messages.add(result.getOutput().getChoices().get(0).getMessage());
        } catch (ApiException | NoApiKeyException | InputRequiredException e) {
            e.printStackTrace();
        System.exit(0);
    private static Message createMessage(Role role, String content) {
        return Message.builder().role(role.getValue()).content(content).build();
}

curl --location "https://dashscope.aliyuncs.com/api/v1/services/aigc/text-generation/generation" \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header "Content-Type: application/json" \
--data '{
    "model": "qwen-turbo",
    "input":{
        "messages":[      
                "role": "system",
                "content": "You are a helpful assistant."
                "role": "user",
                "content": "你好"
                "role": "assistant",
                "content": "你好啊，我是通义千问。"
                "role": "user",
                "content": "你有哪些技能？"
    "parameters": {
        "result_format": "message",
        "top_p":0.8,
        "top_k": 50,
        "temperature":0.8
}'

{
  "output": {
    "choices": [
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "作为一个人工智能助手，我有多种技能，包括但不限于：\n\n1. **语言理解与生成**：能够理解和生成自然语言文本，进行对话交流。\n2. **信息检索**：帮助用户查找和提供相关的信息。\n3. **知识问答**：解答各类问题，涵盖各种主题领域。\n4. **翻译**：支持多种语言之间的翻译。\n5. **文本总结**：对长篇文章或段落进行概括。\n6. **写作辅助**：提供建议、修改句子结构等写作帮助。\n7. **情感分析**：识别和解读文本中的情感色彩。\n8. **代码解释**：简单编程问题的解答。\n\n虽然我可以提供很多帮助，但请注意我不是万能的，对于一些专业领域的复杂问题可能无法给出准确答案。"
  "usage": {
    "total_tokens": 208,
    "output_tokens": 165,
    "input_tokens": 43
  "request_id": "e9d88c17-bb36-9273-b678-88915961ab6e"
}

from openai import OpenAI
import os
def get_response():
    client = OpenAI(
        api_key=os.getenv("DASHSCOPE_API_KEY"),
        base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
    completion = client.chat.completions.create(
        model="qwen-turbo",
        messages=[{'role': 'system', 'content': 'You are a helpful assistant.'},
                  {'role': 'user', 'content': '你是谁？'}],
        stream=True,
        # 可选，配置以后会在流式输出的最后一行展示token使用信息
        stream_options={"include_usage": True}
    for chunk in completion:
        print(chunk.model_dump_json())
if __name__ == '__main__':
    get_response()

{"id":"chatcmpl-xxx","choices":[{"delta":{"content":"","function_call":null,"role":"assistant","tool_calls":null},"finish_reason":null,"index":0,"logprobs":null}],"created":1721099636,"model":"qwen-turbo","object":"chat.completion.chunk","service_tier":null,"system_fingerprint":null,"usage":null}
{"id":"chatcmpl-xxx","choices":[{"delta":{"content":"我是","function_call":null,"role":null,"tool_calls":null},"finish_reason":null,"index":0,"logprobs":null}],"created":1721099636,"model":"qwen-turbo","object":"chat.completion.chunk","service_tier":null,"system_fingerprint":null,"usage":null}
{"id":"chatcmpl-xxx","choices":[{"delta":{"content":"通","function_call":null,"role":null,"tool_calls":null},"finish_reason":null,"index":0,"logprobs":null}],"created":1721099636,"model":"qwen-turbo","object":"chat.completion.chunk","service_tier":null,"system_fingerprint":null,"usage":null}
{"id":"chatcmpl-xxx","choices":[{"delta":{"content":"义","function_call":null,"role":null,"tool_calls":null},"finish_reason":null,"index":0,"logprobs":null}],"created":1721099636,"model":"qwen-turbo","object":"chat.completion.chunk","service_tier":null,"system_fingerprint":null,"usage":null}
{"id":"chatcmpl-xxx","choices":[{"delta":{"content":"千问，由阿里","function_call":null,"role":null,"tool_calls":null},"finish_reason":null,"index":0,"logprobs":null}],"created":1721099636,"model":"qwen-turbo","object":"chat.completion.chunk","service_tier":null,"system_fingerprint":null,"usage":null}
{"id":"chatcmpl-xxx","choices":[{"delta":{"content":"云开发的AI助手。我被","function_call":null,"role":null,"tool_calls":null},"finish_reason":null,"index":0,"logprobs":null}],"created":1721099636,"model":"qwen-turbo","object":"chat.completion.chunk","service_tier":null,"system_fingerprint":null,"usage":null}
{"id":"chatcmpl-xxx","choices":[{"delta":{"content":"设计用来回答各种问题、提供信息","function_call":null,"role":null,"tool_calls":null},"finish_reason":null,"index":0,"logprobs":null}],"created":1721099636,"model":"qwen-turbo","object":"chat.completion.chunk","service_tier":null,"system_fingerprint":null,"usage":null}
{"id":"chatcmpl-xxx","choices":[{"delta":{"content":"和与用户进行对话。有什么我可以","function_call":null,"role":null,"tool_calls":null},"finish_reason":null,"index":0,"logprobs":null}],"created":1721099636,"model":"qwen-turbo","object":"chat.completion.chunk","service_tier":null,"system_fingerprint":null,"usage":null}
{"id":"chatcmpl-xxx","choices":[{"delta":{"content":"帮助你的吗？","function_call":null,"role":null,"tool_calls":null},"finish_reason":"stop","index":0,"logprobs":null}],"created":1721099636,"model":"qwen-turbo","object":"chat.completion.chunk","service_tier":null,"system_fingerprint":null,"usage":null}
{"id":"chatcmpl-xxx","choices":[],"created":1721099636,"model":"qwen-turbo","object":"chat.completion.chunk","service_tier":null,"system_fingerprint":null,"usage":{"completion_tokens":36,"prompt_tokens":22,"total_tokens":58}}

curl --location "https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions" \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header "Content-Type: application/json" \
--data '{
    "model": "qwen-turbo",
    "messages": [
            "role": "system",
            "content": "You are a helpful assistant."
            "role": "user", 
            "content": "你是谁？"
    "stream":true,
    "stream_options":{
        "include_usage":true
}'

data: {"choices":[{"delta":{"content":"","role":"assistant"},"index":0,"logprobs":null,"finish_reason":null}],"object":"chat.completion.chunk","usage":null,"created":1725445296,"system_fingerprint":null,"model":"qwen-turbo","id":"chatcmpl-17667e40-5de3-9e38-a5fb-c8feeef1f709"}
data: {"choices":[{"finish_reason":null,"delta":{"content":"我是"},"index":0,"logprobs":null}],"object":"chat.completion.chunk","usage":null,"created":1725445296,"system_fingerprint":null,"model":"qwen-turbo","id":"chatcmpl-17667e40-5de3-9e38-a5fb-c8feeef1f709"}
data: {"choices":[{"delta":{"content":"阿里"},"finish_reason":null,"index":0,"logprobs":null}],"object":"chat.completion.chunk","usage":null,"created":1725445296,"system_fingerprint":null,"model":"qwen-turbo","id":"chatcmpl-17667e40-5de3-9e38-a5fb-c8feeef1f709"}
data: {"choices":[{"delta":{"content":"云"},"finish_reason":null,"index":0,"logprobs":null}],"object":"chat.completion.chunk","usage":null,"created":1725445296,"system_fingerprint":null,"model":"qwen-turbo","id":"chatcmpl-17667e40-5de3-9e38-a5fb-c8feeef1f709"}
data: {"choices":[{"delta":{"content":"开发的一款超大规模语言"},"finish_reason":null,"index":0,"logprobs":null}],"object":"chat.completion.chunk","usage":null,"created":1725445296,"system_fingerprint":null,"model":"qwen-turbo","id":"chatcmpl-17667e40-5de3-9e38-a5fb-c8feeef1f709"}
data: {"choices":[{"delta":{"content":"模型，我叫通义千问"},"finish_reason":null,"index":0,"logprobs":null}],"object":"chat.completion.chunk","usage":null,"created":1725445296,"system_fingerprint":null,"model":"qwen-turbo","id":"chatcmpl-17667e40-5de3-9e38-a5fb-c8feeef1f709"}
data: {"choices":[{"delta":{"content":"。"},"finish_reason":null,"index":0,"logprobs":null}],"object":"chat.completion.chunk","usage":null,"created":1725445296,"system_fingerprint":null,"model":"qwen-turbo","id":"chatcmpl-17667e40-5de3-9e38-a5fb-c8feeef1f709"}
data: {"choices":[{"finish_reason":"stop","delta":{"content":""},"index":0,"logprobs":null}],"object":"chat.completion.chunk","usage":null,"created":1725445296,"system_fingerprint":null,"model":"qwen-turbo","id":"chatcmpl-17667e40-5de3-9e38-a5fb-c8feeef1f709"}
data: {"choices":[],"object":"chat.completion.chunk","usage":{"prompt_tokens":22,"completion_tokens":17,"total_tokens":39},"created":1725445296,"system_fingerprint":null,"model":"qwen-turbo","id":"chatcmpl-17667e40-5de3-9e38-a5fb-c8feeef1f709"}
data: [DONE]

from http import HTTPStatus
from dashscope import Generation
def call_with_stream():
    messages = [
        {'role':'system','content':'you are a helpful assistant'},
        {'role': 'user','content': '你是谁？'}
    responses = Generation.call(
        model="qwen-turbo",
        messages=messages,
        # 设置输出为'message'格式
        result_format='message',
        # 设置输出方式为流式输出
        stream=True,
        # 增量式流式输出
        incremental_output=True
    full_content = ""
    for response in responses:
        if response.status_code == HTTPStatus.OK:
            print(response)
            full_content += response.output.choices[0].message.content
        else:
            print('Request id: %s, Status code: %s, error code: %s, error message: %s' % (
                response.request_id, response.status_code,
                response.code, response.message
    print(f"Full content:{full_content}")
if __name__ == '__main__':
    call_with_stream()

{"status_code": 200, "request_id": "xxx", "code": "", "message": "", "output": {"text": null, "finish_reason": null, "choices": [{"finish_reason": "null", "message": {"role": "assistant", "content": "我是"}}]}, "usage": {"input_tokens": 21, "output_tokens": 1, "total_tokens": 22}}
{"status_code": 200, "request_id": "xxx", "code": "", "message": "", "output": {"text": null, "finish_reason": null, "choices": [{"finish_reason": "null", "message": {"role": "assistant", "content": "通"}}]}, "usage": {"input_tokens": 21, "output_tokens": 2, "total_tokens": 23}}
{"status_code": 200, "request_id": "xxx", "code": "", "message": "", "output": {"text": null, "finish_reason": null, "choices": [{"finish_reason": "null", "message": {"role": "assistant", "content": "义"}}]}, "usage": {"input_tokens": 21, "output_tokens": 3, "total_tokens": 24}}
{"status_code": 200, "request_id": "xxx", "code": "", "message": "", "output": {"text": null, "finish_reason": null, "choices": [{"finish_reason": "null", "message": {"role": "assistant", "content": "千问，由阿里"}}]}, "usage": {"input_tokens": 21, "output_tokens": 8, "total_tokens": 29}}
{"status_code": 200, "request_id": "xxx", "code": "", "message": "", "output": {"text": null, "finish_reason": null, "choices": [{"finish_reason": "null", "message": {"role": "assistant", "content": "云开发的AI助手。我被"}}]}, "usage": {"input_tokens": 21, "output_tokens": 16, "total_tokens": 37}}
{"status_code": 200, "request_id": "xxx", "code": "", "message": "", "output": {"text": null, "finish_reason": null, "choices": [{"finish_reason": "null", "message": {"role": "assistant", "content": "设计用来回答各种问题、提供信息"}}]}, "usage": {"input_tokens": 21, "output_tokens": 24, "total_tokens": 45}}
{"status_code": 200, "request_id": "xxx", "code": "", "message": "", "output": {"text": null, "finish_reason": null, "choices": [{"finish_reason": "null", "message": {"role": "assistant", "content": "和与用户进行对话。有什么我可以"}}]}, "usage": {"input_tokens": 21, "output_tokens": 32, "total_tokens": 53}}
import java.util.Arrays;
import java.util.concurrent.Semaphore;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import java.util.concurrent.Semaphore;
import com.alibaba.dashscope.aigc.generation.Generation;
import com.alibaba.dashscope.aigc.generation.GenerationParam;
import com.alibaba.dashscope.aigc.generation.GenerationResult;
import com.alibaba.dashscope.common.Message;
import com.alibaba.dashscope.common.ResultCallback;
import com.alibaba.dashscope.common.Role;
import com.alibaba.dashscope.exception.ApiException;
import com.alibaba.dashscope.exception.InputRequiredException;
import com.alibaba.dashscope.exception.NoApiKeyException;
import com.alibaba.dashscope.utils.JsonUtils;
import io.reactivex.Flowable;
public class Main {
    private static final Logger logger = LoggerFactory.getLogger(Main.class);
    private static void handleGenerationResult(GenerationResult message, StringBuilder fullContent) {
        fullContent.append(message.getOutput().getChoices().get(0).getMessage().getContent());
        logger.info("Received message: {}", JsonUtils.toJson(message));
    public static void streamCallWithMessage(Generation gen, Message userMsg)
            throws NoApiKeyException, ApiException, InputRequiredException {
        GenerationParam param = buildGenerationParam(userMsg);
        Flowable<GenerationResult> result = gen.streamCall(param);
        StringBuilder fullContent = new StringBuilder();
        result.blockingForEach(message -> handleGenerationResult(message, fullContent));
        logger.info("Full content: \n{}", fullContent.toString());
    public static void streamCallWithCallback(Generation gen, Message userMsg)
            throws NoApiKeyException, ApiException, InputRequiredException, InterruptedException {
        GenerationParam param = buildGenerationParam(userMsg);
        Semaphore semaphore = new Semaphore(0);
        StringBuilder fullContent = new StringBuilder();
        gen.streamCall(param, new ResultCallback<GenerationResult>() {
            @Override
            public void onEvent(GenerationResult message) {
                handleGenerationResult(message, fullContent);
            @Override
            public void onError(Exception err) {
                logger.error("Exception occurred: {}", err.getMessage());
                semaphore.release();
            @Override
            public void onComplete() {
                logger.info("Completed");
                semaphore.release();
        semaphore.acquire();
        logger.info("Full content: \n{}", fullContent.toString());
    private static GenerationParam buildGenerationParam(Message userMsg) {
        return GenerationParam.builder()
                .model("qwen-turbo")
                .messages(Arrays.asList(userMsg))
                .resultFormat(GenerationParam.ResultFormat.MESSAGE)
                .incrementalOutput(true)
                .build();
    public static void main(String[] args) {
        try {
            Generation gen = new Generation();
            Message userMsg = Message.builder().role(Role.USER.getValue()).content("如何做西红柿炖牛腩？").build();
            streamCallWithMessage(gen, userMsg);
            streamCallWithCallback(gen, userMsg);
        } catch (ApiException | NoApiKeyException | InputRequiredException | InterruptedException e) {
            logger.error("An exception occurred: {}", e.getMessage());

{"requestId":"xxx","usage":{"input_tokens":11,"output_tokens":1,"total_tokens":12},"output":{"choices":[{"finish_reason":"null","message":{"role":"assistant","content":"我是"}}]}}
{"requestId":"xxx","usage":{"input_tokens":11,"output_tokens":2,"total_tokens":13},"output":{"choices":[{"finish_reason":"null","message":{"role":"assistant","content":"通"}}]}}
{"requestId":"xxx","usage":{"input_tokens":11,"output_tokens":3,"total_tokens":14},"output":{"choices":[{"finish_reason":"null","message":{"role":"assistant","content":"义"}}]}}
{"requestId":"xxx","usage":{"input_tokens":11,"output_tokens":8,"total_tokens":19},"output":{"choices":[{"finish_reason":"null","message":{"role":"assistant","content":"千问，由阿里"}}]}}
{"requestId":"xxx","usage":{"input_tokens":11,"output_tokens":16,"total_tokens":27},"output":{"choices":[{"finish_reason":"null","message":{"role":"assistant","content":"云开发的AI助手。我被"}}]}}
{"requestId":"xxx","usage":{"input_tokens":11,"output_tokens":24,"total_tokens":35},"output":{"choices":[{"finish_reason":"null","message":{"role":"assistant","content":"设计用来回答各种问题、提供信息"}}]}}
{"requestId":"xxx","usage":{"input_tokens":11,"output_tokens":32,"total_tokens":43},"output":{"choices":[{"finish_reason":"null","message":{"role":"assistant","content":"和与用户进行对话。有什么我可以"}}]}}
{"requestId":"xxx","usage":{"input_tokens":11,"output_tokens":36,"total_tokens":47},"output":{"choices":[{"finish_reason":"stop","message":{"role":"assistant","content":"帮助你的吗？"}}]}}

curl --location "https://dashscope.aliyuncs.com/api/v1/services/aigc/text-generation/generation" \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header "Content-Type: application/json" \
--header "X-DashScope-SSE: enable" \
--data '{
    "model": "qwen-turbo",
    "input":{
        "messages":[      
                "role": "system",
                "content": "You are a helpful assistant."
                "role": "user",
                "content": "你是谁？"
    "parameters": {
        "result_format": "message",
        "incremental_output":true
}'

id:1
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"我是","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":23,"input_tokens":22,"output_tokens":1},"request_id":"xxx"}
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"通","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":24,"input_tokens":22,"output_tokens":2},"request_id":"xxx"}
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"义","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":25,"input_tokens":22,"output_tokens":3},"request_id":"xxx"}
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"千问，由阿里","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":30,"input_tokens":22,"output_tokens":8},"request_id":"xxx"}
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"云开发的AI助手。我被","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":38,"input_tokens":22,"output_tokens":16},"request_id":"xxx"}
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"设计用来回答各种问题、提供信息","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":46,"input_tokens":22,"output_tokens":24},"request_id":"xxx"}
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"和与用户进行对话。有什么我可以","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":54,"input_tokens":22,"output_tokens":32},"request_id":"xxx"}
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"帮助你的吗？","role":"assistant"},"finish_reason":"stop"}]},"usage":{"total_tokens":58,"input_tokens":22,"output_tokens":36},"request_id":"xxx"}

参数	类型	默认值	说明
model	string	-	用户使用model参数指明对应的模型。请参考模型概览。
messages	array	-	用户与模型的对话历史。array中的每个元素形式为 `{"role":角色, "content": 内容}` 。角色当前可选值：system、user、assistant，其中，仅 `messages[0]` 中支持role为system，一般情况下，user和assistant需要交替出现，且messages中最后一个元素的role必须为user。
`top_p` （可选）	float	-	生成过程中的核采样方法概率阈值，例如，取值为0.8时，仅保留概率加起来大于等于0.8的最可能token的最小集合作为候选集。取值范围为（0,1.0)，取值越大，生成的随机性越高；取值越低，生成的确定性越高。
temperature（可选）	float	-	用于控制模型回复的随机性和多样性。具体来说，temperature值控制了生成文本时对每个候选词的概率分布进行平滑的程度。较高的temperature值会降低概率分布的峰值，使得更多的低概率词被选择，生成结果更加多样化；而较低的temperature值则会增强概率分布的峰值，使得高概率词更容易被选择，生成结果更加确定。取值范围： [0, 2)，不建议取值为0，无意义。
presence_penalty （可选）	float	-	用户控制模型生成时整个序列中的重复度。提高presence_penalty时可以降低模型生成的重复度，取值范围[-2.0, 2.0]。
max_tokens（可选）	integer	-	指定模型可生成的最大token个数。根据模型不同有不同的上限限制，一般不超过2000。
response_foramt（可选）	object	`{"type": "text"}`	用于指定返回内容的格式。可选值： `{"type": "text"}` 或 `{"type": "json_object"}` 。设置为 `{"type": "json_object"}` 时会输出标准格式的JSON字符串。
seed（可选）	integer	-	生成时使用的随机数种子，用于控制模型生成内容的随机性。seed支持无符号64位整数。
stream（可选）	boolean	False	用于控制是否使用流式输出。当以stream模式输出结果时，接口返回结果为generator，需要通过迭代获取结果，每次输出为当前生成的增量序列。
stop（可选）	string or array	None	stop参数用于实现内容生成过程的精确控制，在模型生成的内容即将包含指定的字符串或token_id时自动停止。stop可以为string类型或array类型。 string类型当模型将要生成指定的stop词语时停止。例如将stop指定为"你好"，则模型将要生成“你好”时停止。 array类型 array中的元素可以为token_id或者字符串，或者元素为token_id的array。当模型将要生成的token或其对应的token_id在stop中时，模型生成将会停止。以下为stop为array时的示例（tokenizer对应模型为qwen-turbo）： 1.元素为token_id： token_id为108386和104307分别对应token为“你好”和“天气”，设定stop为 `[108386,104307]` ，则模型将要生成“你好”或者“天气”时停止。 2.元素为字符串：设定stop为 `["你好","天气"]` ，则模型将要生成“你好”或者“天气”时停止。 3.元素为array： token_id为108386和103924分别对应token为“你好”和“啊”，token_id为35946和101243分别对应token为“我”和“很好”。设定stop为 `[[108386, 103924],[35946, 101243]]` ，则模型将要生成“你好啊”或者“我很好”时停止。
tools（可选）	array	None	用于指定可供模型调用的工具库，一次function call流程模型会从中选择其中一个工具。tools中每一个tool的结构如下： type，类型为string，表示tools的类型，当前仅支持function。 function，类型为object，键值包括name，description和parameters： name：类型为string，表示工具函数的名称，必须是字母、数字，可以包含下划线和短划线，最大长度为64。 description：类型为string，表示工具函数的描述，供模型选择何时以及如何调用工具函数。 parameters：类型为object，表示工具的参数描述，需要是一个合法的JSON Schema。JSON Schema的描述可以见链接。如果parameters参数为空，表示function没有入参。在function call流程中，无论是发起function call的轮次，还是向模型提交工具函数的执行结果，均需设置tools参数。当前支持的模型包括qwen-turbo、qwen-plus、qwen-max和qwen-max-longcontext。
stream_options（可选）	object	None	该参数用于配置在流式输出时是否展示使用的token数目。只有当stream为True的时候该参数才会激活生效。若您需要统计流式输出模式下的token数目，可将该参数配置为 `stream_options={"include_usage":True}` 。
enable_search (可选）	boolean	False	用于控制模型在生成文本时是否使用互联网搜索结果进行参考。取值如下： True：启用互联网搜索，模型会将搜索结果作为文本生成过程中的参考信息，但模型会基于其内部逻辑判断是否使用互联网搜索结果。 False（默认）：关闭互联网搜索。配置方式为： `extra_body={"enable_search": True}` 。

返回参数	数据类型	说明	备注
id	string	系统生成的标识本次调用的id。	无
model	string	本次调用的模型名。	无
system_fingerprint	string	模型运行时使用的配置版本，当前暂时不支持，返回为空字符串“”。	无
choices	array	模型生成内容的详情。	无
choices[i].finish_reason	string	有三种情况：正在生成时为null；因触发输入参数中的stop条件而结束为stop；因生成长度过长而结束为length。
choices[i].message	object	模型输出的消息。
choices[i].message.role	string	模型的角色，固定为assistant。
choices[i].message.content	string	模型生成的文本。
choices[i].index	integer	生成的结果序列编号，默认为0。
created	integer	当前生成结果的时间戳（s）。	无
usage	object	计量信息，表示本次请求所消耗的token数据。	无
usage.prompt_tokens	integer	用户输入文本转换成token后的长度。	您可以参考字符串与token之间的互相转换进行token的估计。
usage.completion_tokens	integer	模型生成回复转换为token后的长度。	无
usage.total_tokens	integer	usage.prompt_tokens与usage.completion_tokens的总和。	无

传参方式	参数	类型	默认值	说明
Header	Authorization	string	-	API-KEY，例如：Bearer d1**2a
Header	Content-Type	string	-	请求类型，例如：application/json
Body	model	string	-	用户使用model参数指明对应的模型。请参考模型概览。
	messages	array	-	用户与模型的对话历史。array中的每个元素形式为 `{"role":角色, "content": 内容}` 。角色当前可选值：system、user、assistant，其中，仅 `messages[0]` 中支持role为system，一般情况下，user和assistant需要交替出现，且messages中最后一个元素的role必须为user。
	`top_p` （可选）	float	-	生成过程中的核采样方法概率阈值，例如，取值为0.8时，仅保留概率加起来大于等于0.8的最可能token的最小集合作为候选集。取值范围为（0,1.0)，取值越大，生成的随机性越高；取值越低，生成的确定性越高。
	temperature（可选）	float	-	用于控制模型回复的随机性和多样性。具体来说，temperature值控制了生成文本时对每个候选词的概率分布进行平滑的程度。较高的temperature值会降低概率分布的峰值，使得更多的低概率词被选择，生成结果更加多样化；而较低的temperature值则会增强概率分布的峰值，使得高概率词更容易被选择，生成结果更加确定。取值范围： [0, 2)，不建议取值为0，无意义。
	presence_penalty （可选）	float	-	用户控制模型生成时整个序列中的重复度。提高presence_penalty时可以降低模型生成的重复度，取值范围[-2.0, 2.0]。
	max_tokens（可选）	integer	-	指定模型可生成的最大token个数。根据模型不同有不同的上限限制，一般不超过2000。
	response_foramt（可选）	object	`{"type": "text"}`	用于指定返回内容的格式。可选值： `{"type": "text"}` 或 `{"type": "json_object"}` 。设置为 `{"type": "json_object"}` 时会输出标准格式的JSON字符串。
	seed（可选）	integer	-	生成时使用的随机数种子，用于控制模型生成内容的随机性。seed支持无符号64位整数。
	stream（可选）	boolean	False	用于控制是否使用流式输出。当以stream模式输出结果时，接口返回结果为generator，需要通过迭代获取结果，每次输出为当前生成的增量序列。
	stop（可选）	string or array	None	stop参数用于实现内容生成过程的精确控制，在模型生成的内容即将包含指定的字符串或token_id时自动停止。stop可以为string类型或array类型。 string类型当模型将要生成指定的stop词语时停止。例如将stop指定为"你好"，则模型将要生成“你好”时停止。 array类型 array中的元素可以为token_id或者字符串，或者元素为token_id的array。当模型将要生成的token或其对应的token_id在stop中时，模型生成将会停止。以下为stop为array时的示例（tokenizer对应模型为qwen-turbo）： 1.元素为token_id： token_id为108386和104307分别对应token为“你好”和“天气”，设定stop为 `[108386,104307]` ，则模型将要生成“你好”或者“天气”时停止。 2.元素为字符串：设定stop为 `["你好","天气"]` ，则模型将要生成“你好”或者“天气”时停止。 3.元素为array： token_id为108386和103924分别对应token为“你好”和“啊”，token_id为35946和101243分别对应token为“我”和“很好”。设定stop为 `[[108386, 103924],[35946, 101243]]` ，则模型将要生成“你好啊”或者“我很好”时停止。
	tools（可选）	array	None	用于指定可供模型调用的工具库，一次function call流程模型会从中选择其中一个工具。tools中每一个tool的结构如下： type，类型为string，表示tools的类型，当前仅支持function。 function，类型为object，键值包括name，description和parameters： name：类型为string，表示工具函数的名称，必须是字母、数字，可以包含下划线和短划线，最大长度为64。 description：类型为string，表示工具函数的描述，供模型选择何时以及如何调用工具函数。 parameters：类型为object，表示工具的参数描述，需要是一个合法的JSON Schema。JSON Schema的描述可以见链接。如果parameters参数为空，表示function没有入参。在function call流程中，无论是发起function call的轮次，还是向模型提交工具函数的执行结果，均需设置tools参数。
	stream_options（可选）	object	None	该参数用于配置在流式输出时是否展示使用的token数目。只有当stream为True的时候该参数才会激活生效。若您需要统计流式输出模式下的token数目，可将该参数配置为 `stream_options={"include_usage":True}` 。
	enable_search (可选，通过extra_body配置）	boolean	false	用于控制模型在生成文本时是否使用互联网搜索结果进行参考。取值如下： true：启用互联网搜索，模型会将搜索结果作为文本生成过程中的参考信息，但模型会基于其内部逻辑判断是否使用互联网搜索结果。 false（默认）：关闭互联网搜索。配置方式为： `"enable_search" : true` 。

返回参数	数据类型	说明	备注
id	string	系统生成的标识本次调用的ID。	无
model	string	本次调用的模型名。	无
system_fingerprint	string	模型运行时使用的配置版本，当前暂时不支持，返回为空字符串“”。	无
choices	array	模型生成内容的详情。	无
choices[i].finish_reason	string	有三种情况：正在生成时为null；因触发输入参数中的stop条件而结束为stop；因生成长度过长而结束为length。
choices[i].message	object	模型输出的消息。
choices[i].message.role	string	模型的角色，固定为assistant。
choices[i].message.content	string	模型生成的文本。
choices[i].index	integer	生成的结果序列编号，默认为0。
created	integer	当前生成结果的时间戳（s）。	无
usage	object	计量信息，表示本次请求所消耗的token数据。	无
usage.prompt_tokens	integer	用户输入文本转换成token后的长度。	您可以参考字符串与token之间的互相转换进行token的估计。
usage.completion_tokens	integer	模型生成回复转换为token后的长度。	无
usage.total_tokens	integer	usage.prompt_tokens与usage.completion_tokens的总和。	无

参数	数据类型	默认值	说明
model（必选）	string	无	指定用于对话的通义千问模型名。请参考模型概览。
messages	array	无	`messages` ：用户与模型的对话历史。array中的每个元素形式为 `{"role":角色, "content": 内容}` ，角色当前可选值： `system` 、 `user` 、 `assistant` 和 `tool` 。 `system` ：表示系统级消息，用于指导模型按照预设的规范、角色或情境进行回应。是否使用 `system` 角色是可选的，如果使用则必须位于messages的最开始部分。 `user` 和 `assistant` ：表示用户和模型的消息。它们应交替出现在对话中，模拟实际对话流程。 `tool` ：表示工具的消息。在使用function call功能时，如果要传入工具的结果，需将元素的形式设为{"content":"工具返回的结果", "name":"工具的函数名", "role":"tool"}。其中name是工具函数的名称，需要和上轮response中的tool_calls[i]['function']['name']参数保持一致；content是工具函数的输出。 `prompt` ：用户输入的指令，用于指导模型生成回复。
prompt	string	无（与messages不可同时为空）
seed（可选）	integer		生成时使用的随机数种子，用于控制模型生成内容的随机性。seed支持无符号64位整数。
max_tokens（可选）	integer	1500或2000	指定模型可生成的最大token个数。 `qwen-turbo` 最大值和默认值为1500 tokens。 `qwen-max` 、 `qwen-max-1201` 、 `qwen-max-longcontext` 和 `qwen-plus` 模型，最大值和默认值均为2000 tokens。
top_p（可选）	float		生成过程中的核采样方法概率阈值，例如，取值为0.8时，仅保留概率加起来大于等于0.8的最可能token的最小集合作为候选集。取值范围为（0,1.0)，取值越大，生成的随机性越高；取值越低，生成的确定性越高。
top_k（可选）	integer		生成时，采样候选集的大小。例如，取值为50时，仅将单次生成中得分最高的50个token组成随机采样的候选集。取值越大，生成的随机性越高；取值越小，生成的确定性越高。取值为None或当top_k大于100时，表示不启用top_k策略，此时，仅有top_p策略生效。
repetition_penalty（可选）	float		用于控制模型生成时连续序列中的重复度。提高repetition_penalty时可以降低模型生成的重复度，1.0表示不做惩罚。没有严格的取值范围，只要大于0即可。
presence_penalty（可选）	float		用户控制模型生成时整个序列中的重复度。提高presence_penalty时可以降低模型生成的重复度，取值范围[-2.0, 2.0]。
temperature（可选）	float		用于控制模型回复的随机性和多样性。具体来说，temperature值控制了生成文本时对每个候选词的概率分布进行平滑的程度。较高的temperature值会降低概率分布的峰值，使得更多的低概率词被选择，生成结果更加多样化；而较低的temperature值则会增强概率分布的峰值，使得高概率词更容易被选择，生成结果更加确定。取值范围：[0, 2)，不建议取值为0，无意义。
stop (可选）	string or array	None	stop参数用于实现内容生成过程的精确控制，在模型生成的内容即将包含指定的字符串或token_id时自动停止。stop可以为string类型或array类型。 string类型当模型将要生成指定的stop词语时停止。例如将stop指定为"你好"，则模型将要生成“你好”时停止。 array类型 array中的元素可以为token_id或者字符串，或者元素为token_id的array。当模型将要生成的token或其对应的token_id在stop中时，模型生成将会停止。以下为stop为array时的示例（tokenizer对应模型为qwen-turbo）： 1.元素为token_id： token_id为108386和104307分别对应token为“你好”和“天气”，设定stop为 `[108386,104307]` ，则模型将要生成“你好”或者“天气”时停止。 2.元素为字符串：设定stop为 `["你好","天气"]` ，则模型将要生成“你好”或者“天气”时停止。 3.元素为array： token_id为108386和103924分别对应token为“你好”和“啊”，token_id为35946和101243分别对应token为“我”和“很好”。设定stop为 `[[108386, 103924],[35946, 101243]]` ，则模型将要生成“你好啊”或者“我很好”时停止。
stream (可选）	boolean	False	用于控制是否使用流式输出。当以stream模式输出结果时，接口返回结果为generator，需要通过迭代获取结果，默认每次输出为当前生成的整个序列，最后一次输出为最终全部生成结果，可以通过设置参数incremental_output为False改变输出模式为非增量输出。
enable_search（可选）	boolean	False	用于控制模型在生成文本时是否使用互联网搜索结果进行参考。取值如下： True：启用互联网搜索，模型会将搜索结果作为文本生成过程中的参考信息，但模型会基于其内部逻辑判断是否使用互联网搜索结果。 False（默认）：关闭互联网搜索。
result_format（可选）	string	text	用于指定返回结果的格式，默认为text，也可选择message。推荐您优先使用message格式。
incremental_output (可选）	boolean	False	控制在流式输出模式下是否开启增量输出，即后续输出内容是否包含已输出的内容。设置为True时，将开启增量输出模式，后面输出不会包含已经输出的内容，您需要自行拼接整体输出；设置为False则会包含已输出的内容。默认False： I I like I like apple True: I like apple 该参数只能在stream为True时使用。
tools	array	None	用于指定可供模型调用的工具库，一次function call流程模型会从中选择其中一个工具。tools中每一个tool的结构如下： type，类型为string，表示tools的类型，当前仅支持function。 function，类型为object，键值包括name，description和parameters： name：类型为string，表示工具函数的名称，必须是字母、数字，可以包含下划线和短划线，最大长度为64。 description：类型为string，表示工具函数的描述，供模型选择何时以及如何调用工具函数。 parameters：类型为object，表示工具的参数描述，需要是一个合法的JSON Schema。JSON Schema的描述可以见链接。如果parameters参数为空，表示function没有入参。使用tools时需要同时指定result_format为message。在function call流程中，无论是发起function call的轮次，还是向模型提交工具函数的执行结果，均需设置tools参数。
tool_choice	string or object	见说明	在使用tools参数时，用于控制模型调用指定工具。有三种取值： `"none"` 表示不调用工具。tools参数为空时，默认值为 `"none"` 。 `"auto"` 表示模型判断是否调用工具，可能调用也可能不调用。tools参数不为空时，默认值为 `"auto"` 。 object结构可以指定模型调用指定工具。例如 `tool_choice={"type": "function", "function": {"name": "user_function"}}` 。 type只支持指定为 `"function"` 。 function name表示期望被调用的工具名称，例如 `"get_current_time"` 。

传参方式	字段	数据类型	必选	描述	示例值
Header	Content-Type	string	是	请求类型：application/json	"Content-Type":"application/json"
	Accept	string	否	选择text/event-stream则会开启SSE响应，默认无设置。	"Accept":"text/event-stream"
	Authorization	string	是	API-KEY，例如：Bearer d1**2a	"Authorization":"Bearer d1**2a"
	X-DashScope-WorkSpace	string	否	指明本次调用需要使用的workspace；需要注意的是，对于子账号Apikey调用，此参数为必选项，子账号必须归属于某个workspace才能调用；对于主账号Apikey此项为可选项，添加则使用对应的workspace身份，不添加则使用主账号身份。	ws_QTggmeAxxxxx
	X-DashScope-SSE	string	否	设置为enable或者设置Accept: text/event-stream即可启用SSE响应。	"X-DashScope-SSE":"enable"
Body	model	string	是	指定用于对话的通义千问模型名。请参考模型概览。	"model":"qwen-turbo"
	input	object	是	输入模型的信息。	无
	input.prompt	string	否	用户当前输入的期望模型执行指令，支持中英文。与input.messages指定其中一个即可。	"input":{"prompt":"你好"}
	input.history	array	否	即将废弃，请使用messages字段。用户与模型的对话历史，array中的每个元素形式为{"user":"用户输入","bot":"模型输出"}的一轮对话，多轮对话按时间正序排列。	"input":{"history":[{"user":"今天天气好吗？", "bot":"今天天气不错，要出去玩玩嘛？"}, {"user":"那你有什么地方推荐？", "bot":"我建议你去公园，春天来了，花朵开了，很美丽。"}]}
	input.messages	array	否	表示用户与模型的对话历史。array中的每个元素形式为 `{"role":角色, "content": 内容}` ，如果role为tool，元素形式为： `{"role":"tool","content":内容,"name":工具函数名}` 角色可选值： `system` 、 `user` 、 `assistant` 和 `tool` 。	"input":{ "messages":[ { "role": "system", "content": "You are a helpful assistant." }, { "role": "user", "content": "你好，附近哪里有博物馆？" }] }
	input.messages.role	string	messages存在的时候不能省略。
	input.messages.content	string	messages存在的时候不能省略。
	input.messages.name	string	input.messages.role为tool时不能省略	role为 `tool` 表示当前message为function_call的调用结果，name是工具函数名，需要和上轮response中的tool_calls[i].function.name参数保持一致，content为工具函数的输出。
	parameters	object	否	用于控制模型生成的参数	无
	parameters.result_format	string	否	用于指定返回结果的格式，默认为text，也可设置为message。推荐优先使用message格式。	"parameters":{"result_format":"message"}
	parameters.seed	integer	否	生成时使用的随机数种子，用户控制模型生成内容的随机性。seed支持无符号64位整数。在使用seed时，模型将尽可能生成相同或相似的结果，但目前不保证每次生成的结果完全相同。	"parameters":{"seed":666}
	parameters.max_tokens	integer	否	用于限制模型生成token的数量，表示生成token个数的上限。其中qwen-turbo最大值和默认值为1500，qwen-max、qwen-max-1201 、qwen-max-longcontext 和 qwen-plus最大值和默认值均为2000。	"parameters":{"max_tokens":1500}
	parameters.top_p	float	否	生成时，核采样方法的概率阈值。例如，取值为0.8时，仅保留累计概率之和大于等于0.8的概率分布中的token，作为随机采样的候选集。取值范围为（0,1.0)，取值越大，生成的随机性越高；取值越低，生成的随机性越低。注意，取值不要大于等于1。	"parameters":{"top_p":0.7}
	parameters.top_k	integer	否	生成时，采样候选集的大小。例如，取值为50时，仅将单次生成中得分最高的50个token组成随机采样的候选集。取值越大，生成的随机性越高；取值越小，生成的确定性越高。注意：如果top_k参数为空或者top_k的值大于100，表示不启用top_k策略，此时仅有top_p策略生效。	"parameters":{"top_k":50}
	parameters.repetition_penalty	float	否	用于控制模型生成时连续序列中的重复度。提高repetition_penalty时可以降低模型生成的重复度。1.0表示不做惩罚。没有严格的取值范围，只要大于0即可。	"parameters":{"repetition_penalty":1.0}
	parameters.presence_penalty	float	否	用户控制模型生成时整个序列中的重复度。提高presence_penalty时可以降低模型生成的重复度，取值范围 [-2.0, 2.0]。	"parameters":{"presence_penalty":1.0}
	parameters.temperature	float	否	用于控制随机性和多样性的程度。具体来说，temperature值控制了生成文本时对每个候选词的概率分布进行平滑的程度。较高的temperature值会降低概率分布的峰值，使得更多的低概率词被选择，生成结果更加多样化；而较低的temperature值则会增强概率分布的峰值，使得高概率词更容易被选择，生成结果更加确定。取值范围：[0, 2)，不建议取值为0，无意义。	"parameters":{"temperature":0.85}
	parameters.stop	string/array	否	stop参数用于实现内容生成过程的精确控制，在模型生成的内容即将包含指定的字符串或token_id时自动停止，生成的内容不包含指定的内容。stop可以为string类型或array类型。 string类型当模型将要生成指定的stop词语时停止。例如将stop指定为"你好"，则模型将要生成“你好”时停止。 array类型 array中的元素可以为token_id或者字符串，或者元素为token_id的array。当模型将要生成的token或其对应的token_id在stop中时，模型生成将会停止。例如将stop指定为 `["你好","天气"]` 或者 `[108386,104307]` ，则模型将要生成“你好”或者“天气”时停止。如果将stop指定为 `[[108386, 103924],[35946, 101243]]` ，则模型将要生成“你好啊”或者“我很好”时停止。	"parameters":{"stop":["你好","天气"]}
	parameters.enable_search	boolean	否	模型内置了互联网搜索服务，该参数控制模型在生成文本时是否参考使用互联网搜索结果。取值如下： true：启用互联网搜索，模型会将搜索结果作为文本生成过程中的参考信息，但模型会基于其内部逻辑“自行判断”是否使用互联网搜索结果。 false（默认）：关闭互联网搜索。	"parameters":{"enable_search":false}
	parameters.incremental_output	boolean	否	控制在流式输出模式下是否开启增量输出，即后续输出内容是否包含已输出的内容。设置为True时，将开启增量输出模式，后面输出不会包含已经输出的内容，您需要自行拼接整体输出；设置为False则会包含已输出的内容。默认False： I I like I like apple True: I like apple 该参数只能在开启SSE响应时使用。	"parameters":{"incremental_output":false}
	parameters.tools	array	否	用于指定可供模型调用的工具列表。当输入多个工具时，模型会选择其中一个生成结果。tools中每一个tool的结构如下： type，类型为string，表示tools的类型，当前仅支持function。 function，类型为object，键值包括name，description和parameters： name：类型为string，表示工具函数的名称，必须是字母、数字，可以包含下划线和短划线，最大长度为64。 description：类型为string，表示工具函数的描述，供模型选择何时以及如何调用工具函数。 parameters：类型为object，表示工具的参数描述，需要是一个合法的JSON Schema。JSON Schema的描述可以见链接。使用tools时需要同时指定result_format为message。在function call流程中，无论是发起function call的轮次，还是向模型提交工具函数的执行结果，均需设置tools参数。	`"parameters":{"tools":[ "type": "function", "function": { "name": "get_current_weather", "description": "Get the current weather in a given location", "parameters": { "type": "object", "properties": { "location": { "type": "string", "description": "The city and state, e.g. San Francisco, CA" "unit": { "type": "string", "enum": [ "celsius", "fahrenheit" "required": [ "location" ]}`
	parameters.tool_choice	string/object	否	在使用tools参数时，用于控制模型调用指定工具。有三种取值： `"none"` 表示不调用工具。tools参数为空时，默认值为 `"none"` 。 `"auto"` 表示模型判断是否调用工具，可能调用也可能不调用。tools参数不为空时，默认值为 `"auto"` 。 object结构可以指定模型调用指定工具。例如 `tool_choice={"type": "function", "function": {"name": "user_function"}}` 。 type只支持指定为 `"function"` 。 function name表示期望被调用的工具名称，例如 `"get_current_time"` 。	`{"type": "function", "function": {"name": "user_function"}}`

字段	数据类型	描述	示例值
output.text	string	模型输出的内容。当result_format设置为text时返回该字段。	我建议你去颐和园
output.finish_reason	string	有三种情况：正在生成时为null，生成结束时如果由于停止token导致则为stop，生成结束时如果因为生成长度过长导致则为length。当result_format设置为text时返回该字段。	stop
output.choices	array	当result_format设置为message时返回该字段。	普通示例 `{ "choices": [ "finish_reason": "null", "message": { "role": "assistant", "content": "周围的咖啡馆在..." }` function call示例 `{ "choices": [ "finish_reason": "tool_calls", "message": { "role": "assistant", "content": "", "tool_calls": [ "function": { "name": "get_current_weather", "arguments": "{\"location\": \"Boston\", \"unit\": \"fahrenheit\"}" "type": "function" }`
output.choices[x].finish_reason	string	停止原因，null：生成过程中 stop：stop token导致结束 length：生成长度导致结束
output.choices[x].message	object	message每个元素形式为{"role":角色, "content": 内容}。content为模型输出的内容。
output.choices[x].message.role	string
output.choices[x].message.content	string
output.choices[x].message.tool_calls	object	如果模型需要调用工具，则会生成tool_calls参数，应用于function_call场景。其中包含type和function两个参数，参数详情如下： type，类型为string，当前只可能为function function，类型为dict，包含name和arguments两个参数： name，类型为string，表示需要调用的工具的名称，如果是function_call场景则表示要调用的function名称 arguments，类型为string，表示模型生成的工具入参，在Python中可以使用json.loads方法转化为字典类型。
usage	object	本次调用使用的token信息。	无
usage.output_tokens	integer	模型输出内容的 token个数。	380
usage.input_tokens	integer	本次请求输入内容的token个数。在enable_search设置为true时，输入的 token 数目由于需要添加搜索相关内容，因此会比您在请求中的输入token个数多。	633
usage.total_tokens	integer	usage.output_tokens与usage.input_tokens的总和。	1013
request_id	string	本次请求的系统唯一码。	7574ee8f-38a3-4b1e-9280-11c33ab46e51

通过API使用通义千问

前提条件

场景示例

单轮对话

OpenAI兼容

Python

示例代码

返回结果

curl

示例代码

返回结果

DashScope

Python

示例代码

返回结果

返回结果

curl

示例代码

返回结果

多轮对话

OpenAI兼容

Python

示例代码

返回结果

curl

示例代码

返回结果

DashScope

Python

示例代码

返回结果

Java

示例代码

返回结果

curl

示例代码

返回结果

流式输出

OpenAI兼容

Python

示例代码

返回结果

curl

示例代码

返回结果

DashScope

Python

示例代码

返回结果

返回结果

curl

示例代码

返回结果

Function Call（调用外部工具）

OpenAI兼容

Python

示例代码

返回结果

输入：杭州天气

输入：你好

HTTP

示例代码

返回结果

输入：杭州天气

输入：你好

DashScope

Python

示例代码

返回结果

输入：杭州天气

输入：你好

返回结果

输入：杭州天气

输入：你好

HTTP

示例代码

返回结果

输入：杭州天气

输入：你好

结构化输出