1. Gemini Nano Banana(Google 生图)
心流API 接口文档
  • 引言
  • 在线调试说明
  • 发出请求
  • 中转站基本介绍
    • API 快速开始指南
    • 联系客服
    • 代理接口调用地址
    • API Key 额度查询服务
  • 通用接口
    • 文本通用接口
      POST
    • 图片通用接口
      POST
    • 视频通用接口
      POST
  • 图像模型
    • GPT Image 2(OpenAI 生图)
      • GPT Image 2 文生图
      • GPT Image 2 图生图(编辑)
    • Gemini Nano Banana(Google 生图)
      • Gemini Nano Banana 图片生成
        POST
      • 文本通用接口(Gemini 原生格式)
        POST
    • Grok Imagine(xAI 生图)
      • Grok 文生图(同步)
  • 视频模型
    • Grok Imagine 1.0 视频
      • Grok Imagine 1.0 视频生成
    • Grok Imagine 1.5 Video Preview(xAI 文生/图生视频)
      • Grok Imagine Video Preview 视频生成
      • Grok Imagine Video 1.5 Preview 视频生成
    • Grok Imagine 1.5 720p(xAI 图生视频)
      • Grok Imagine 1.5 Super 视频生成
    • Veo(Google 视频生成)
      • Veo 视频生成
      • Veo 视频延长(Extend)
    • Omni 系列(omni_flash · 文生 / 图生 / 视频修改)
      • Omni 视频生成(omni_flash-10s)
    • Grok Video 3 系列(xAI 新族)
      • Grok Video 3 视频生成
    • Sora 2(OpenAI 视频生成)
      • Sora 2 视频生成
    • Grok Video 10s
      • Grok Video 6s/10s/12s 视频生成
    • HappyHorse 1.0 系列(阿里淘天)
      • HappyHorse 1.0 视频生成
    • 豆包 Seedance 2.0 Fast
      • 豆包 Seedance 2.0 Fast 视频生成
    • 视频任务查询(共用)
      GET
    • 视频内容下载(共用)
      GET
  • 系统 API(客户可用)
    • 拉取模型列表
    • 查询当前令牌用量
    • 系统状态 / 公告
  • 各种插件/软件使用教程
    • Codex 配置教程
    • OpenClaw Clawdbot 自定义中转站配置教程
    • N8N 工作流使用中转API 教程
    • opencode 配置教程
    • Gemini CLI 中转站配置使用教程
    • Claude Code 安装使用教程
    • CherryStudio调用cluade MCP
    • Cherry Studio配置教程
    • Cherry Studio配置 banana pro 4K和分辨率教程
    • CherryStudio配置o4推理级别
    • 扣子工作流简单配置从输入到获取url
    • dify添加模型
    • cline 配置教程
    • aider 配置教程
    • Cursor 配置教程
    • lobechat 设置教程
    • ChatBox(推荐使用)
    • 开源gpt_academic
    • nextchat 设置教程
    • zotero gpt 配置方法
    • CLAUDE DEV 配置教程
    • 沉浸式翻译 设置gpt翻译
    • 浏览器插件ChatGPT Sidebar
    • chatgpt-on-wechat 配置教程
    • chatgpt GPT Academic 学术优化配置gpt教程
    • RikkaHub 配置教程
    • coze 工作流使用中转API 教程
    • n8n 工作流获取本地图片生成视频例子
    • OpenClaw 最新版本 自定义中转站配置教程
    • OpenClaw配合CC switch自定义中转站配置教程
  • 帮助中心
    • AI返回字段: 思考相关
    • HTTP状态码及其含义
    • 自建图床API
  • Python配置方式
    • python 使用 语音转文本
    • python 使用文本转语音
    • python 使用Embeddings 向量化
    • python 调用DALL·E
    • python简单调用 openai function-calling demo
    • python 简单langchain 调用openai demo
    • python llama_index 配置
    • Python基础对话
    • Python使用gpt-4o识别图片-本地图片
    • Python使用gpt-4o识别图片
    • Python使用Claude识别图片
    • python 库流式输出
    • gpt realtime模型调用
    • python request 请求 流式输出demo
    • python 使用gpt-image-1 创建编辑图片
    • python openai官方库(使用AutoGPT,langchain等)
    • python 连续对话
  • php配置方式
    • php使用图片编辑demo
  • nodejs 配置方式
    • nodejs 基础对话
  1. Gemini Nano Banana(Google 生图)

文本通用接口(Gemini 原生格式)

POST
/v1beta/models/{model}:generateContent

Gemini 原生对话 / 多模态识别

Google Gemini 原生 :generateContent 协议,同步返回。SDK 用 @google/genai 时,把 base_url 指向心流即可使用。

支持三种用法:

  1. 纯文本对话(gemini-2.5-flash、gemini-2.5-pro 等)
  2. 多模态识别(图片 / PDF / 音频 / 视频 + 文字提示)
  3. 图片生成(gemini-*-image-preview 系列,详见「图像模型 → Gemini Nano Banana」)

接入地址

线路Base URL说明
国内加速(推荐)https://cdn.wusag.com走国内 CDN 节点
海外直连https://api.xinliu.one海外服务器或加速节点异常时使用

两个地址共用同一账户和 Key。

请求

  • 方法:POST {Base URL}/v1beta/models/{model}:generateContent
  • Header:
    • Authorization: Bearer 你的令牌
    • Content-Type: application/json

模型分组

心流不同分组的 Gemini 模型权限不同。如果遇到「分组 xxx 下模型 yyy 无可用渠道」,请联系客服切换到对应分组的令牌。

分组包含模型用途
普通分组gemini-*-image-preview 系列图片生成
企业分组gemini-2.5-flash gemini-2.5-pro gemini-3-*-preview 等文本对话 / 多模态识别

文本对话模型

model用途
gemini-2.5-flash快速、便宜,常用首选
gemini-2.5-pro高质量推理
gemini-3-pro-previewGemini 3 Pro 预览
gemini-3-pro-preview-thinkingGemini 3 Pro 推理增强
gemini-3-flash-previewGemini 3 Flash
gemini-3-flash-preview-thinkingGemini 3 Flash 推理增强
gemini-3.1-pro-previewGemini 3.1 Pro
gemini-3.1-pro-preview-thinkingGemini 3.1 Pro 推理增强

参数

字段类型必填说明
contentsarray是对话内容列表
contents[].rolestring是user 或 model(不是 assistant)
contents[].partsarray是内容部件,可多个并存
contents[].parts[].textstring—文本部分
contents[].parts[].inline_dataobject—多模态输入
contents[].parts[].inline_data.mime_typestring—见下方 mime 表
contents[].parts[].inline_data.datastring—Base64(不含 data: 前缀)
generationConfig.temperaturenumber否0~2
generationConfig.topP / topK—否
generationConfig.maxOutputTokensint否最大输出 token 数
generationConfig.stopSequencesarray否停止序列
generationConfig.thinkingConfig.thinkingBudgetint否推理 token 预算,传 0 关闭推理
safetySettingsarray否安全阈值 [{category, threshold}]
toolsarray否工具调用
systemInstructionobject否系统指令 {parts:[{text:"..."}]}

多模态 mime_type

  • 图片:image/png image/jpeg image/webp
  • PDF:application/pdf
  • 音频:audio/mpeg audio/mp3 audio/wav
  • 视频:video/mp4 video/mov

心流仅支持 inline_data Base64,不支持 Google 原版的 fileData.fileUri。

多模态请求示例

{
  "contents": [{
    "role": "user",
    "parts": [
      {
        "inline_data": {
          "mime_type": "image/png",
          "data": "iVBORw0KGgo..."
        }
      },
      { "text": "这张图里有什么?" }
    ]
  }],
  "generationConfig": { "maxOutputTokens": 200 }
}

返回字段

字段说明
candidates[].content.parts[].text模型回复文本
candidates[].finishReasonSTOP 正常 / MAX_TOKENS 截断 / SAFETY 安全过滤 / RECITATION 版权命中
usageMetadata.thoughtsTokenCount推理 token 用量(单独计费)
usageMetadata.promptTokensDetails拆分 TEXT 和 IMAGE token

请求示例(纯文本)

curl https://cdn.wusag.com/v1beta/models/gemini-2.5-flash:generateContent \
  -H "Authorization: Bearer 你的令牌" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{
      "role": "user",
      "parts": [{"text": "你好,请介绍一下你自己"}]
    }],
    "generationConfig": {"maxOutputTokens": 200}
  }'

请求示例(多模态识图)

# 先把图片转 base64
B64=$(base64 -w0 < your_image.png)

curl https://cdn.wusag.com/v1beta/models/gemini-2.5-flash:generateContent \
  -H "Authorization: Bearer 你的令牌" \
  -H "Content-Type: application/json" \
  -d "{
    \"contents\": [{
      \"role\": \"user\",
      \"parts\": [
        {\"inline_data\": {\"mime_type\": \"image/png\", \"data\": \"$B64\"}},
        {\"text\": \"这张图里有什么?\"}
      ]
    }],
    \"generationConfig\": {\"maxOutputTokens\": 200}
  }"

返回示例(纯文本)

{
  "candidates": [{
    "content": {
      "role": "model",
      "parts": [{"text": "你好!"}]
    },
    "finishReason": "STOP",
    "index": 0
  }],
  "usageMetadata": {
    "promptTokenCount": 6,
    "candidatesTokenCount": 1,
    "totalTokenCount": 22,
    "thoughtsTokenCount": 15,
    "promptTokensDetails": [{"modality": "TEXT", "tokenCount": 6}]
  },
  "modelVersion": "gemini-2.5-flash"
}

返回示例(多模态)

多模态请求的 usageMetadata.promptTokensDetails 会拆出 TEXT 和 IMAGE 两类 token:

{
  "candidates": [{
    "content": {"role": "model", "parts": [{"text": "Red"}]},
    "finishReason": "STOP",
    "index": 0
  }],
  "usageMetadata": {
    "promptTokenCount": 273,
    "candidatesTokenCount": 1,
    "totalTokenCount": 319,
    "thoughtsTokenCount": 45,
    "promptTokensDetails": [
      {"modality": "TEXT", "tokenCount": 15},
      {"modality": "IMAGE", "tokenCount": 258}
    ]
  }
}

错误码

  • 400 参数错误
  • 401 令牌无效或未提供
  • 402 余额不足
  • 404 模型不存在或未开通
  • 429 速率限制
  • 500 服务端错误

请求参数

Authorization
在 Header 添加参数
Authorization
,其值为在 Bearer 之后拼接 Token
示例:
Authorization: Bearer ********************
Path 参数

Header 参数

Body 参数application/json

示例
{
    "contents": [
        {
            "role": "string",
            "parts": [
                "string"
            ]
        }
    ],
    "generationConfig": {
        "temperature": 0,
        "maxOutputTokens": 0
    }
}

请求示例代码

Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location '/v1beta/models/gemini-2.5-flash:generateContent' \
--header 'Authorization: Bearer <token>' \
--header 'Content-Type: application/json' \
--data '{
    "contents": [
        {
            "role": "string",
            "parts": [
                "string"
            ]
        }
    ],
    "generationConfig": {
        "temperature": 0,
        "maxOutputTokens": 0
    }
}'

返回响应

🟢200成功
application/json
成功
Bodyapplication/json

示例
{}
修改于 2026-06-02 19:33:16
上一页
Gemini Nano Banana 图片生成
下一页
Grok 文生图(同步)
Built with