1. Python配置方式
心流API 接口文档
  • 引言
  • 在线调试说明
  • 发出请求
  • 中转站基本介绍
    • API 快速开始指南
    • 联系客服
    • 代理接口调用地址
    • API Key 额度查询服务
  • 通用接口
    • 文本通用接口
      POST
    • 图片通用接口
      POST
    • 视频通用接口
      POST
  • 图像模型
    • GPT Image 2(OpenAI 生图)
      • GPT Image 2 文生图
      • GPT Image 2 图生图(编辑)
    • Gemini Nano Banana(Google 生图)
      • Gemini Nano Banana 图片生成
      • 文本通用接口(Gemini 原生格式)
    • Grok Imagine(xAI 生图)
      • Grok 文生图(同步)
  • 视频模型
    • Grok Imagine 1.0 视频
      • Grok Imagine 1.0 视频生成
    • Grok Imagine 1.5 Video Preview(xAI 文生/图生视频)
      • Grok Imagine Video Preview 视频生成
      • Grok Imagine Video 1.5 Preview 视频生成
    • Grok Imagine 1.5 720p(xAI 图生视频)
      • Grok Imagine 1.5 Super 视频生成
    • Veo(Google 视频生成)
      • Veo 视频生成
      • Veo 视频延长(Extend)
    • Omni 系列(omni_flash · 文生 / 图生 / 视频修改)
      • Omni 视频生成(omni_flash-10s)
    • Grok Video 3 系列(xAI 新族)
      • Grok Video 3 视频生成
    • Sora 2(OpenAI 视频生成)
      • Sora 2 视频生成
    • Grok Video 10s
      • Grok Video 6s/10s/12s 视频生成
    • HappyHorse 1.0 系列(阿里淘天)
      • HappyHorse 1.0 视频生成
    • 豆包 Seedance 2.0 Fast
      • 豆包 Seedance 2.0 Fast 视频生成
    • 视频任务查询(共用)
    • 视频内容下载(共用)
  • 系统 API(客户可用)
    • 拉取模型列表
    • 查询当前令牌用量
    • 系统状态 / 公告
  • 各种插件/软件使用教程
    • Codex 配置教程
    • OpenClaw Clawdbot 自定义中转站配置教程
    • N8N 工作流使用中转API 教程
    • opencode 配置教程
    • Gemini CLI 中转站配置使用教程
    • Claude Code 安装使用教程
    • CherryStudio调用cluade MCP
    • Cherry Studio配置教程
    • Cherry Studio配置 banana pro 4K和分辨率教程
    • CherryStudio配置o4推理级别
    • 扣子工作流简单配置从输入到获取url
    • dify添加模型
    • cline 配置教程
    • aider 配置教程
    • Cursor 配置教程
    • lobechat 设置教程
    • ChatBox(推荐使用)
    • 开源gpt_academic
    • nextchat 设置教程
    • zotero gpt 配置方法
    • CLAUDE DEV 配置教程
    • 沉浸式翻译 设置gpt翻译
    • 浏览器插件ChatGPT Sidebar
    • chatgpt-on-wechat 配置教程
    • chatgpt GPT Academic 学术优化配置gpt教程
    • RikkaHub 配置教程
    • coze 工作流使用中转API 教程
    • n8n 工作流获取本地图片生成视频例子
    • OpenClaw 最新版本 自定义中转站配置教程
    • OpenClaw配合CC switch自定义中转站配置教程
  • 帮助中心
    • AI返回字段: 思考相关
    • HTTP状态码及其含义
    • 自建图床API
  • Python配置方式
    • python 使用 语音转文本
    • python 使用文本转语音
    • python 使用Embeddings 向量化
    • python 调用DALL·E
    • python简单调用 openai function-calling demo
    • python 简单langchain 调用openai demo
    • python llama_index 配置
    • Python基础对话
    • Python使用gpt-4o识别图片-本地图片
    • Python使用gpt-4o识别图片
    • Python使用Claude识别图片
    • python 库流式输出
    • gpt realtime模型调用
    • python request 请求 流式输出demo
    • python 使用gpt-image-1 创建编辑图片
    • python openai官方库(使用AutoGPT,langchain等)
    • python 连续对话
  • php配置方式
    • php使用图片编辑demo
  • nodejs 配置方式
    • nodejs 基础对话
  1. Python配置方式

python 使用文本转语音

文字转语音 (TTS) API 指南#

概述#

音频 API 提供 speech 端点,基于 TTS 模型实现以下功能:
📝 博客文章朗读
🌍 多语言音频生成
🎵 实时音频流输出
重要提示:必须向用户声明所听到的是 AI 生成的语音,而非人类声音

基础使用#

基本示例#

功能特性#

音频质量选项#

tts-1: 低延迟,适合实时应用
tts-1-hd: 更高质量,可能有更少的静态内容

可用声音#

alloy
echo
fable
nova
shimmer
onyx

支持的输出格式#

格式特点适用场景
MP3默认格式通用场景
Opus低延迟网络流媒体和通信
AAC高效压缩移动设备播放
FLAC无损压缩音频存档
WAV无压缩低延迟应用
PCM原始采样24kHz, 16位有符号

实时音频流#

支持语言#

支持多种语言,包括:
亚洲语言:中文、日语、韩语等
欧洲语言:英语、法语、德语等
其他语言:阿拉伯语、印地语等
注意:当前声音主要针对英语优化

常见问题#

Q: 如何控制生成音频的情感?#

A: 目前没有直接控制机制。大写字母或语法可能影响输出,但效果不确定。

Q: 能创建自定义声音吗?#

A: 不支持创建自定义声音。

Q: 生成的音频归属权?#

A: 归创建者所有,但需告知用户这是 AI 生成的音频。
修改于 2026-05-06 14:48:15
上一页
python 使用 语音转文本
下一页
python 使用Embeddings 向量化
Built with