1. sd2
Model API
  • 管理员接口
    • 查询账户信息
  • 文件服务
    • 文件上传(file)
  • 阿里
    • 通义万相2.6-图像生成与编辑
  • 链接分析(url analysis)
    • 链接总结(summary)
    • 链接聊天(chat)
    • 字幕导出(subtitle)
  • 图片生成
    • flux
      • flux 接口文档
      • 官方格式
        • 生成图像(image)
        • 查询任务(get_result)
        • 提示词生成(chat)
        • 生成图像(chat 格式)
      • OpenAI Image 格式
        • 生成(generations)
        • 创建图片编辑 Copy
      • chat 格式
        • chat
    • ideogram
      • openai images格式
        • 生成
      • openchat chat格式
        • 生成
    • midjourney
      • 任务查询
        • ListByCondition
        • FetchFromTask
        • ImageSeed
      • 任务提交
        • Blend
        • SwapFace
        • Describe
        • Imagine
        • Shorten
        • Modal
        • Action
        • Change
    • gpt4oimage
      • chat 格式
        • gpt-4o-image-vip
      • image/generations 格式(dalle 格式)
        • 创建图像
        • 创建图片编辑
      • 图片借用OpenAI官方视频格式(适配 newapi)
        • 创建视频任务
        • 查询视频任务
        • 下载图片(不推荐该方式,查询视频接口有返回 url的)
        • 编辑图片(remix)
    • nano-banana
      • chat 格式
        • 带图 chat
        • content text 中带图
        • chat
      • image/generations 格式(dalle 格式)
        • 创建图像
        • 创建图片编辑
      • 官方格式(分辨率改参数)
    • bytedance
      • seedream-v4
        • chat 格式
          • 带图 chat
          • chat
        • image/generations 格式(dalle 格式)
          • 创建图像
          • 创建图片编辑
  • 音乐生成
    • suno
      • 支持 newapi,rixapi 接入
        • suno api 说明
        • 场景1-灵感模式
          • 场景1 - 灵感模式生成音乐
        • 场景2-自定义模式
          • 场景2 - 自定义歌词、标题和风格
        • 场景3-纯音乐自定义
          • 场景3 - 生成纯音乐(无人声)
        • 场景4-纯音乐灵感
          • 场景4 - 灵感模式生成纯音乐
        • 场景5-续写音频
          • 场景5 - 续写/扩展已有音频
        • 场景6-混音重制
          • 场景6 - 混音重制(使用参考音频)
        • 场景7-替换片段
          • 场景7 - 替换歌曲指定片段
        • 场景8-全轨分离
          • 场景8 - 全轨声曲分离
        • 场景9-人声分离
          • 场景9 - 人声分离
        • 场景10-改写
          • 场景10 - 改写(重新生成)
        • 场景11-重新填词
          • 场景11 - 重新填词 (Overpainting)
        • 查询结果
          • 查询生成任务的结果
        • 音频上传
          • 上传自定义音频文件
        • MIDI操作
          • 获取音乐的MIDI数据
        • 辅助工具
          • 扩展Style Tags(风格标签)
    • udio
      • 官方接口格式
        • 生成音乐
        • 查询任务
        • 生成歌词
      • 兼容 openai chat格式
        • 生成音乐
    • y文生音乐Suno
      • 文生音乐 Suno
        • 接口说明
        • 参数说明
        • 任务提交
          • 生成歌曲(灵感模式)
          • 生成歌曲(自定义模式)
          • 生成歌曲(续写模式)
          • 生成歌曲(歌手风格)
          • 生成歌曲(上传歌曲二次创作)
          • 生成歌曲(拼接歌曲)
          • 生成歌词
          • 歌曲拼接
          • 报告上传完毕
          • 查询上传处理状态
          • 初始化音频文件
          • 请求上传授权
          • s3上传示例
          • 场景一: 灵感模式
          • 场景二: 自定义.歌词歌名
          • 场景三: 纯音乐.自定义
        • 查询接口
          • 批量获取任务
          • 查询单个任务
          • 获取wav
          • Timing:歌词、音频时间线
          • 场景详情获取
  • 视频生成
    • vidu(官方格式)
      • 普通
        • vidu(chat格式)
        • 创建视频(tasks)
        • 视频状态(state)
        • 视频查询(tasks-get)
        • 高清视频(tasks)
    • runway
      • 官方格式
        • 生成视频(tasks)
        • 查询任务
      • chat 格式
        • 生成视频
      • vip(更快无水印)
        • 官方格式
          • 生成视频(tasks)
          • 查询任务
        • chat 格式
          • 生成视频
    • luma
      • luma(官方格式)
        • 官方格式lumavip⚡️
          • Chat格式lumavip
          • 视频生成(generations)
          • 查询任务(task)
          • 视频扩展(extend)
        • 官方格式lumapro🚀 (优先保证稳定性)
          • Chat格式lumapro
          • 视频生成(generations)
          • 查询任务(task)
          • 视频扩展(extend)
        • 官方格式luma
          • Chat格式luma
          • 视频生成(generations)
          • 查询任务(task)
          • 视频拓展(extend)
      • luma(goamz格式)
        • goamz 格式luma
          • 视频生成(generations)
          • 查询任务(task)
          • 视频拓展(extend)
        • goamz 格式lumavip
          • 视频生成(generations)
          • 查询任务(task)
          • 视频拓展(extend)
      • luma(chatgpt-next-web格式)
        • 视频生成(generations)
        • 视频扩展(extend)
        • 查询任务(task)
        • Chat格式lumavip
    • 可灵(官方格式)
      • 图像生成(暂不支持)
      • 文生视频
      • 图生视频
      • 查询任务
    • pika
      • pika 接口说明
      • 官方格式
        • 生成视频
        • 查询任务
      • openai chat 兼容格式
        • 生成视频
    • pixverse(变身毒液效果等)
      • pixverse(官方格式)(普通)
        • 创建视频
        • 查询视频
        • 获取特效模版
      • pixverse(官方格式)(VIP)
        • 创建视频
        • 查询视频
        • 获取特效模版
    • sora
      • 官方格式
        • 创建视频
        • 查询视频
      • openai chat 格式
        • 生成视频
    • veo
      • 视频统一格式
        • 创建视频
        • 查询任务
        • 创建视频,带图片
      • newapi 视频格式
        • 创建视频
        • 查询任务
        • 创建视频,带图片
      • chat 格式
        • 流式请求
        • 非流请求
        • 带图片请求
        • 不同比例的视频(横竖屏)
      • OpenAI官方视频格式(适配 newapi)
        • Veo视频说明
        • veo_3_1-fast视频生成
        • 查询视频详情
        • 下载视频(不推荐该方式,查询视频接口有返回 url的)
        • 编辑视频(remix)(不支持)
    • sora-2
      • 视频统一格式
        • 创建视频 带图片
        • 创建视频 (带 Character)
        • 创建视频
        • 查询任务
      • chat 格式
        • 可以@的人物说明
        • 连续修改生成视频
        • 使用公共人物(例如奥特曼)生成视频
        • 流式请求
        • 非流请求
        • 带图片请求
        • 不同比例的视频(横竖屏)
      • OpenAI官方视频格式(适配 newapi)
        • 创建视频
        • 查询视频详情
        • 下载视频(不推荐该方式,查询视频接口有返回 url的)
        • 编辑视频(remix)
        • 创建视频(带 Character)
        • 从已生成的任务中创建角色
        • 使用故事板创建视频
      • 创建角色接口
        • 创建角色
      • 官key
        • 创建视频
        • 查询视频
    • sd2
      • 说明
      • 上传虚拟人素材接口文档
      • 虚拟人素材上传
        POST
      • 创建视频任务
        POST
      • 查询视频任务
        GET
      • 素材查询
        GET
  • GPTs 相关
    • GPTs相关接口文档
    • GPTs对话
    • 搜索相关 GPTs(chat格式)
    • 搜索相关 GPTs(官方格式)
    • 查询 GPTs 详情(chat格式)
    • 查询 GPTs 详情(官方格式)
    • 批量查询 GPTs 详情(chat格式)
    • 批量查询 GPTs 详情(官方格式)
  • 数字人
    • 官方 API
      • 查询 默认voice 列表
      • 生成数字人视频
      • 获取任务详情
    • 兼容 openai chat 格式
      • 生成数字人
  • 智谱清言(glm)
    • 智谱清言相关 api 接口文档
    • 视频生成
      • 生成(chat 格式)
      • 生成(generations)
      • 查询(async-result)
  • openai
    • 介绍
    • 项目说明
    • 导言
    • 身份验证
    • 发出请求
    • 参数详情
    • 音频(Audio)
      • 创建语音
      • 创建转录
      • 创建翻译
    • 聊天(Chat)
      • gpts 请求
      • 聊天完成块对象
      • 创建聊天补全
    • 自动补全(Completions)
      • 完成对象
      • 创建完成
    • 嵌入(Embeddings)
      • 嵌入对象
      • 创建嵌入
    • 微调(Fine-tuning)
      • 微调作业对象
      • 微调作业事件对象
      • 创建微调作业
      • 列出微调作业
      • 检索微调作业
      • 取消微调
      • 列出微调事件
    • 图像(Images)
      • README
      • 图像对象
      • 创建图像
      • 创建图片编辑
      • 创建图像变体
    • 模型(Models)
      • 模型对象
      • 列出模型
      • 检索模型
      • 删除微调模型
    • 文件(Files)
      • README
      • 文件对象
      • 上传文件
      • 删除文件
      • 检索文件
      • 检索文件内容
      • 列出文件
    • 审查(Moderations)
      • 调节对象
      • 创建内容审核
    • 助手测试版(AssistantsBeta)
      • 辅助对象
      • 辅助文件对象
      • 创建助手
      • 检索助手
      • 修改助手
      • 删除助手
      • 列出助手
      • 创建辅助文件
      • 检索助手文件
      • 删除辅助文件
      • 列出助手文件
    • 线程数(Threads)
      • 线程对象
      • 创建线程
      • 检索线程
      • 修改线程
      • 删除话题
    • 留言(Messages)
      • 消息对象
      • 消息文件对象
      • 创建消息
      • 检索消息
      • 修改留言
      • 列出消息
      • 检索消息文件
      • 列出消息文件
    • 运行(Runs)
      • 运行对象
      • 运行步骤对象
      • 创建运行
      • 检索运行
      • 修改运行
      • 列表运行
      • 提交工具输出以运行
      • 取消运行
      • 创建线程并运行
      • 检索运行步骤
      • 列出运行步骤
    • 已弃用-音频(Audio)
      • 创建转录
      • 创建翻译
  • 异步 veo3 、gemini deepsearch 等
    • 转换接口说明
    • 流式转换
      • 流式转换接口
    • 异步 gemini-2.5-pro-deepsearch
      • 获取任务链接
      • 查询任务详情
    • 异步 veo3
      • 获取任务链接
      • 查询任务详情
    • 异步 sora
      • 获取任务链接
      • 查询任务详情
  • gemini
    • generateContent
      • 文本非流
      • 文本流式
      • 图片非流
  • 数据模型
    • 示例数据模型
      • Pet
      • Category
      • Tag
    • veo
      • veo 模型
      • veo status
    • Schemas
      • ChatCompletionRequest
      • Scene1_InspirationRequest
      • Message
      • Scene2_CustomRequest
      • TransformSuccessResponse
      • Scene3_InstrumentalCustomRequest
      • ErrorResponse
      • Scene4_InstrumentalInspirationRequest
      • Scene5A_ContinueUploadedRequest
      • Scene5B_ContinueGeneratedRequest
      • Scene6A_RemixUploadedRequest
      • Scene6B_RemixGeneratedRequest
      • Scene7A_ReplaceUploadedRequest
      • Scene7B_ReplaceGeneratedRequest
      • Scene8_AllStemsRequest
      • Scene9_VocalStemsRequest
      • Scene10_RewriteRequest
      • Scene11_OverpaintingRequest
      • ClipResult
      • MidiProcessing
      • MidiComplete
      • Error
    • sora
      • sora model
      • 时长
      • sora image
    • suno
    • Response
      • GenerateSuccess
      • BadRequest
      • Unauthorized
      • NotFound
    • RequestBodies
      • Body
      • Body2
      • Body3
      • Body4
    • CreateVideoRequest
    • BridgeVideoResponse
    • BridgeErrorEnvelope
    • DoubaoTool
    • DoubaoTaskUsage
    • BridgeTaskError
    • BridgeErrorPayload
  1. sd2

说明

支持modal
db-s-2-0-260128
db-s-2-0-fast-260128

设计原则#

先兼容两个核心接口:
POST /v1/videos
GET /v1/videos/:id

核心接口#

1. 创建视频任务#

POST /v1/videos

支持的 Content-Type#

multipart/form-data
建议优先使用 JSON。
对于 multipart/form-data,第一版仅支持表单字段中传 URL,不支持上传实际文件。

请求字段#

字段类型必填说明
modelstring是豆包视频模型名
promptstring是提示词。第一版建议必填
durationint否视频时长,优先于 seconds
secondsint否视频时长
ratiostring否21:9 / 16:9 / 4:3 / 1:1 / 3:4 / 9:16 / adaptive
resolutionstring否480p / 720p
watermarkbool否是否带水印
generate_audiobool否是否生成音频
input_referencestring否单参考图片 URL,兼容字段
imagestring否单参考图片 URL,兼容字段
image_urlstring否单参考图片 URL,兼容字段
input_reference_rolestring否first_frame 或 reference_image
first_frame_urlstring否首帧图 URL
last_frame_urlstring否尾帧图 URL
reference_image_urlsstring[]否多张参考图 URL
reference_video_urlstring否单个参考视频 URL
reference_video_urlsstring[]否多个参考视频 URL
audio_urlstring否参考音频 URL
audio_urlsstring[]否多个参考音频 URL
toolsarray否例如 [{"type":"web_search"}]
web_searchbool否true 时桥接为 tools=[{"type":"web_search"}]
sizestring否OpenAI 兼容尺寸字段,仅支持预设映射

字段映射规则#

OpenAI 兼容字段豆包 native 映射
modelmodel
promptcontent += {type:"text", text: prompt}
duration / secondsduration
ratioratio
resolutionresolution
watermarkwatermark
generate_audiogenerate_audio
first_frame_urlcontent += image_url(role=first_frame)
last_frame_urlcontent += image_url(role=last_frame)
reference_image_urls[]content += image_url(role=reference_image)
reference_video_url(s)content += video_url(role=reference_video)
audio_urlcontent += audio_url(role=reference_audio)
input_reference / image / image_url默认映射为 image_url(role=first_frame)
input_reference_role=reference_image映射为 image_url(role=reference_image)
toolstools
web_search=truetools=[{"type":"web_search"}]

组合规则#

audio_url 不能单独出现,至少要和参考图或参考视频一起使用。
input_reference 默认按首帧图处理。
若同时给出 input_reference 和 first_frame_url,以 first_frame_url 为准。
tools 和 web_search 不应同时重复传递;如果都传,优先使用 tools。

size 映射规则#

由于豆包 native 接口使用 ratio + resolution,桥接层不建议做任意像素近似,仅支持下列固定映射:
sizeratioresolution
1280x72016:9720p
720x12809:16720p
1024x10241:1720p
832x6244:3720p
624x8323:4720p
1280x54421:9720p
854x48016:9480p
480x8549:16480p
640x4804:3480p
480x6403:4480p
480x4801:1480p
不在映射表中的 size 直接返回 400 invalid_request_error。
adaptive 比例规则
文生视频:根据提示词自动选择最合适的宽高比
首帧 / 首尾帧视频:根据首帧图片选择最接近的宽高比
多模态参考视频:根据提示词意图并以第一个媒体文件为准(优先级:视频 > 图片)选择最接近的宽高比

请求示例#

示例 1:最小文生视频#
示例 2:首帧图生视频#
示例 3:首尾帧视频#
示例 4:多模态参考#
示例 5:联网搜索增强#
示例 6:显式 tools#
示例 7:使用 size#
示例 8:multipart 表单#

成功响应示例#

{
  "object": "video",
  "id": "dbv1_xxxxx",
  "status": "queued",
  "progress": 0,
  "created_at": 1742450000,
  "model": "doubao-seedance-2-0-260128",
  "seconds": "5",
  "size": "1280x720"
}
说明:
id 是桥接层签名任务令牌
下游不需要理解令牌结构,只需原样用于查询

2. 查询视频任务#

GET /v1/videos/:id

请求示例#

处理中响应示例#

{
  "object": "video",
  "id": "dbv1_xxxxx",
  "status": "in_progress",
  "progress": 50,
  "created_at": 1742450000,
  "completed_at": null,
  "model": "doubao-seedance-2-0-260128",
  "seconds": "5",
  "size": "1280x720"
}

完成响应示例#

{
  "object": "video",
  "id": "dbv1_xxxxx",
  "status": "completed",
  "progress": 100,
  "created_at": 1742450000,
  "completed_at": 1742450068,
  "model": "doubao-seedance-2-0-260128",
  "seconds": "5",
  "size": "1280x720",
  "url": "https://example.com/output.mp4",
  "video_url": "https://example.com/output.mp4"
}

错误响应格式#

统一返回 OpenAI 风格错误:
{
  "error": {
    "message": "error message",
    "type": "invalid_request_error",
    "code": "invalid_size"
  }
}

错误码列表#

HTTP 状态码typecode说明
400invalid_request_errorinvalid_request请求格式错误
400invalid_request_errormissing_model缺少 model
400invalid_request_errormissing_prompt缺少 prompt
400invalid_request_errorinvalid_sizesize 不在支持列表
400invalid_request_errorinvalid_ratioratio 非法
400invalid_request_errorinvalid_resolutionresolution 非法
400invalid_request_errorinvalid_reference参考素材非法
400invalid_request_erroraudio_requires_referenceaudio_url 缺少图或视频参考
401authentication_errormissing_api_key缺少 Authorization
401authentication_errorinvalid_api_keyAPI Key 无效
403permission_errorpermission_denied无访问权限
429rate_limit_errorrate_limit_exceeded上游限流
500api_errorinternal_error桥接层内部错误
502api_errorupstream_error上游返回异常
504api_errorupstream_timeout上游超时
501not_supported_errornot_supported当前版本不支持的能力

辅助接口#

这些接口不是核心兼容 API,但建议提供,方便运维和接入 newapi。

GET /health#

健康检查。
响应示例:
{
  "status": "ok"
}

POST /v1/chat/completions#

用于 newapi 渠道测试的占位接口。
建议始终返回一个固定成功响应,不参与真实业务。
image.png
图片输入
支持格式:jpeg、png、webp、bmp、tiff、gif
宽高比(宽/高):
0.4 ~ 2.5
宽高长度:
300 ~ 6000 px
单张图片大小:小于
30 MB
请求体总大小:不超过
64 MB
数量限制:
首帧模式:1 张
首尾帧模式:2 张
多模态参考:1 ~ 9 张
image.png
仅支持
video_url
作为参考视频
支持格式:mp4、mov
支持分辨率:
480p
、
720p
单个视频时长:
2 ~ 15 s
最多传入 3 个参考视频,且总时长不超过 15 秒
宽高比(宽/高):
0.4 ~ 2.5
宽高长度:
300 ~ 6000 px
画面像素范围:
409600 ~ 927408
单个视频大小:不超过
50 MB
帧率:
24 ~ 60 FPS
image.png
仅支持
audio_url
作为参考音频
支持格式:wav、mp3
单个音频时长:
2 ~ 15 s
最多传入 3 段参考音频,且总时长不超过 15 秒
单个音频大小:不超过
15 MB
修改于 2026-03-25 06:26:42
上一页
查询视频
下一页
上传虚拟人素材接口文档
Built with