1. sd2
Model API
  • 管理员接口
    • 查询账户信息
  • 文件服务
    • 文件上传(file)
  • 阿里
    • 通义万相2.6-图像生成与编辑
  • 链接分析(url analysis)
    • 链接总结(summary)
    • 链接聊天(chat)
    • 字幕导出(subtitle)
  • 图片生成
    • flux
      • flux 接口文档
      • 官方格式
        • 生成图像(image)
        • 查询任务(get_result)
        • 提示词生成(chat)
        • 生成图像(chat 格式)
      • OpenAI Image 格式
        • 生成(generations)
        • 创建图片编辑 Copy
      • chat 格式
        • chat
    • ideogram
      • openai images格式
        • 生成
      • openchat chat格式
        • 生成
    • midjourney
      • 任务查询
        • ListByCondition
        • FetchFromTask
        • ImageSeed
      • 任务提交
        • Blend
        • SwapFace
        • Describe
        • Imagine
        • Shorten
        • Modal
        • Action
        • Change
    • gpt4oimage
      • chat 格式
        • gpt-4o-image-vip
      • image/generations 格式(dalle 格式)
        • 创建图像
        • 创建图片编辑
      • 图片借用OpenAI官方视频格式(适配 newapi)
        • 创建视频任务
        • 查询视频任务
        • 下载图片(不推荐该方式,查询视频接口有返回 url的)
        • 编辑图片(remix)
    • nano-banana
      • chat 格式
        • 带图 chat
        • content text 中带图
        • chat
      • image/generations 格式(dalle 格式)
        • 创建图像
        • 创建图片编辑
      • 官方格式(分辨率改参数)
    • bytedance
      • seedream-v4
        • chat 格式
          • 带图 chat
          • chat
        • image/generations 格式(dalle 格式)
          • 创建图像
          • 创建图片编辑
  • 音乐生成
    • suno
      • 支持 newapi,rixapi 接入
        • suno api 说明
        • 场景1-灵感模式
          • 场景1 - 灵感模式生成音乐
        • 场景2-自定义模式
          • 场景2 - 自定义歌词、标题和风格
        • 场景3-纯音乐自定义
          • 场景3 - 生成纯音乐(无人声)
        • 场景4-纯音乐灵感
          • 场景4 - 灵感模式生成纯音乐
        • 场景5-续写音频
          • 场景5 - 续写/扩展已有音频
        • 场景6-混音重制
          • 场景6 - 混音重制(使用参考音频)
        • 场景7-替换片段
          • 场景7 - 替换歌曲指定片段
        • 场景8-全轨分离
          • 场景8 - 全轨声曲分离
        • 场景9-人声分离
          • 场景9 - 人声分离
        • 场景10-改写
          • 场景10 - 改写(重新生成)
        • 场景11-重新填词
          • 场景11 - 重新填词 (Overpainting)
        • 查询结果
          • 查询生成任务的结果
        • 音频上传
          • 上传自定义音频文件
        • MIDI操作
          • 获取音乐的MIDI数据
        • 辅助工具
          • 扩展Style Tags(风格标签)
    • udio
      • 官方接口格式
        • 生成音乐
        • 查询任务
        • 生成歌词
      • 兼容 openai chat格式
        • 生成音乐
    • y文生音乐Suno
      • 文生音乐 Suno
        • 接口说明
        • 参数说明
        • 任务提交
          • 生成歌曲(灵感模式)
          • 生成歌曲(自定义模式)
          • 生成歌曲(续写模式)
          • 生成歌曲(歌手风格)
          • 生成歌曲(上传歌曲二次创作)
          • 生成歌曲(拼接歌曲)
          • 生成歌词
          • 歌曲拼接
          • 报告上传完毕
          • 查询上传处理状态
          • 初始化音频文件
          • 请求上传授权
          • s3上传示例
          • 场景一: 灵感模式
          • 场景二: 自定义.歌词歌名
          • 场景三: 纯音乐.自定义
        • 查询接口
          • 批量获取任务
          • 查询单个任务
          • 获取wav
          • Timing:歌词、音频时间线
          • 场景详情获取
  • 视频生成
    • vidu(官方格式)
      • 普通
        • vidu(chat格式)
        • 创建视频(tasks)
        • 视频状态(state)
        • 视频查询(tasks-get)
        • 高清视频(tasks)
    • runway
      • 官方格式
        • 生成视频(tasks)
        • 查询任务
      • chat 格式
        • 生成视频
      • vip(更快无水印)
        • 官方格式
          • 生成视频(tasks)
          • 查询任务
        • chat 格式
          • 生成视频
    • luma
      • luma(官方格式)
        • 官方格式lumavip⚡️
          • Chat格式lumavip
          • 视频生成(generations)
          • 查询任务(task)
          • 视频扩展(extend)
        • 官方格式lumapro🚀 (优先保证稳定性)
          • Chat格式lumapro
          • 视频生成(generations)
          • 查询任务(task)
          • 视频扩展(extend)
        • 官方格式luma
          • Chat格式luma
          • 视频生成(generations)
          • 查询任务(task)
          • 视频拓展(extend)
      • luma(goamz格式)
        • goamz 格式luma
          • 视频生成(generations)
          • 查询任务(task)
          • 视频拓展(extend)
        • goamz 格式lumavip
          • 视频生成(generations)
          • 查询任务(task)
          • 视频拓展(extend)
      • luma(chatgpt-next-web格式)
        • 视频生成(generations)
        • 视频扩展(extend)
        • 查询任务(task)
        • Chat格式lumavip
    • 可灵(官方格式)
      • 图像生成(暂不支持)
      • 文生视频
      • 图生视频
      • 查询任务
    • pika
      • pika 接口说明
      • 官方格式
        • 生成视频
        • 查询任务
      • openai chat 兼容格式
        • 生成视频
    • pixverse(变身毒液效果等)
      • pixverse(官方格式)(普通)
        • 创建视频
        • 查询视频
        • 获取特效模版
      • pixverse(官方格式)(VIP)
        • 创建视频
        • 查询视频
        • 获取特效模版
    • sora
      • 官方格式
        • 创建视频
        • 查询视频
      • openai chat 格式
        • 生成视频
    • veo
      • 视频统一格式
        • 创建视频
        • 查询任务
        • 创建视频,带图片
      • newapi 视频格式
        • 创建视频
        • 查询任务
        • 创建视频,带图片
      • chat 格式
        • 流式请求
        • 非流请求
        • 带图片请求
        • 不同比例的视频(横竖屏)
      • OpenAI官方视频格式(适配 newapi)
        • Veo视频说明
        • veo_3_1-fast视频生成
        • 查询视频详情
        • 下载视频(不推荐该方式,查询视频接口有返回 url的)
        • 编辑视频(remix)(不支持)
    • sora-2
      • 视频统一格式
        • 创建视频 带图片
        • 创建视频 (带 Character)
        • 创建视频
        • 查询任务
      • chat 格式
        • 可以@的人物说明
        • 连续修改生成视频
        • 使用公共人物(例如奥特曼)生成视频
        • 流式请求
        • 非流请求
        • 带图片请求
        • 不同比例的视频(横竖屏)
      • OpenAI官方视频格式(适配 newapi)
        • 创建视频
        • 查询视频详情
        • 下载视频(不推荐该方式,查询视频接口有返回 url的)
        • 编辑视频(remix)
        • 创建视频(带 Character)
        • 从已生成的任务中创建角色
        • 使用故事板创建视频
      • 创建角色接口
        • 创建角色
      • 官key
        • 创建视频
        • 查询视频
    • sd2
      • 说明
      • 上传虚拟人素材接口文档
      • 虚拟人素材上传
        POST
      • 创建视频任务
        POST
      • 查询视频任务
        GET
      • 素材查询
        GET
  • GPTs 相关
    • GPTs相关接口文档
    • GPTs对话
    • 搜索相关 GPTs(chat格式)
    • 搜索相关 GPTs(官方格式)
    • 查询 GPTs 详情(chat格式)
    • 查询 GPTs 详情(官方格式)
    • 批量查询 GPTs 详情(chat格式)
    • 批量查询 GPTs 详情(官方格式)
  • 数字人
    • 官方 API
      • 查询 默认voice 列表
      • 生成数字人视频
      • 获取任务详情
    • 兼容 openai chat 格式
      • 生成数字人
  • 智谱清言(glm)
    • 智谱清言相关 api 接口文档
    • 视频生成
      • 生成(chat 格式)
      • 生成(generations)
      • 查询(async-result)
  • openai
    • 介绍
    • 项目说明
    • 导言
    • 身份验证
    • 发出请求
    • 参数详情
    • 音频(Audio)
      • 创建语音
      • 创建转录
      • 创建翻译
    • 聊天(Chat)
      • gpts 请求
      • 聊天完成块对象
      • 创建聊天补全
    • 自动补全(Completions)
      • 完成对象
      • 创建完成
    • 嵌入(Embeddings)
      • 嵌入对象
      • 创建嵌入
    • 微调(Fine-tuning)
      • 微调作业对象
      • 微调作业事件对象
      • 创建微调作业
      • 列出微调作业
      • 检索微调作业
      • 取消微调
      • 列出微调事件
    • 图像(Images)
      • README
      • 图像对象
      • 创建图像
      • 创建图片编辑
      • 创建图像变体
    • 模型(Models)
      • 模型对象
      • 列出模型
      • 检索模型
      • 删除微调模型
    • 文件(Files)
      • README
      • 文件对象
      • 上传文件
      • 删除文件
      • 检索文件
      • 检索文件内容
      • 列出文件
    • 审查(Moderations)
      • 调节对象
      • 创建内容审核
    • 助手测试版(AssistantsBeta)
      • 辅助对象
      • 辅助文件对象
      • 创建助手
      • 检索助手
      • 修改助手
      • 删除助手
      • 列出助手
      • 创建辅助文件
      • 检索助手文件
      • 删除辅助文件
      • 列出助手文件
    • 线程数(Threads)
      • 线程对象
      • 创建线程
      • 检索线程
      • 修改线程
      • 删除话题
    • 留言(Messages)
      • 消息对象
      • 消息文件对象
      • 创建消息
      • 检索消息
      • 修改留言
      • 列出消息
      • 检索消息文件
      • 列出消息文件
    • 运行(Runs)
      • 运行对象
      • 运行步骤对象
      • 创建运行
      • 检索运行
      • 修改运行
      • 列表运行
      • 提交工具输出以运行
      • 取消运行
      • 创建线程并运行
      • 检索运行步骤
      • 列出运行步骤
    • 已弃用-音频(Audio)
      • 创建转录
      • 创建翻译
  • 异步 veo3 、gemini deepsearch 等
    • 转换接口说明
    • 流式转换
      • 流式转换接口
    • 异步 gemini-2.5-pro-deepsearch
      • 获取任务链接
      • 查询任务详情
    • 异步 veo3
      • 获取任务链接
      • 查询任务详情
    • 异步 sora
      • 获取任务链接
      • 查询任务详情
  • gemini
    • generateContent
      • 文本非流
      • 文本流式
      • 图片非流
  • 数据模型
    • 示例数据模型
      • Pet
      • Category
      • Tag
    • veo
      • veo 模型
      • veo status
    • Schemas
      • ChatCompletionRequest
      • Scene1_InspirationRequest
      • Message
      • Scene2_CustomRequest
      • TransformSuccessResponse
      • Scene3_InstrumentalCustomRequest
      • ErrorResponse
      • Scene4_InstrumentalInspirationRequest
      • Scene5A_ContinueUploadedRequest
      • Scene5B_ContinueGeneratedRequest
      • Scene6A_RemixUploadedRequest
      • Scene6B_RemixGeneratedRequest
      • Scene7A_ReplaceUploadedRequest
      • Scene7B_ReplaceGeneratedRequest
      • Scene8_AllStemsRequest
      • Scene9_VocalStemsRequest
      • Scene10_RewriteRequest
      • Scene11_OverpaintingRequest
      • ClipResult
      • MidiProcessing
      • MidiComplete
      • Error
    • sora
      • sora model
      • 时长
      • sora image
    • suno
    • Response
      • GenerateSuccess
      • BadRequest
      • Unauthorized
      • NotFound
    • RequestBodies
      • Body
      • Body2
      • Body3
      • Body4
    • CreateVideoRequest
    • BridgeVideoResponse
    • BridgeErrorEnvelope
    • DoubaoTool
    • DoubaoTaskUsage
    • BridgeTaskError
    • BridgeErrorPayload
  1. sd2

上传虚拟人素材接口文档

1 上传素材

接口地址:https://gemini-api.cn/api/asset/create

头信息:Authorization:Bearer xxx(wetoken的令牌密钥)

参数格式:JSON

请求方式:POST

上传素材后,需要等几秒,查询素材状态正常后才可以使用,查询素材接口不支持高流量并发查询,上传成功后,本地落库使用

参数:

参数名类型要求说明
urlstring必填外网可访问的图片地址|
格式:jpeg、png、webp、bmp、tiff、gif、heic/heif
宽高比(宽/高): (0.4, 2.5)
宽高长度(px):(300, 6000)
大小:单张图片小于 30 MB。
namestring必填素材名称

成功返回格式:

{
	"ResponseMetadata": {
		"RequestId": "202603241118118399E4527AE2BDDDEAC2",
		"Action": "CreateAsset",
		"Version": "2024-01-01",
		"Service": "ark",
		"Region": "cn-beijing"
	},
	"Result": {
		"Id": "asset-20260324111811-p9fjp"
	}
}

请求样例:

curl --request POST \
  --url https://gemini-api.cn/api/asset/create \
  --header 'Accept: */*' \
  --header 'Accept-Encoding: gzip, deflate, br' \
  --header 'Authorization: Bearer sk-xxxxxxxxx' \
  --header 'Connection: keep-alive' \
  --header 'Content-Type: application/json' \
  --data '{
    "url":"你的图片地址",
    "name":"大门"
}'

2 查询素材

接口地址:https://gemini-api.cn/api/asset/get?id=xx

头信息:Authorization:Bearer xxx(wetoken的令牌密钥)

请求方式:GET

参数:

参数名类型要求说明
idstring必填asset_id

Status状态说明:

任务状态。

  • Active:素材资产(Asset)已处理完毕,可以使用。
  • Processing:素材资产(Asset)正在预处理,无法使用。
  • Failed:素材资产(Asset)处理失败。

成功返回格式:

{
	"ResponseMetadata": {
		"RequestId": "20260324112034D08AB02396C659CB0BCD",
		"Action": "GetAsset",
		"Version": "2024-01-01",
		"Service": "ark",
		"Region": "cn-beijing"
	},
	"Result": {
		"Id": "asset-xxx",
		"Name": "大门",
		"URL": "xxxxx",
		"AssetType": "Image",
		"GroupId": "xxxx",
		"Status": "Active",
		"CreateTime": "2026-03-23T07:17:36Z",
		"UpdateTime": "2026-03-23T07:17:41Z",
		"ProjectName": "default"
	}
}

请求样例:

curl --request GET \
  --url 'https://gemini-api.cn/api/asset/get?id=asset_id' \
  --header 'Accept: */*' \
  --header 'Accept-Encoding: gzip, deflate, br' \
  --header 'Authorization: Bearer sk-xxxx' \  

3 上传多媒体素材

接口地址:https://gemini-api.cn/api/asset/createMedia

头信息:Authorization:Bearer xxx(wetoken的令牌密钥)

参数格式:JSON

请求方式:POST

上传素材后,需要等几秒,查询素材状态正常后才可以使用,查询素材接口不支持高流量并发查询,上传成功后,本地落库使用

参数:

参数名类型要求说明
urlstring必填素材的公网地址
namestring必填素材名称
assetTypestring必填素材类型,取值范围:Image,Video,Audio
传入单个图像要求
- 格式:jpeg、png、webp、bmp、tiff、gif、heic/heif
- 宽高比(宽/高): (0.4, 2.5)
- 宽高长度(px):(300, 6000)
- 大小:单张图片小于 30 MB
传入单个视频要求
- 格式:mp4、mov
- 分辨率:480p、720p
- 时长:单个视频时长 [2, 15] s
- 尺寸:
- 宽高比(宽/高):[0.4, 2.5]
- 宽高长度(px):[300, 6000]
- 总像素数:[640×640=409600, 834×1112=927408],即宽和高的乘积符合 [409600, 927408] 的区间要求。
- 大小:单个视频不超过 50 MB
- 帧率 (FPS):[24, 60]
传入单个音频要求
- 格式:wav、mp3
- 时长:单个音频时长 [2, 15] s
- 大小:单个音频不超过 15 MB

成功返回格式:

{
	"ResponseMetadata": {
		"RequestId": "202603241118118399E4527AE2BDDDEAC2",
		"Action": "CreateAsset",
		"Version": "2024-01-01",
		"Service": "ark",
		"Region": "cn-beijing"
	},
	"Result": {
		"Id": "asset-20260324111811-p9fjp"
	}
}

请求样例:

curl --request POST \
  --url https://gemini-api.cn/api/asset/createMedia \
  --header 'Authorization: Bearer sk-xxx' \
  --header 'Content-Type: application/json' \
  --data '{
    "url":"素材公网地址",
    "name":"素材名称",
    "assetType":"素材类型,例:Audio"
}'

4 如何使用素材

提交视频任务接口中,修改content.<模态>_url.url 字段中使用 素材 URI,下例:为参考视频使用素材

curl -X POST http://localhost:8081/v1/videos \
  -H "Authorization: Bearer YOUR_DOUBAO_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "d-s-2-0-260128",
    "prompt": "使用参考视频的镜头语言,并使用参考音频作为背景音乐",
    "reference_image_urls": [
      "asset://ASSET_ID",
      "asset://ASSET_ID"
    ],
    "reference_video_url": "asset://ASSET_ID",
    "duration": 5,
    "ratio": "adaptive",
    "resolution": "720p",
    "generate_audio": true
  }'

5

对外统一通过调用以下路径,

  • POST /api/asset/create
  • GET /api/asset/get
  • POST /api/asset/createMedia

计费配置

仅对下面两个动作按次计费:

  • create 对应价格模型:asset_create
  • createMedia 对应价格模型:asset_create_media

get 查询接口不计费。\r\n\r\n结算条件:\r\n\r\n- create、createMedia 仅在上游返回 2xx 且响应体 Result.Id 非空时才最终扣费;\r\n- 仅 2xx 但 Result.Id 为空,或上游异常时,会自动退款。

修改于 2026-03-27 09:16:49
上一页
说明
下一页
虚拟人素材上传
Built with