视频生成 API

通过单一统一接口,从文本、图片、视频参考素材和音频输入生成 AI 视频。生成模式由您提供的参数组合自动决定。

接口地址

POST https://api.evolink.ai/v1/videos/generations

请求参数

参数类型必填默认值描述
modelstring模型 ID,使用 seedance-2.0
promptstring期望视频的文本描述(最多 2000 tokens)。使用 @ 标签引用已上传的文件
image_urlsarray参考图片 URL(最多 9 张)。参见 输入文件要求
video_urlsarray参考视频 URL(最多 3 个)。参见 输入文件要求
audio_urlsarray参考音频 URL(最多 3 个)。参见 输入文件要求
durationinteger5视频时长(秒)。支持 415 的任意整数。时长越长费用越高
qualitystring720p视频分辨率:480p720p1080p。分辨率越高费用越高
aspect_ratiostring16:9画面比例:16:99:161:14:33:421:9adaptive
generate_audiobooleantrue是否生成同步音频。启用会增加费用
callback_urlstring任务完成回调的 HTTPS URL。参见 Webhooks

生成模式

API 根据您提供的输入参数自动检测生成模式:

提供的输入模式描述
prompt文生视频根据文本描述生成视频
prompt + image_urls(1 张图片)图生视频将参考图片动画化
prompt + image_urls(2 张图片)首尾帧生成在两个关键帧之间生成过渡视频
prompt + image_urlsvideo_urlsaudio_urls 的任意组合多模态在提示词中使用 @ 标签为每个输入分配角色。参见 多模态引用

输入文件要求

图片

属性限制
最大数量每次请求 9 张
最大文件大小每张 30MB
支持格式.jpeg.png.webp.bmp.tiff.gif

视频

属性限制
最大数量每次请求 3 个
最大文件大小每个 50MB
支持格式.mp4.mov
时长2–15 秒
像素范围409,600 (480p) – 927,408 (720p)

音频

属性限制
最大数量每次请求 3 个
最大文件大小每个 15MB
支持格式.mp3.wav
总时长≤ 15 秒

总文件限制: 每次请求所有模态的文件合计最多 12 个。

人脸限制: 不支持上传真实人脸图片,系统会自动拒绝。

所有文件 URL 必须可被服务器直接访问。

示例

文生视频

import requests

response = requests.post(
    "https://api.evolink.ai/v1/videos/generations",
    headers={
        "Authorization": "Bearer YOUR_API_KEY",
        "Content-Type": "application/json"
    },
    json={
        "model": "seedance-2.0",
        "prompt": "A luxury watch rotating slowly on a marble surface, soft studio lighting, product showcase, cinematic 4K",
        "duration": 8,
        "quality": "1080p",
        "aspect_ratio": "16:9",
        "generate_audio": False
    }
)

print(response.json())

图生视频

response = requests.post(
    "https://api.evolink.ai/v1/videos/generations",
    headers={
        "Authorization": "Bearer YOUR_API_KEY",
        "Content-Type": "application/json"
    },
    json={
        "model": "seedance-2.0",
        "prompt": "The woman turns her head slowly and smiles, hair gently flowing in the wind",
        "image_urls": ["https://example.com/portrait.jpg"],
        "duration": 5,
        "quality": "1080p"
    }
)

首尾帧生成

response = requests.post(
    "https://api.evolink.ai/v1/videos/generations",
    headers={
        "Authorization": "Bearer YOUR_API_KEY",
        "Content-Type": "application/json"
    },
    json={
        "model": "seedance-2.0",
        "prompt": "Smooth camera pan revealing the landscape, golden hour lighting",
        "image_urls": [
            "https://example.com/frame-start.jpg",
            "https://example.com/frame-end.jpg"
        ],
        "duration": 8,
        "quality": "1080p"
    }
)

多模态 @标签引用

response = requests.post(
    "https://api.evolink.ai/v1/videos/generations",
    headers={
        "Authorization": "Bearer YOUR_API_KEY",
        "Content-Type": "application/json"
    },
    json={
        "model": "seedance-2.0",
        "prompt": "@Image1 as first frame, replicate @Video1 camera movement, @Audio1 for BGM rhythm",
        "image_urls": ["https://example.com/scene.jpg"],
        "video_urls": ["https://example.com/reference-camera.mp4"],
        "audio_urls": ["https://example.com/bgm.mp3"],
        "duration": 10,
        "quality": "1080p"
    }
)

完整的 @ 标签语法和角色分配,请参阅 多模态引用

响应

{
    "id": "task-unified-1761313744-vux2jw0k",
    "object": "video.generation.task",
    "created": 1761313744,
    "model": "seedance-2.0",
    "status": "pending",
    "progress": 0,
    "type": "video",
    "task_info": {
        "can_cancel": true,
        "estimated_time": 165,
        "video_duration": 8
    },
    "usage": {
        "billing_rule": "per_call",
        "credits_reserved": 12,
        "user_group": "default"
    }
}

响应字段

字段类型描述
idstring用于状态轮询的唯一任务标识符
objectstring固定为 video.generation.task
createdinteger任务创建的 Unix 时间戳
modelstring生成所用的模型
statusstringpendingprocessingcompletedfailed
progressinteger进度百分比(0–100)
typestring输出类型:textimageaudiovideo
task_info.can_cancelboolean任务是否可以取消
task_info.estimated_timeinteger预计完成时间(秒)
task_info.video_durationinteger请求的视频时长(秒)
usage.billing_rulestring计费规则(per_callper_tokenper_second
usage.credits_reservednumber预计消耗的积分
usage.user_groupstring用户组类别

音频生成

Seedance 2.0 可以根据您的文本提示词和视觉内容自动生成同步音频,包括语音、音效和背景音乐。

  • generate_audio 设置为 true(默认值)以启用音频生成
  • 在提示词中将对话内容放在双引号中,以获得更好的语音生成效果
  • 示例:The man stopped the woman and said: "Remember, you must never point at the moon with your finger."
  • generate_audio 设置为 false 以输出无声视频

提示词技巧

  • 具体描述镜头角度、光照和运动方式
  • 加入风格关键词:"cinematic"、"slow motion"、"aerial shot"
  • 描述主体、动作和氛围
  • 提示词最大长度为 2000 tokens
  • 详细的提示词工程策略,请参阅 Seedance 2.0 提示词指南

相关文档

  • 多模态引用 — 使用 @tag 引用控制图片、视频和音频的生成
  • 异步任务 — 轮询任务状态并获取结果
  • Webhooks — 通过 callback_url 接收实时完成通知
  • SDK 与示例 — Python、Node.js、Go 和 cURL 集成代码