模型总览

Seedance 2.0 API 并不是单一模型,而是一个由 6 个模型 组成的矩阵。调用时你必须在 model 字段中精确指定其中之一 —— 不存在所谓的"自动模式检测",传错 model ID 会直接返回 model_access_deniedinvalid_request

模型矩阵

输入类型Standard(默认画质更稳)Fast(速度更快 / 成本更低)
纯文本seedance-2.0-text-to-videoseedance-2.0-fast-text-to-video
1–2 张图片seedance-2.0-image-to-videoseedance-2.0-fast-image-to-video
图片 + 视频 + 音频 多模态seedance-2.0-reference-to-videoseedance-2.0-fast-reference-to-video

所有模型共用同一个端点:

POST https://api.evolink.ai/v1/videos/generations

区别只在请求体中的 model 字段与允许携带的输入字段(image_urls / video_urls / audio_urls)。

如何选择模型

按"你有什么输入"→"你需要什么速度"两步走:

第 1 步:按输入选模式

只有文字提示词
    → text-to-video  (可选启用 web_search 联网增强时效性)

有 1 张参考图(作为首帧)
有 2 张参考图(作为首帧 + 尾帧)
    → image-to-video

需要同时引用图片 + 视频 + 音频(最多 9 图 + 3 视频 + 3 音频)
    → reference-to-video

第 2 步:Standard 还是 Fast

维度StandardFast
生成画质稳定性更稳可接受
生成速度基准更快
按秒计费成本基准更低
推荐场景成片、营销、商品主图视频预览、A/B 测试、短视频批量生产

提示: 同一段 prompt 通常可以无缝在 Standard 和 Fast 之间切换,参数结构完全一致,只需替换 model 字段。建议在开发阶段用 Fast 迭代 prompt,交付阶段切回 Standard。

所有模型共享的能力

无论你选哪个 model,Seedance 2.0 都支持:

  • 同步音频生成generate_audio: true(默认)。把对白放在英文双引号中可优化语音效果,例如 The man said: "Remember, never point at the moon."
  • 多画面比例16:9, 9:16, 1:1, 4:3, 3:4, 21:9, adaptive
  • 两档画质480p, 720p不支持 1080p
  • 任意 4–15 秒时长duration 可设为 4 到 15 之间任意整数,默认 5 秒
  • 异步任务 — 所有请求立即返回任务 ID,通过轮询或 callback_url 接收结果

计费采用 按秒计费 (billing_rule: "per_second") —— 同一段视频,duration 越长费用越高。

仅 text-to-video 独有的能力

seedance-2.0-text-to-videoseedance-2.0-fast-text-to-video 额外支持 model_params.web_search 参数。开启后,模型会自主决定是否联网检索最新信息以增强时效性(仅在实际触发检索时计费):

{
  "model": "seedance-2.0-text-to-video",
  "prompt": "制作一段 2026 年春季最新款电动跑车的广告",
  "model_params": {
    "web_search": true
  }
}

文字长度限制

所有模型统一限制 prompt

  • 中文 ≤ 500 字符
  • 英文 ≤ 1000 单词

超出会被直接拒绝。超长 prompt 不会带来更好效果,建议聚焦主体、动作、镜头语言三个要素。

下一步