Visión general de modelos

La API de Seedance 2.0 no es un modelo único, sino una matriz de 6 modelos. Debes especificar exactamente uno de ellos en el campo model de cada solicitud. No existe la "detección automática de modo": enviar un ID de modelo incorrecto devolverá model_access_denied o invalid_request.

La matriz de modelos

Tipo de entradaEstándar (mejor calidad)Fast (más rápido / económico)
Solo textoseedance-2.0-text-to-videoseedance-2.0-fast-text-to-video
1–2 imágenesseedance-2.0-image-to-videoseedance-2.0-fast-image-to-video
Imágenes + vídeos + audioseedance-2.0-reference-to-videoseedance-2.0-fast-reference-to-video

Los seis modelos comparten el mismo endpoint:

POST https://api.evolink.ai/v1/videos/generations

Las únicas diferencias son el valor del campo model y los arrays de entrada (image_urls / video_urls / audio_urls) que cada modelo acepta.

Cómo elegir un modelo

Dos pasos: elige el modo según tus entradas y luego escoge entre Estándar y Fast.

Paso 1: elige el modo según la entrada

Solo prompt de texto
    → text-to-video  (parámetro web_search opcional para contenido actualizado)

1 imagen de referencia  (usada como primer fotograma)
2 imágenes de referencia (usadas como primer + último fotograma)
    → image-to-video

Múltiples imágenes, vídeos de referencia o pistas de audio  (hasta 9 + 3 + 3)
    → reference-to-video

Paso 2: Estándar o Fast

DimensiónEstándarFast
Estabilidad de la calidad visualMayorAceptable
Velocidad de generaciónBaseMás rápida
Coste por segundoBaseMenor
Recomendado paraEntregables finales, anuncios, vídeos hero de productoPrevisualizaciones, A/B testing, producción masiva en formato corto

Consejo: El mismo prompt suele poder alternar entre Estándar y Fast sin cambios de código: la estructura de parámetros es idéntica, solo cambia el campo model. Usa Fast durante la iteración de prompts y cambia a Estándar para la entrega final.

Capacidades comunes a todos los modelos

Independientemente del modelo que elijas, Seedance 2.0 admite:

  • Generación sincronizada de audiogenerate_audio: true (por defecto). Coloca los diálogos entre comillas dobles rectas para optimizar la síntesis de voz, p. ej. El hombre dijo: "Recuerda, nunca señales a la luna."
  • Múltiples relaciones de aspecto16:9, 9:16, 1:1, 4:3, 3:4, 21:9, adaptive
  • Dos niveles de calidad480p o 720p (1080p no está soportado)
  • Duraciones de 4 a 15 segundos — cualquier número entero, por defecto 5 segundos
  • Ciclo de vida de tareas asíncronas — cada solicitud devuelve un ID de tarea de inmediato; recupera el resultado mediante polling o webhook callback_url

La facturación es por segundo (billing_rule: "per_second"): valores de duration mayores cuestan más para el mismo clip.

Capacidad exclusiva: model_params.web_search (solo text-to-video)

seedance-2.0-text-to-video y seedance-2.0-fast-text-to-video admiten un parámetro adicional model_params.web_search. Cuando está activado, el modelo decide de forma autónoma si conviene buscar información actualizada en internet (y solo se factura cuando realmente se realiza una búsqueda):

{
  "model": "seedance-2.0-text-to-video",
  "prompt": "Un anuncio del nuevo coche deportivo eléctrico edición primavera 2026",
  "model_params": {
    "web_search": true
  }
}

Límite de longitud del prompt

Todos los modelos aplican el mismo límite a prompt:

  • Chino: ≤ 500 caracteres
  • Inglés: ≤ 1000 palabras

Sobrepasarlo provoca el rechazo directo de la solicitud. Los prompts más largos no producen mejores resultados: céntrate en el sujeto, la acción y la cinematografía.

Próximos pasos