Referencia Multimodal
Seedance 2.0 soporta un potente sistema de referencia con etiquetas @ que le permite asignar roles específicos a imágenes, videos y archivos de audio subidos dentro de su prompt. Esto le brinda un control creativo detallado sobre el video generado.
Sintaxis de Etiquetas @
Referencie archivos subidos en su prompt usando etiquetas @ que corresponden a la posición de cada URL en su respectivo array:
| Formato de Etiqueta | Corresponde A | Ejemplos |
|---|---|---|
@Image1 – @Image9 | image_urls[0] – image_urls[8] | @Image1 as first frame |
@Video1 – @Video3 | video_urls[0] – video_urls[2] | replicate @Video1 camera movement |
@Audio1 – @Audio3 | audio_urls[0] – audio_urls[2] | @Audio1 for BGM rhythm |
Las etiquetas están indexadas desde 1 — @Image1 se refiere a la primera URL en image_urls, @Image2 a la segunda, y así sucesivamente.
Límites de Archivos
| Tipo | Cantidad Máxima | Formatos Soportados | Tamaño Máximo | Duración |
|---|---|---|---|---|
| Imágenes | 9 | .jpeg, .png, .webp, .bmp, .tiff, .gif | 30MB cada una | — |
| Videos | 3 | .mp4, .mov | 50MB cada uno | 2–15s en total |
| Audio | 3 | .mp3, .wav | 15MB cada uno | ≤ 15s en total |
Límite total: 12 archivos en todas las modalidades por solicitud.
Restricción de rostros: Las cargas de rostros humanos realistas se rechazan automáticamente.
Roles de Etiquetas @ para Imágenes
Use referencias de imágenes para controlar los elementos visuales del video generado:
| Rol | Patrón de Prompt | Descripción |
|---|---|---|
| Primer fotograma | @Image1 as first frame | Usa la imagen como el fotograma inicial del video |
| Último fotograma | @Image2 as last frame | Usa la imagen como el fotograma final |
| Referencia de personaje | @Image1 as character | Mantiene la apariencia del personaje durante todo el video |
| Referencia de estilo | @Image1 as style reference | Aplica el estilo visual (colores, ambiente, estética) |
| Referencia de escena | @Image1 as scene | Usa como fondo o referencia de entorno |
| Referencia de objeto | @Image1 as object | Referencia un objeto específico para que aparezca en el video |
| Composición | @Image1 as composition reference | Sigue la disposición y encuadre de la imagen |
Roles de Etiquetas @ para Videos
Use referencias de video para transferir movimiento, temporización y trabajo de cámara:
| Rol | Patrón de Prompt | Descripción |
|---|---|---|
| Movimiento de cámara | replicate @Video1 camera movement | Copia la trayectoria de cámara (panorámica, inclinación, zoom, dolly) |
| Coreografía | replicate @Video1 choreography | Replica patrones de movimiento de cuerpo/objeto |
| Efectos | replicate @Video1 effects | Transfiere efectos visuales y transiciones |
| Ritmo | match @Video1 rhythm | Sincroniza el timing de cortes y el ritmo del movimiento |
| Replicación completa | replicate @Video1 | Reproduce el movimiento general, la cámara y el ritmo |
| Extracción de audio | use @Video1 audio | Extrae y utiliza la pista de audio del video de referencia |
Roles de Etiquetas @ para Audio
Use referencias de audio para definir el ritmo y la banda sonora del video:
| Rol | Patrón de Prompt | Descripción |
|---|---|---|
| Música de fondo | @Audio1 for BGM rhythm | Sincroniza la energía del movimiento y los cortes con el ritmo musical |
| Efectos de sonido | @Audio1 as sound effects | Alinea eventos visuales con señales de audio |
| Sincronización de beat | sync to @Audio1 beat | Hace coincidir los picos de movimiento con los beats musicales |
Ejemplo de API
Una solicitud multimodal completa que combina referencias de imagen, video y audio:
import requests
response = requests.post(
"https://api.evolink.ai/v1/videos/generations",
headers={
"Authorization": "Bearer YOUR_API_KEY",
"Content-Type": "application/json"
},
json={
"model": "seedance-2.0",
"prompt": (
"@Image1 as first frame, @Image2 as character reference. "
"Replicate @Video1 camera movement. "
"Sync to @Audio1 beat. "
"A cinematic tracking shot through a neon-lit alley at night."
),
"image_urls": [
"https://example.com/scene-start.jpg",
"https://example.com/character-ref.jpg"
],
"video_urls": [
"https://example.com/camera-reference.mp4"
],
"audio_urls": [
"https://example.com/soundtrack.mp3"
],
"duration": 10,
"quality": "1080p",
"aspect_ratio": "16:9"
}
)
print(response.json())
Patrones Comunes
Consistencia de Personaje
Mantenga el mismo personaje en diferentes escenas proporcionando una imagen de referencia de personaje clara:
@Image1 as character reference. The woman walks through a busy market, picking up an apple, examining it closely.
Replicación de Cámara
Copie la trayectoria exacta de cámara de un video de referencia a una escena completamente nueva:
@Image1 as first frame. Replicate @Video1 camera movement. A sweeping drone shot over snow-covered mountains.
Video Musical
Sincronice los visuales generados con el ritmo y el beat de una pista de audio:
@Image1 as style reference. Sync to @Audio1 beat. Fast cuts of urban street scenes, neon lights, dancing figures.
Reglas y Restricciones
- Las etiquetas deben coincidir con la posición del array —
@Image1siempre esimage_urls[0] - No puede referenciar más archivos de los proporcionados en los arrays de URL
- Máximo 12 archivos en total en todas las modalidades
- Las imágenes de rostros humanos realistas se rechazan automáticamente
- Las referencias de video incrementan el costo de generación
- Todas las URLs deben ser directamente accesibles por el servidor (sin autenticación, sin redirecciones a páginas de inicio de sesión)
- Límite de longitud del prompt: 2000 tokens incluyendo el texto de las etiquetas
@
Relacionado
- API de Generación de Video -- Referencia completa del endpoint con todos los parámetros
- Guía de Etiquetas Multimodales de Seedance 2.0 -- Tutorial detallado con ejemplos creativos
- Tutorial de API de Movimiento de Cámara -- Replique el trabajo de cámara de videos de referencia
- SDKs y Ejemplos -- Código de integración en Python, Node.js, Go y cURL