Referencia Multimodal

Seedance 2.0 soporta un potente sistema de referencia con etiquetas @ que le permite asignar roles específicos a imágenes, videos y archivos de audio subidos dentro de su prompt. Esto le brinda un control creativo detallado sobre el video generado.

Sintaxis de Etiquetas @

Referencie archivos subidos en su prompt usando etiquetas @ que corresponden a la posición de cada URL en su respectivo array:

Formato de EtiquetaCorresponde AEjemplos
@Image1@Image9image_urls[0]image_urls[8]@Image1 as first frame
@Video1@Video3video_urls[0]video_urls[2]replicate @Video1 camera movement
@Audio1@Audio3audio_urls[0]audio_urls[2]@Audio1 for BGM rhythm

Las etiquetas están indexadas desde 1@Image1 se refiere a la primera URL en image_urls, @Image2 a la segunda, y así sucesivamente.

Límites de Archivos

TipoCantidad MáximaFormatos SoportadosTamaño MáximoDuración
Imágenes9.jpeg, .png, .webp, .bmp, .tiff, .gif30MB cada una
Videos3.mp4, .mov50MB cada uno2–15s en total
Audio3.mp3, .wav15MB cada uno≤ 15s en total

Límite total: 12 archivos en todas las modalidades por solicitud.

Restricción de rostros: Las cargas de rostros humanos realistas se rechazan automáticamente.

Roles de Etiquetas @ para Imágenes

Use referencias de imágenes para controlar los elementos visuales del video generado:

RolPatrón de PromptDescripción
Primer fotograma@Image1 as first frameUsa la imagen como el fotograma inicial del video
Último fotograma@Image2 as last frameUsa la imagen como el fotograma final
Referencia de personaje@Image1 as characterMantiene la apariencia del personaje durante todo el video
Referencia de estilo@Image1 as style referenceAplica el estilo visual (colores, ambiente, estética)
Referencia de escena@Image1 as sceneUsa como fondo o referencia de entorno
Referencia de objeto@Image1 as objectReferencia un objeto específico para que aparezca en el video
Composición@Image1 as composition referenceSigue la disposición y encuadre de la imagen

Roles de Etiquetas @ para Videos

Use referencias de video para transferir movimiento, temporización y trabajo de cámara:

RolPatrón de PromptDescripción
Movimiento de cámarareplicate @Video1 camera movementCopia la trayectoria de cámara (panorámica, inclinación, zoom, dolly)
Coreografíareplicate @Video1 choreographyReplica patrones de movimiento de cuerpo/objeto
Efectosreplicate @Video1 effectsTransfiere efectos visuales y transiciones
Ritmomatch @Video1 rhythmSincroniza el timing de cortes y el ritmo del movimiento
Replicación completareplicate @Video1Reproduce el movimiento general, la cámara y el ritmo
Extracción de audiouse @Video1 audioExtrae y utiliza la pista de audio del video de referencia

Roles de Etiquetas @ para Audio

Use referencias de audio para definir el ritmo y la banda sonora del video:

RolPatrón de PromptDescripción
Música de fondo@Audio1 for BGM rhythmSincroniza la energía del movimiento y los cortes con el ritmo musical
Efectos de sonido@Audio1 as sound effectsAlinea eventos visuales con señales de audio
Sincronización de beatsync to @Audio1 beatHace coincidir los picos de movimiento con los beats musicales

Ejemplo de API

Una solicitud multimodal completa que combina referencias de imagen, video y audio:

import requests

response = requests.post(
    "https://api.evolink.ai/v1/videos/generations",
    headers={
        "Authorization": "Bearer YOUR_API_KEY",
        "Content-Type": "application/json"
    },
    json={
        "model": "seedance-2.0",
        "prompt": (
            "@Image1 as first frame, @Image2 as character reference. "
            "Replicate @Video1 camera movement. "
            "Sync to @Audio1 beat. "
            "A cinematic tracking shot through a neon-lit alley at night."
        ),
        "image_urls": [
            "https://example.com/scene-start.jpg",
            "https://example.com/character-ref.jpg"
        ],
        "video_urls": [
            "https://example.com/camera-reference.mp4"
        ],
        "audio_urls": [
            "https://example.com/soundtrack.mp3"
        ],
        "duration": 10,
        "quality": "1080p",
        "aspect_ratio": "16:9"
    }
)

print(response.json())

Patrones Comunes

Consistencia de Personaje

Mantenga el mismo personaje en diferentes escenas proporcionando una imagen de referencia de personaje clara:

@Image1 as character reference. The woman walks through a busy market, picking up an apple, examining it closely.

Replicación de Cámara

Copie la trayectoria exacta de cámara de un video de referencia a una escena completamente nueva:

@Image1 as first frame. Replicate @Video1 camera movement. A sweeping drone shot over snow-covered mountains.

Video Musical

Sincronice los visuales generados con el ritmo y el beat de una pista de audio:

@Image1 as style reference. Sync to @Audio1 beat. Fast cuts of urban street scenes, neon lights, dancing figures.

Reglas y Restricciones

  • Las etiquetas deben coincidir con la posición del array — @Image1 siempre es image_urls[0]
  • No puede referenciar más archivos de los proporcionados en los arrays de URL
  • Máximo 12 archivos en total en todas las modalidades
  • Las imágenes de rostros humanos realistas se rechazan automáticamente
  • Las referencias de video incrementan el costo de generación
  • Todas las URLs deben ser directamente accesibles por el servidor (sin autenticación, sin redirecciones a páginas de inicio de sesión)
  • Límite de longitud del prompt: 2000 tokens incluyendo el texto de las etiquetas @

Relacionado