spot_img
14.7 C
Bogota
InicioTecnologíaVASA-1 de Microsoft: Optimiza tus proyectos con esta herramienta de video

VASA-1 de Microsoft: Optimiza tus proyectos con esta herramienta de video

Published on

Hoy

No circulan placas de 6:00 am a 9:00 pm terminadas en

Suscríbete a Momento24

Loading

Utilizando una foto y una pista de sonido, Microsoft ha diseñado una IA  llamada Vasa-1, que puede producir imágenes realistas de rostros en movimiento.

Microsoft ha dado un gran salto en el campo de la inteligencia artificial con el lanzamiento de VASA-1, una herramienta revolucionaria que transforma una sola imagen estática y un clip de audio en vídeos realistas y expresivos. Esta innovadora herramienta de generación de imágenes a vídeo tiene capacidades sorprendentes para crear rostros parlantes con movimientos labiales perfectamente sincronizados con el audio, así como una amplia gama de expresiones faciales y movimientos naturales de la cabeza.

El marco de VASA, según lo explicado por Microsoft, se centra en generar rostros virtuales realistas con habilidades visuales afectivas (VAS) a partir de una imagen y un audio de habla. El modelo VASA-1 ha sido elogiado por su capacidad para capturar la autenticidad y la vivacidad de los personajes generados, gracias a su enfoque holístico en la generación de dinámicas faciales y movimientos de cabeza en un espacio latente facial.

Uno de los aspectos más destacados de VASA-1 es su capacidad para personalizar los vídeos generados manipulando la dirección de la mirada, la distancia percibida y el estado emocional del personaje. Esto significa que los usuarios pueden adaptar los vídeos según sus necesidades específicas o para lograr efectos deseados, añadiendo un nivel de flexibilidad y creatividad sin precedentes en la generación de contenido visual.

El proceso de uso de VASA-1 es bastante sencillo e intuitivo. Basta con subir una fotografía al programa, agregar una instrucción y un discurso de audio, y luego el sistema genera automáticamente el vídeo con la capacidad de ajustar la mirada, el estado emocional y la velocidad de las palabras, permitiendo así una interacción en tiempo real con avatares realistas que emulan comportamientos conversacionales humanos.

Evento de Apple para desvelar los nuevos iPad se llevará a cabo el 7 de mayo

Últimas noticias

MET Gala 2024: Alfombra roja, invitados y outfits

Los 'Oscar de la moda' se realizan en Nueva York, que arrancó este lunes...

Daniel Muñoz: figura en la histórica goleada del Crystal Palace sobre el Manchester United

Con dos asistencia en la goleada 4-0 sobre el Manchester United, el lateral Daniel...

Estudios para el cable aéreo en Soacha serán financiados con medio millón de euros

Jorge Emilio Rey, gobernador de Cundinamarca, indicó que se hará estudios de prefactibilidad y...

Antanas Mockus abandona las filas de la Alianza Verde tras escandalo en la UNGRD

Según el exalcalde de Bogotá y exsenador,  Antanas Mockus, su decisión de dar un...

Más noticias similares

MET Gala 2024: Alfombra roja, invitados y outfits

Los 'Oscar de la moda' se realizan en Nueva York, que arrancó este lunes...

Daniel Muñoz: figura en la histórica goleada del Crystal Palace sobre el Manchester United

Con dos asistencia en la goleada 4-0 sobre el Manchester United, el lateral Daniel...

Estudios para el cable aéreo en Soacha serán financiados con medio millón de euros

Jorge Emilio Rey, gobernador de Cundinamarca, indicó que se hará estudios de prefactibilidad y...