{"id":973,"date":"2024-04-27T05:50:38","date_gmt":"2024-04-27T05:50:38","guid":{"rendered":"https:\/\/navai.ch\/?p=973"},"modified":"2024-04-27T05:50:38","modified_gmt":"2024-04-27T05:50:38","slug":"microsoft-annuncia-il-modello-ai-vasa-1-per-trasformare-le-immagini-in-video","status":"publish","type":"post","link":"https:\/\/navai.ch\/it\/microsoft-annuncia-il-modello-ai-vasa-1-per-trasformare-le-immagini-in-video\/","title":{"rendered":"Microsoft annuncia il modello AI VASA-1 per trasformare le immagini in video"},"content":{"rendered":"<p>Microsoft ha recentemente presentato il suo nuovo modello AI VASA-1, progettato per generare volti parlanti realistici per personaggi virtuali con accattivanti abilit\u00e0 visive-affettive. Il framework VASA-1 pu\u00f2 creare brevi video con dinamiche realistiche del viso e della testa, sincronizzando i movimenti delle labbra con l&#8217;audio e catturando un ampio spettro di sfumature facciali e movimenti naturali della testa.<\/p>\n\n\n\n<p>Secondo Microsoft, il modello VASA-1 pu\u00f2 generare video fino a un minuto utilizzando una singola immagine statica e un clip audio vocale. Il modello offre inoltre agli utenti un controllo granulare per regolare diversi aspetti del video, come la direzione dello sguardo dell&#8217;occhio principale, la distanza della testa e gli offset delle emozioni. I controlli sull&#8217;aspetto districato, sulla posa della testa 3D e sulle dinamiche facciali consentono agli utenti di modificare l&#8217;output in un modo migliore.<\/p>\n\n\n\n<p>Il modello AI VASA-1 supporta la generazione online di video 512 x 512 fino a 40 fps con una latenza iniziale trascurabile. Il modello mostra la capacit\u00e0 di gestire input di foto e audio che non rientrano nella distribuzione della formazione, come foto artistiche, audio di canto e discorsi non inglesi. Questi tipi di dati non erano presenti nel training set.<\/p>\n\n\n\n<p>Microsoft ha sottolineato la sua intenzione di utilizzare la tecnologia VASA-1 per creare personaggi virtuali realistici piuttosto che rilasciarla come prodotto o API autonomo. La societ\u00e0 ha annunciato che VASA-1 non sar\u00e0 disponibile al pubblico e non \u00e8 previsto il rilascio di una demo online, API o ulteriori dettagli di implementazione relativi a VASA. Questa decisione deriva dall&#8217;impegno di Microsoft verso pratiche etiche di intelligenza artificiale e dalla sua opposizione a qualsiasi utilizzo di questa tecnologia per fuorviare o ingannare.<\/p>\n\n\n\n<figure class=\"wp-block-image\"><img decoding=\"async\" src=\"https:\/\/lh7-us.googleusercontent.com\/uGBdkCcK25ubDcr4IKkqeT59XRWqYHqclDuUY3z_os6dSf8F0OqRRFVjbRGQAw8wfaJImt_tjdmRdfxeFJ89I2ih259k9JtURhYDNI8Q7Koa3qWULqhO6eFm_qrHcfCz00c9h4pV4SzhV3uuJMiEImQ\" alt=\"\"\/><\/figure>\n\n\n\n<p>Affrontando le preoccupazioni sul potenziale uso improprio, Microsoft ha chiarito la sua posizione secondo cui la sua ricerca si concentra su applicazioni positive per la generazione di abilit\u00e0 visuo-affettive per avatar virtuali di intelligenza artificiale. Anche se il loro metodo potrebbe essere potenzialmente utilizzato in modo improprio per scopi di furto d&#8217;identit\u00e0, si impegnano a far avanzare le tecniche di rilevamento della contraffazione per mitigare tali rischi.<\/p>\n\n\n\n<p>In conclusione, il modello di intelligenza artificiale VASA-1 di Microsoft rappresenta una svolta nell\u2019intelligenza artificiale generativa in grado di creare volti parlanti realistici per personaggi virtuali con capacit\u00e0 visive-affettive accattivanti. Anche se la tecnologia non \u00e8 disponibile al pubblico, ha un grande potenziale per la creazione di personaggi virtuali realistici per varie applicazioni.<\/p>\n\n\n\n<p>Risorse: https:\/\/www.microsoft.com\/en-us\/research\/project\/vasa-1\/<\/p>","protected":false},"excerpt":{"rendered":"<p>Microsoft ha recentemente presentato il suo nuovo modello AI VASA-1, progettato per generare volti parlanti realistici per personaggi virtuali con accattivanti abilit\u00e0 visive-affettive. Il framework VASA-1 pu\u00f2 creare brevi video con dinamiche realistiche del viso e della testa, sincronizzando i movimenti delle labbra con l&#8217;audio e catturando un ampio spettro di sfumature facciali e movimenti [&hellip;]<\/p>","protected":false},"author":1,"featured_media":909,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[53],"tags":[],"class_list":["post-973","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-uncategorized-it"],"_links":{"self":[{"href":"https:\/\/navai.ch\/it\/wp-json\/wp\/v2\/posts\/973","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/navai.ch\/it\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/navai.ch\/it\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/navai.ch\/it\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/navai.ch\/it\/wp-json\/wp\/v2\/comments?post=973"}],"version-history":[{"count":0,"href":"https:\/\/navai.ch\/it\/wp-json\/wp\/v2\/posts\/973\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/navai.ch\/it\/wp-json\/wp\/v2\/media\/909"}],"wp:attachment":[{"href":"https:\/\/navai.ch\/it\/wp-json\/wp\/v2\/media?parent=973"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/navai.ch\/it\/wp-json\/wp\/v2\/categories?post=973"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/navai.ch\/it\/wp-json\/wp\/v2\/tags?post=973"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}