slashCAM
Administrator
Administrator
Beiträge: 11262

Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von slashCAM »


Eine Forschungsgruppe bei Microsoft hat ein neues KI-Framework namens VASA-1 vorgestellt, das die Generierung lebensechter, sprechender Gesichter mit auffällig ansprechen...
Bild
Hier geht es zur Newsmeldung auf den slashCAM Magazin-Seiten:
Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei



Frank Glencairn
Beiträge: 23297

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Frank Glencairn »

Mit Ton:

Sapere aude - de omnibus dubitandum



7River
Beiträge: 3763

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von 7River »

Schon beeindruckend. Könnte man so etwas nicht in der Kriminaltechnik einsetzen? Gerade in den USA sind die was Genetik und Aussehen von Menschen angeht viel weiter. Hier fällt das unter Datenschutz.
„Wissen Sie, Ryback, aussehen tut's köstlich. Aber riechen tut's wie Schweinefraß. Ich hab' Ihren Scheiß lang genug geduldet. Nur weil der Captain die Art liebt, wie Sie kochen. Aber dieses eine Mal ist er nicht hier und wird Ihnen nicht helfen können.“



Frank Glencairn
Beiträge: 23297

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Frank Glencairn »

Was schwebt dir da vor? Sprechende Steckbriefe?
Sapere aude - de omnibus dubitandum



Tscheckoff
Beiträge: 1280

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Tscheckoff »

Genau. Ein rappender Steckbrief ala ^^:
https://x.com/froggyups/status/1780865913627283767
Falls sich wer für zu lange Technik-Videos interessiert ^^: https://www.youtube.com/user/AustrianGeek
Zur Info: Mit (*) markierte bzw. "amzn.to"-Links sind Affiliate- bzw. Werbelinks (!)



7River
Beiträge: 3763

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von 7River »

Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.
„Wissen Sie, Ryback, aussehen tut's köstlich. Aber riechen tut's wie Schweinefraß. Ich hab' Ihren Scheiß lang genug geduldet. Nur weil der Captain die Art liebt, wie Sie kochen. Aber dieses eine Mal ist er nicht hier und wird Ihnen nicht helfen können.“



MK
Beiträge: 4241

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von MK »

7River hat geschrieben: Do 18 Apr, 2024 17:15 Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.

Klar, wenn der Täter ein Passbild am Tatort hinterlässt... in der Überschrift des Artikels fehlt folgendes:


Das Framework benötigt als Input lediglich ein statisches Bild und einen Sprach-Audioclip als Eingabe.



Frank Glencairn
Beiträge: 23297

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Frank Glencairn »

7River hat geschrieben: Do 18 Apr, 2024 20:08 Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.
Was hat all das mit sprechenden Passbildern zu tun?
Die Gesichter werden ja nicht erzeugt, sondern nur per Audio Aufzeichnung animiert.

Und was DNA Phenotyping betrifft:
Besides pigmentation traits, no molecular prediction tests are currently available for any other EVCs due to limited knowledge on genes and predictive DNA markers.
Sapere aude - de omnibus dubitandum



7River
Beiträge: 3763

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von 7River »

Entschuldigung für meinen unqualifizierten Kommentar. Ich bin da weit abgeschweift.
„Wissen Sie, Ryback, aussehen tut's köstlich. Aber riechen tut's wie Schweinefraß. Ich hab' Ihren Scheiß lang genug geduldet. Nur weil der Captain die Art liebt, wie Sie kochen. Aber dieses eine Mal ist er nicht hier und wird Ihnen nicht helfen können.“



 Aktuelle Beiträge [alle Foren]
 
» USA: DJI-Drohnen könnten Betriebsverbot erhalten
von Blackbox - Mo 1:53
» Heinz Hoenig Spendenaktion
von Blackbox - Mo 1:39
» DaVinci Resolve 19 Public-Beta 2 zum freien Download verfügbar
von cantsin - Mo 0:36
» MagicYUV Fehler
von TinyChris - Mo 0:22
» Blackmagic Pyxis PL - Kaufberatung
von roki100 - Mo 0:08
» Panasonic S5 - Allgemeine Fragen, Tipps und Tricks, Zeig deine Bilder/Videos usw.
von roki100 - So 23:35
» Sparen, sparen, sparen: Cashbacks- und Rabatt-Angebote für Filmer - Weihnachten 2021
von Annefnd - So 21:55
» Was schaust Du gerade?
von klusterdegenerierung - So 20:43
» Windschutz für DPA 4560?
von berlin123 - So 20:26
» Lumix G9 II und GH 6 Sensor
von micha2305 - So 18:45
» Hollyland Pyro H 4K: HDMI Videofunkstrecke sendet an bis zu vier Empfänger
von slashCAM - So 14:18
» BIETE : Sony CFexpress 256 GB Typ B TOUGH R1700/W1480
von FocusPIT - So 13:21
» Peinlichkeiten auf der Leinwand: 10 Filme, die 2024 nicht mehr veröffentlicht werden könnten
von Darth Schneider - So 11:36
» Was hast Du zuletzt gekauft?
von ruessel - So 9:56
» Blackmagic PYXIS 6K: Die Vollformat „Box“-Kamera mit Viewfinder, 2x SDI, Sideplates (!) uvm.
von Darth Schneider - So 9:14
» Kamera Kaufberatung Budget ca. 2000€
von cantsin - Sa 16:20
» RED ist nun eine Nikon-Tochter - und Jarred Land abgesetzt
von iasi - Sa 15:49
» Windows 10 gewinnt weiter Marktanteile gegenüber Windows 11
von Hayos - Sa 14:42
» Dehancer Pro - Filmsimulation auf höchstem Niveau
von MK - Sa 14:20
» Bild und ton im Livestream nicht sychron
von Blackbox - Sa 13:32
» Was hörst Du gerade?
von Skeptiker - Sa 13:11
» SlashCAM - Server stark ausgelastet
von tom - Sa 11:35
» Können KI-generierte Bilder, Klänge und Videos von jedermann frei genutzt werden?
von Nathanjo - Sa 10:02
» Behind The Boom with Boom Operator Ken Strain | URSA Exclusive
von Blackbox - Fr 17:39
» Atomos Ninja maximale Aufnahmezeit
von andy.de - Fr 16:52
» Apple Vision Pro - Bereits nachlassende Nachfrage in den USA?
von macaw - Fr 15:28
» Wie wichtig ist Quicksync?
von MK - Fr 14:31
» Timecodes, XML, ChatGTP...andere Lösungen??
von DKPost - Fr 13:14
» Magix VPX Version 2025
von fubal147 - Fr 12:41
» TV Buddy
von ruessel - Fr 11:30
» schwarze Ränder bei NERO 9
von dienstag_01 - Fr 10:50
» Anfänger im Schnitt Stunden- bzw. Tageshonorar Beteiligung am Gewinn
von Jott - Fr 9:59
» Habt ihr Tipps um den Sunbounce Reflektor BIG auch auf dem Boom Stick zu verwenden?
von Alex - Fr 7:34
» Unser Maibaum in Hellersberg
von Jack43 - Do 20:44
» Vidu - die chinesische Antwort auf OpenAI Sora?
von xteve - Do 16:42