Forschung: KI-Musik wird länger und intelligenter
In den letzten Tagen erschienen mehrere interessante Forschungsarbeiten:
JenBridge: erzeugt längere, zusammenhängende Soundtracks für Videos und achtet dabei auf musikalisch sinnvolle Übergänge zwischen Szenen.
MuChator: ein Musik-LLM für natürliche Gespräche über Musikgeschmack und Musiksuche, bereits in einer großen chinesischen Musikplattform im Einsatz.
Dasheng AudioGen: ein Modell, das Musik, Sprache und Geräusche gemeinsam als komplette Audioszene generieren kann.
Forschung: KI-Musik wird länger und intelligenterIn den letzten Tagen erschienen mehrere interessante Forschungsarbeiten:JenBridge: erzeugt längere, zusammenhängende Soundtracks für Videos und achtet dabei auf musikalisch sinnvolle Übergänge zwischen Szenen. MuChator: ein Musik-LLM für natürliche Gespräche über Musikgeschmack und Musiksuche, bereits in einer großen chinesischen Musikplattform im Einsatz. Dasheng AudioGen: ein Modell, das Musik, Sprache und Geräusche gemeinsam als komplette Audioszene generieren kann.
·45 Views
·0 Reviews