Unsere Mission ist es Unternehmen zu unterstützen mit KI zu wachsen.

Zeroscope: Ein kostenloses Text-zu-Video-Modell

25.06.2023

Zeroscope

Über den Autor:

Von Danny Gerst

Danny Gerst hat 30 Jahre Erfahrung in der Softwareentwicklung und war für viele Unternehmen tätig. Er verfolgt täglich stundenlang die neuesten Trends und Lösungen, um seinen Kunden stets die effektivsten Strategien zu präsentieren.

Zeroscope, ein neues Text-zu-Video-Modell, bietet die Möglichkeit, Text in bewegte Bilder umzuwandeln. Als freie und kostenlose Software bietet Zeroscope eine hochauflösende, wasserzeichenfreie Alternative zu bestehenden Modellen und läuft auf aktuellen Grafikkarten. Mit zwei Modellen zur schnellen Generierung und Hochskalierung von Videos ebnet Zeroscope den Weg für die Zukunft der Text-zu-Video-Technologie.

Zeroscope ist ein kostenloses Text-zu-Video-Modell, das auf aktuellen Grafikkarten läuft. Es basiert auf ModelsScope Demo, einem mehrstufigen Text-zu-Video-Diffusionsmodell mit 17 Milliarden Parametern, das ein Video zu einer textuellen Beschreibung erzeugt. Zeroscope ist eine verfeinerte Variante von ModelsScope mit höherer Auflösung, ohne Shutterstock-Wasserzeichen und näher an einer 16:9-Auflösung. Es besteht aus zwei Komponenten: ZeroscopeV2 567W für eine schnelle Generierung in 576×320 Pixel, um Videoideen zu erforschen, und ZeroscopeV2 XL zum Hochskalieren gelungener Videos auf 1024×576 Pixel in hoher Qualität.

Die Zukunft der Text-zu-Video-Technologie

Text-zu-Video befindet sich noch in einem frühen Entwicklungsstadium. Die von KI generierten Clips sind meist nur wenige Sekunden lang und weisen zahlreiche Bildfehler auf. Bild-KI-Modelle sind jedoch ähnlich gestartet und konnten innerhalb weniger Monate Fotorealismus erreichen. Im Vergleich zu reinen Bildmodellen ist die Videogenerierung jedoch deutlich ressourcenintensiver beim Training ebenso wie bei der Generierung. Mit Zeroscope kommt jetzt das erste hochwertigere Open-Source-Modell hinzu, das den Beginn einer qualitativ hochwertigen Open-Source-Text-zu-Video-Technologie darstellt, die noch in den Kinderschuhen steckt, aber das Potenzial hat, sich ähnlich schnell zu entwickeln wie Text-zu-Bild-Modelle.

Quellen

Demo

Tutorial

YouTube

Co-Autor Eve

Eve ist unser KI-Co-Autor, der uns dabei hilft, Ihnen schnell und effizient die neuesten Neuigkeiten aus der Welt der Künstlichen Intelligenz zu präsentieren. Auch wenn Eve noch nicht in der Lage ist, Artikel eigenständig zu verfassen, bietet sie eine wertvolle Unterstützung und trägt dazu bei, Sie stets auf dem Laufenden zu halten.

← MosaicML präsentiert MPT-30B: Mächtig und Open Source GPT-4 Geheimnisse enthüllt →

Zahlen und Fakten

%

Leistungssteigerung

Sprachen mit KI

Innovationen pro Monat

Worauf warten Sie noch?

Vereinbaren Sie jetzt ein kostenloses Strategiegespräch und lassen Sie sich kostenlos beraten:

Erhalten Sie exklusive Einblicke in die neuesten KI-Trends und -Technologien
Profitieren Sie von praktischen Tipps und Ratschlägen zur Implementierung von KI in Ihrem Unternehmen
Seien Sie direkt mit dabei, wenn neue bahnbrechende Tools und Lösungen vorgestellt werden.

Starten Sie jetzt mit einer KI Lösung