Das neue neuronale Netzwerk „Stable Audio“ generiert Musik basierend auf der Textbeschreibung
Verschiedenes / / September 14, 2023
Von den Machern von Stable Diffusion.
Stabilitäts-KI, bekannt vor allem für neuronale Netze zur Bilderzeugung (Stabile Verbreitung, Stabiles Gekritzel und nicht nur), freigegeben neues neuronales Netzwerk Stable Audio. Wie der Name schon sagt, werden Audioclips generiert.
Alles funktioniert ähnlich wie Bildgeneratoren, die auf Textbeschreibungen basieren. Der Benutzer gibt Schlüsselwörter an (z. B. „melodischer Lo-Fi-Hip-Hop, melodisch, 85 BPM“ oder „Death Metal mit kraftvollen Gitarrenriffs und schnellem Schlagzeug“), die gewünschte Dauer und wartet auf das Ergebnis.
Wir haben das gleiche Modell wie in Stable Diffusion als Grundlage verwendet, es jedoch auf Musikkompositionen statt auf Bildern trainiert. Insgesamt wurde sie mit etwa 800.000 Titeln von der Stock-Musikseite AudioSparx gefüttert – oder etwa 19.500 Stunden unterschiedlicher Sounds.
Die Macher weisen darauf hin, dass das Hauptmerkmal von Stable Audio die Möglichkeit ist, Kompositionen einer bestimmten Länge zu generieren. Bisher arbeiteten neuronale Netze nur mit einer festen Dauer: Wurden sie auf 30-Sekunden-Audioclips trainiert, konnten sie nur 30-Sekunden-Kompositionen generieren. Um die Dauer eines Titels anpassen zu können, mussten die Entwickler das Modell ändern und Metadaten für den Anfang und das Ende der Komposition hinzufügen.
Stable Audio wird in drei Modellen angeboten. Mit der kostenlosen Version können Sie nicht mehr als 20 Songs mit einer Dauer von bis zu 45 Sekunden pro Monat generieren. Es gibt auch ein Professional-Abonnement, mit dem Sie für 12 US-Dollar pro Stück bis zu 500 Titel mit einer Länge von bis zu 90 Sekunden erstellen können Monat (≈1.200 Rubel) und die Enterprise-Option für Unternehmen mit der Möglichkeit, die Erzeugungsmenge und den Preis individuell auszuwählen OK. Ohne ein kostenpflichtiges Abonnement können Sie die generierte Musik nicht für kommerzielle Zwecke nutzen.
Wie andere ähnliche neuronale Netze richtet sich Stable Audio eher an Content-Ersteller als an professionelle Musiker. Solche Tools eignen sich zum schnellen Erstellen von Hintergrundmusik für Podcasts und Videos, wenn Sie weder die Zeit noch das Budget haben, mit einem Komponisten zusammenzuarbeiten. Es kann auch Standardgeräusche ersetzen, wenn Sie einzigartiges Gelächter oder Menschenmengengeräusche wünschen.
Sie können Stable Audio auf der offiziellen Website ausprobieren. Sie müssen sich registrieren oder mit einem Google-Konto anmelden. Zu Beginn kann es aufgrund der starken Auslastung des Servers zu Zugriffsunterbrechungen kommen.
Stabiles Audio →
Weitere neue neuronale Netze🦾✨
- Der virtuelle Assistent AIDA von Sber wird Patienten in Moskauer Kliniken diagnostizieren
- Neue App Artisse generiert coole Fotos mit dem Gesicht des Benutzers
- Stability AI hat den Chatbot Stable Chat eingeführt – ein kostenloses Analogon von ChatGPT