Generieren von Sprache aus Text

Zuletzt aktualisiert am 7. November 2025

Erfahre, wie du in Firefly mithilfe von Textbeschreibungen Audioclips mit verschiedenen Stimmen, Tonlagen und Akzenten generierst.

In der App testen
Erstelle in wenigen einfachen Schritten ein Bild aus einer Textbeschreibung.

Mit Sprache generieren (Beta) kannst du natürlich klingende Audioclips und Begleitkommentare generieren. Mit Steuerelementen wie Akzent, Geschwindigkeit und Tonlage kannst du die Eigenschaften der Stimmen an deine Bedürfnisse anpassen.

Wähle auf der Homepage von Firefly im linken Bedienfeld Generieren und dann Sprache generieren aus.

Kopiere den Text, den du in Sprache konvertieren möchtest, und füge ihn auf der Seite Sprache generieren ein. Du kannst auch Text aus einer Datei importieren auswählen und eine Datei im DOCX- oder TXT-Format hochladen.

Navigiere nach dem Hinzufügen des Textes zum Bedienfeld Spracheinstellungen auf der linken Seite und wähle im Dropdown-Menü Modell die Option Firefly Speech aus.

Tipp:

Du kannst auch mit einem Partnermodell wie ElevenLabs Multilingual v2 Sprache aus Text generieren.

Wähle im Dropdown-Menü Stimme eine Stimme aus. Unter dem Dropdown-Menü Stimme kannst du Akzent/Sprache, Tonhöhe und Geschwindigkeit anpassen, um deiner Stimme einen einzigartigen Stil zu verleihen.

Im linken Bedienfeld wird im Abschnitt „Spracheinstellungen“ das Firefly Speech-Modell und ein erweitertes Dropdown-Menü „Stimme“ mit allen verfügbaren Stimmen angezeigt.
Wähle die Stimme aus, die am besten zu den Anforderungen des Projekts passt und deinen kreativen Zielen entspricht.

Hinweis:

Die Liste der Stimmen wird nur geladen, wenn du bei deinem Firefly-Konto angemeldet bist.

Wähle im Dropdown-Menü Sprache auswählen in der Liste der Sprachen eine Sprache und den Vortragsakzent aus, zum Beispiel Englisch (US) oder Englisch (Indien).

Im Abschnitt „Spracheinstellungen“ werden das Dropdown-Menü „Akzent“ und die Regler für Geschwindigkeit und Tonlage angezeigt, um die Sprachgenerierung anzupassen.
Passe die ausgewählte Stimme an, indem du deren Akzent, Geschwindigkeit und Tonlage einstellst.

A. Sprache auswählen B. Geschwindigkeit C. Tonlage 

Wenn du die Geschwindigkeit und die Tonlage der generierten Sprache ändern möchtest, passe die folgenden Spracheinstellungen an:
  • Geschwindigkeit: Ziehe den Geschwindigkeitsregler nach rechts, um die Geschwindigkeit der gesprochenen Audiodatei zu erhöhen, oder nach links, um sie zu verringern.
  • Tonlage: Ziehe den Tonlagenregler nach rechts, um die Tonlage der gesprochenen Audiospur zu erhöhen, oder nach links, um sie zu verringern.
Tipp:
  • Navigiere zum unteren Rand des linken Bedienfelds und wähle das Symbol   aus, um ein Audiobeispiel der ausgewählten Stimme mit angepasster Geschwindigkeit, Tonlage und Akzent abzuspielen.
  • Du kannst die Stimme auch zu den Favoriten hinzufügen. Wähle dazu das Symbol   aus.

Im Hauptfenster des Texteditors kannst du zusätzliche Änderungen am eingegebenen Text vornehmen:

  • Wiedergabe: Vorschau des ausgewählten Textes in den hochgeladenen Inhalten vor der Generierung.
Auf der Seite „Sprache generieren“ wird das Editor-Fenster angezeigt. Die Schaltfläche „Wiedergabe“ ist hervorgehoben, um eine Vorschau der Sprachausgabe anzuhören.
Mithilfe der Schaltfläche „Wiedergabe“ kannst du schnell eine Vorschau davon erhalten, wie der Text mit den ausgewählten Spracheinstellungen klingt.

  • Aussprache korrigieren: Aussprache korrigieren und zusätzliche Hinweise geben, wie bestimmte Wörter klingen sollen.
  • Suchen und Ersetzen: Wähle Wörter aus und ersetzen sie.
  • Ton hinzufügen: Füge eine Tonalität zur Audiospur hinzu, um die Betonung der generierten Sprache zu definieren.
Wenn du deinem Skript noch Text hinzufügen, eine Pause einfügen oder Schreibtipps sehen willst, geh einfach zur Leiste Generieren und mach die folgenden Einstellungen:
  • Text hinzufügen: Füge dem hochgeladenen Inhalt zusätzlichen Text hinzu, indem du eine TXT- oder DOCX-Datei importierst.
  • Pause einfügen: Pausen einfügen, damit die Audiospur natürlicher klingt.
  • Tipps anzeigen: Schau dir die Schreibtipps an, um die besten Ergebnisse zu erzielen.
Auf der Seite „Sprache generieren“ siehst du das Texteditorfenster, wo die Schaltfläche „Text hinzufügen“ in der Leiste „Generieren“ markiert ist.
Fahre mit der Maus über die Menüpunkte, um ihre Funktion zu verstehen.

Wähle Generieren aus.

Wenn du mit der Generierung und dem Klang zufrieden bist, wähle Download aus, um eine Kopie der Audiodatei auf deinem Gerät zu speichern.