Das Handbuch zu &ktts;

KTTS"> MBROLA"> ]> Das Handbuch zu &ktts; Gary R. Cramblitt garycramblitt@comcast.net BurkhardLück

lueck@hube-lueck.de

Übersetzung 2004-2005 Gary R. Cramblitt &FDLNotice; 2005-07-31 1.05.00 &ktts; - das Sprachausgabe-System von &kde; - ist ein aus Modulen bestehender Dienst, der es jeder Anwendung ermöglicht, Text über die &DCOP;-Schnittstelle vorzulesen. &ktts; ist die praktische &kde;-Anwendung der KDE-Sprachausgabe API. KDE Zugänglichkeit tdeaccessibility TTS Sprachausgabe KTTSD kttsmgr festival flite hadifix MBROLA freetts epos SSML Einleitung &ktts; ist ein Teilsystem in &kde; zur Sprachausgabe (TTS). Es stellt eine gemeinsame Anwendungsschnittstelle für &kde;-Programmierer bereit, mit der deren Anwendungen mit TTS-Fähigkeiten ausgestattet werden können. Auch den Benutzern bietet es interessante Möglichkeiten. Eigenschaften für Benutzer: Vorlesen des Inhalts einer Textdatei. Vorlesen von &kde;-Nachrichten (KNotify). Vorlesen der Texte (oder Teilen davon) einer Webseite in &konqueror;. Vorlesen von Texten (oder Teilen davon) im Texteditor &kate;, auch wenn &kate; in andere &kde;-Anwendungen eingebettet ist. Ein langer Text wird in einzelne Sätze zerlegt. Der Benutzer kann satz- oder absatzweise zurückgehen, wiederholen lassen, die Ausgabe anhalten oder abbrechen. Audioausgabe über &arts;, ALSA, GStreamer (Version 0.8.7 oder neuer) oder aKode. Einstellbare Filter, um falsch ausgesprochene Worte zu ersetzen, Sprachsynthesizer auszuwählen und &XML;-Dokumente umzuwandeln. Eigenschaften für Programmierer: Prioritätssystem für die Ausgabe von Screen-Readern, Warnungen und Nachrichten, während andere Texte vorgelesen werden. Aus Modulen aufgebaute Architektur mit Unterstützung einer großen Anzahl von Sprachsynthesizern und Treibern. Ermöglicht die Erzeugung von Sprachausgaben auf der Befehlszeile (oder mit Shell-Skripten) über die &DCOP;-Hilfsprogramme von &kde;. Stellt für Anwendungen eine einfach zu benutzende Schnittstelle für die Sprachausgabe bereit. Anwendungen müssen keine Einzelheiten über das Sprachausgabegerät wissen. IN ZUKUNFT: Unterstützung für Speech-Markup-Sprachen wie VoiceXML, Sable, &Java; Speech-Markup-Language (JSML), und Speech-Markup-Meta-Sprache (SMML). IN ZUKUNFT: Eingeschränkte Unterstützung für eingebettete Sprachlesezeichen. Asynchron zur Vermeidung von Systemblockaden. &ktts; besteht zur Zeit aus mehreren Programmen: kttsd Der Sprachausgabe-Dienst von &kde;, eine Anwendung ohne sichtbare Fenster, die TTS-Dienste über &DCOP; anbietet. kttsmgr Eine Anwendung mit &GUI; zur Konfiguration und Einrichtung von kttsd über kttsmgr in der Systemabschnitt. libtdehtmlkttsdplugin Ein Modul für den Webbrowser &konqueror; für das Vorlesen der Texte einer Webseite oder Teilen davon. tdetexteditor_kttsd Ein Modul für den Texteditor &kate;, mit dem eine Textdatei ganz oder teilweise vorgelesen werden kann. Unterstützung Zusätzlich zur Bugzilla-Datenbank von &kde; (http://bugs.kde.org/) finden Diskussionen über &ktts; in der kde-accessibility Mailingliste statt. Abonnieren können Sie die Liste über https://mail.kde.org/mailman/listinfo/kde-accessibility. Die Entwickler finden Sie auch im IRC (irc.kde.org, Kanal #kde-accessibility). Arbeiten mit &ktts; Ehe Sie &ktts; benutzen können, müssen Sie mindestens ein Sprachsynthesizer-System installieren und richtig einstellen. Siehe auch Start von <command>kttsmgr</command> Zum Start des &ktts;-Systems geben Sie folgenden Befehl in einer &konsole; ein: kttsmgr oder klicken Sie im &kde;-Menü auf kttsmgr. Beim ersten Start von kttsmgr oder solange noch keine Sprecher eingerichtet sind, wird die Karteikarte Sprecher angezeigt. Siehe auch . Wenn Sie mindestens einen Sprecher eingerichtet haben, wird die Karteikarte Allgemein angezeigt. Siehe . Einrichtung der Synthesizermodule (Sprecher) Die meisten TTS-Synthesizer bieten verschiedene Sprachen und Stimmen an, so auch verschiedene männlich oder weibliche, oder solche, die sich in Lautstärke oder Geschwindigkeit unterscheiden. Sie können auch mehrere Varianten für einen Synthesizer einrichten. Eine so eingerichtete Kombination aus Sprache, Synthesizer, Stimme, Geschlecht, Lautstärke und Geschwindigkeit wird als Sprecher bezeichnet. Sie müssen zumindest einen Sprecher einrichten, bevor Sie &ktts; starten können, um Texte vorzulesen. Verschiedene Sprecher für den selben Synthesizer sind vergleichbar mit mehreren Druckerwarteschlangen für den selben Drucker. Wenn eine Anwendung Text an &ktts; übergibt, kann sie die Eigenschaften des bevorzugten Sprechers für die Ausgabe angeben. So kann einen Anwendung beispielsweise einen weiblichen englischen Sprecher anfordern. Wenn Sie einen Sprecher eingerichtet haben, dessen Sprache Englisch und dessen Geschlecht weiblich ist, wird dieser verwendet, andernfalls wird automatisch der am besten passende Sprecher gewählt. Wenn Sie mehr darüber erfahren wollen, wie &ktts; einen Sprecher auswählt, sehen Sie in nach. Wenn Sie auf den Karteikartenreiter Sprecher in kttsmgr klicken, wird die Karteikarte Sprecher angezeigt. Diese erscheint auch dann automatisch, wenn Sie kttsmgr starten und noch kein Sprecher eingerichtet ist. Die Sprachausgabeverwaltung von &kde; (Karteikarte Sprecher) Die Sprachausgabeverwaltung von &kde; (Karteikarte Sprecher) Klicken Sie, um einen neuen Sprecher hinzuzufügen. Alle bereits eingerichteten Sprecher erscheinen in dieser Liste. Die bevorzugten Sprecher erscheinen oben in der Liste. Der oberste Sprecher wird für die Sprachausgabe benutzt, wenn eine Anwendung keinen Sprecher vorgibt. Wählen Sie mit einem Mausklick einen Sprecher aus der Liste, und klicken Sie auf diesen Knopf, um den Sprecher aus der Liste zu entfernen. Wählen Sie mit einem Mausklick einen Sprecher aus der Liste, und klicken Sie auf diesen Knopf, um den Einstellungsdialog für das Synthesizermodul zu öffnen. Siehe unten. Wählen Sie mit einem Mausklick einen Sprecher aus der Liste, und klicken Sie auf diesen Knopf, um den Sprecher in der Liste eine Zeile weiter nach unten schieben. Die Reihenfolge der Sprecher in der Liste bestimmt auch ihre Priorität. Klicken Sie auf einen dieser Knöpfe, um Ihre Änderungen auf das laufende &ktts;-System anzuwenden. Wenn Sie auf Hinzufügen klicken, wird die Karteikarte Sprecher hinzufügen angezeigt. Karteikarte Sprecher hinzufügen. Karteikarte Sprecher hinzufügen Sie können ein Sprachsynthesizermodul entweder über den Namen des Synthesizers oder über die unterstütze[n] Sprache[n] auswählen. Beachten Sie die Auswahlknöpfe neben den zugehörigen Auswahlfeldern. Wenn Sprache ausgewählt ist, zeigt das Auswahlfeld Sprache alle Sprachen an, die von den vorhandenen Sprachsynthesizern unterstützt werden, und im Auswahlfeld Synthesizer erscheinen nur die Synthesizer, die auch die gewählte Sprache unterstützen. Wenn Sie Synthesizer wählen, zeigt das Auswahlfeld Synthesizer alle vorhandenen Synthesizer, und im Auswahlfeld Sprache werden nur die Sprachen angezeigt, die auch vom gewählten Synthesizer unterstützt werden. Wählen Sie hier die Sprache und das Synthesizermodul. Wenn Sie hier klicken, werden die meisten Synthesizer automatisch in der Standardeinstellung eingerichtet. Ein neuer Sprecher erscheint auf der Karteikarte Sprecher. Um die Einstellungen dieses Sprechers anzuzeigen oder zu bearbeiten, klicken Sie auf Bearbeiten. Wenn Sie auf der Karteikarte Sprecher auf Hinzufügen klicken, und damit einen Sprecher in die Liste einfügen oder auf Bearbeiten klicken, wird die Karteikarte Sprecher-Einrichtung angezeigt. Als Beispiel wird im Folgenden die Einrichtung des Moduls für Festival Interactive gezeigt. Einzelheiten zu den Modulen finden Sie unter . Sprecher-Einrichtung Sprecher-Einrichtung Geben Sie den Pfad zum ausführbaren Festivalprogramm ein. Wenn der Pfad zu Festival in PATH enthalten ist, müssen Sie nur festival eingeben. Klicken Sie für die Suche nach verfügbaren Stimmen. Wählen Sie eine Stimme. Wählen Sie die Zeichenkodierung für Text, der an Festival übergeben wird. Bei Stimmen, die &ktts; bekannt sind, wird diese Einstellung automatisch vorgenommen. Allgemein gilt, dass westliche Sprachen ISO 8859-1 verwenden, östliche Sprachen wie Tschechisch oder Slowakisch verwenden ISO 8859-2. Klicken Sie hier zum Testen. Sie sollten die Sprachausgabe eines Testsatzes hören. Mit diesen Schiebereglern stellen Sie Lautstärke, Sprechgeschwindigkeit und Tonhöhe der synthetischen Sprache ein. Wenn Sie einige Regler nicht auswählen können und diese grau angezeigt werden, lässt die von Ihnen gewählte Stimme diese Einstellungen nicht zu. Einige Stimmen wie MultiSyn-Stimmen benötigen aufgrund ihrer Größe mehrere Sekunden um geladen zu werden. Wenn Sie dieses Ankreuzfeld markieren, werden diese Stimmen bereits beim Start von KTTSD geladen, sodass (bei größerem Speicherverbrauch) der erste Satz schneller synthetisiert wird. Klicken Sie auf den Knopf OK, um die Einstellungen des Sprechers zu speichern. Klicken Sie auf Anwenden, sonst werden Ihre Änderungen nicht vom laufenden &ktts;-System übernommen. Wenn der Test funktioniert hat, können Sie &ktts; schon fast benutzen. Gehen Sie zurück zur Karteikarte Allgemein und überprüfen Sie, ob Sprachausgabe aktivieren (KTTSD) angekreuzt ist, damit der TTS-Dienst von &kde; startet. Siehe . Jetzt können Sie &ktts; benutzen, um Text vorlesen zu lassen. Klicken Sie auf die Karteikarte Aufträge, um Textaufträge zu erstellen und zu verwalten. Siehe . Start von KTTSD und allgemeine Einrichtung Wenn Sie mindestens einen Sprecher eingerichtet haben, können Sie das Sprachausgabesystem von &kde; starten. Klicken Sie auf den Karteikartenreiter Allgemein, um diese Karteikarte zu öffnen. Hier können Sie einige allgemeine Optionen einstellen. Die Sprachausgabeverwaltung von &kde; (Karteikarte Allgemein). Die Sprachausgabeverwaltung von &kde; (Karteikarte Allgemein) Markieren Sie dieses Ankreuzfeld, um das &ktts;-System zu aktivieren. Dies startet den KDE-TTS-Dienst (KTTSD). Ist dieser Start erfolgreich, wird die Karteikarte Aufträge angezeigt, und Sie können Textaufträge erstellen und vorlesen lassen. Siehe . Entfernen Sie die Markierung, wird KTTSD angehalten und das TTS-System von &kde; deaktiviert. Wenn dieses Ankreuzfeld nicht ausgewählt werden kann, haben Sie noch keinen Sprecher eingerichtet (oder vergessen auf Anwenden zu klicken). Siehe . Ist dieses Ankreuzfeld markiert, wird ein Symbol in der Systemleiste angezeigt, wenn kttsmgr läuft. In diesem Fall beendet der Klick auf OK oder Beenden kttsmgr nicht, sondern nur die Oberfläche; kttsmgr läuft weiter in der Systemleiste. Ein Klick auf das Symbol in der Systemleiste zeigt die Karteikarte wieder an. Um kttsmgr zu beenden, klicken Sie mit der rechten Maustaste auf das Symbol und wählen Beenden. Ist das Ankreuzfeld nicht markiert, erscheint auch kein Symbol in der Systemleiste. Dann beendet ein Klick auf OK oder Beenden kttsmgr. Wenn kttsmgr beendet wird, läuft &ktts; weiter, sofern das Feld Sprachausgabe aktivieren (KTTSD) angekreuzt ist. Diese Option wirkt sich erst beim nächsten Start von kttsmgr aus. Diese Option ist unwirksam, wenn kttsmgr im &kcontrolcenter; läuft. Ist dieses Ankreuzfeld markiert, wird beim Start von kttsmgr das Programmfenster kttsmgr angezeigt. Ansonsten ist nach dem Start nur das Symbol kttsmgr im Systemabschnitt sichtbar, aber nicht das Programmfenster. Klicken Sie auf das Symbol im Systemabschnitt, um das Programmfenster anzuzeigen. Ist dieses Ankreuzfeld markiert und kttsmgr läuft noch nicht, erscheint es im Systembereich, sobald KTTSD einen Text vorliest. Dadurch haben Sie die Möglichkeit das Vorlesen anzuhalten oder anderweitig zu steuern. Ist dieses Ankreuzfeld markiert und kttsmgr erscheint beim Vorlesen automatisch im Systembereich der Kontrollleiste, verschwindet es wieder, sobald das Vorlesen abgeschlossen ist. Klicken Sie hier, um Ihre Einstellungen zu speichern. Textaufträge verwalten Wenn Sie auf den Karteikartenreiter Aufträge im kttsmgr klicken, wird die Karteikarte Aufträge angezeigt. Die Sprachausgabeverwaltung von &kde; (Karteikarte Aufträge). Die Sprachausgabeverwaltung von &kde; (Karteikarte Aufträge) Hier sind alle Aufträge in der Warteschlange aufgeführt, zusammen mit der Anwendung, die den Auftrag eingestellt hat, dem aktuellen Status des Auftrags, der Anzahl der Sätze und dem gerade bearbeiteten Satz. Die Sprecher-ID entspricht der Spalte ID auf der Karteikarte Sprecher. Mit den Knöpfen in dieser Reihe können Sie Textaufträge starten, löschen und anhalten. Wählen Sie einen Auftrag aus der unten angezeigten Liste und klicken Sie auf einen dieser Knöpfe. Mit den Knöpfen in dieser Reihe können Sie satzweise in dem Auftrag, der in der Liste unten ausgewählt ist, vor- oder zurückgehen. (Aber nicht jeder Auftrag besteht aus mehreren Sätzen). Mit den Knöpfen in dieser Reihe können Sie den aktuellen Text in der &kde;-Zwischenablage vorlesen lassen oder eine Textdatei zum Vorlesen öffnen. Sie können außerdem die Liste der Textaufträge neu einlesen oder den Sprecher für einen Auftrag wechseln. Siehe auch . Hier erscheint der gerade gesprochene Satz. Mit einem Klick auf OK werden alle Änderungen der Einstellungen (auch auf den anderen Karteikarten) übernommen und kttsmgr wird zum Symbol im Systemabschnitt verkleinert. Klicken Sie dann auf dieses Symbol, um das Programmfenster wieder anzuzeigen. Ziehen Sie diesen Bereichsteiler, um die Größe der Leisten für die Auftragsliste und den Bereich Aktueller Satz zu ändern. Die Karteikarte Aufträge wird nur angezeigt, wenn KTTSD gestartet wurde. Um KTTSD zu starten, klicken Sie auf den Karteikartenreiter Allgemein und kreuzen dort Sprachausgabe aktivieren (KTTSD) an. Wenn das Soundsystem &arts; nicht installiert ist, sondern stattdessen ALSA, GStreamer oder aKode, klicken Sie auf die Karteikarte Audio. Siehe auch . Hier werden nur Textaufträge aufgeführt und verwaltet. Ausgaben von Screen-Readern, Warnungen und Nachrichten werden nicht angezeigt. Weitere Informationen über die Nachrichtentypen von &ktts; finden Sie in . Audio-Einstellungen Wenn Sie auf den Karteikartenreiter Audio in kttsmgr klicken, wird die Karteikarte Audio angezeigt. Die Sprachausgabeverwaltung von &kde; (Karteikarte Audio). Die Sprachausgabeverwaltung &kde; (Karteikarte Audio) Wählen Sie hier die Art der Audioausgabe. Wenn eine Komponente nicht ausgewählt werden kann, wurde &ktts; entweder ohne Unterstützung für das entsprechende Audiomodul kompiliert oder &ktts; kann die notwendigen Bibliotheken nicht laden. Wenn Gstreamer oder aKode für die Audioausgabe benutzt werden soll, wählen Sie hier den Audio-Ausgang. Wenn keine Ausgangsmodule in der Liste angezeigt werden, müssen Sie mindestens ein Modul installieren. Haben Sie ALSA ausgewählt, wählen Sie hier das PCM-Gerät. Siehe auch Stellen Sie die Sprechgeschwindigkeit hier ein. 50% entspricht etwa der halben und 200% etwa der doppelten normalen Sprechgeschwindigkeit. Damit diese Einstellungen umgesetzt werden können, muss das Programm sox installiert sein. Wenn Sie dieses Ankreuzfeld markieren, kopiert &ktts; temporäre Audiodateien (.wav-Dateien) in den angezeigten Ordner. Wählen Sie dafür einen beliebigen Ordner auf Ihrer Festplatte, für den Sie Schreibberechtigung haben. Damit können Sie Audiodateien mit Texten auch für andere Anwendungen erzeugen. Diese Dateien haben dann Namen wie kttsd-J-SS, dabei ist J die Auftragsnummer und SS die Satznummer. Vorhandene Dateien mit gleichem Namen werden überschrieben. Da diese Dateien viel Speicherplatz benötigen, sollten Sie diese Einstellung nicht unnötig aktiviert haben. Klicken Sie auf Anwenden, um die neuen Einstellungen für das laufende &ktts;-System zu übernehmen. Es gibt zwei Möglichkeiten, die Sprechgeschwindigkeit in &ktts; einzustellen. Viele Sprecher haben eine Einstellung für Geschwindigkeit in ihrem Einstellungsdialog, den Sie mit einem Klick auf Bearbeiten auf der Karteikarte Sprecher erreichen. Diese Einstellung der Geschwindigkeit auf der Karteikarte Audio wirkt zusätzlich zur Einstellung der Sprechergeschwindigkeit und kann immer benutzt werden, auch wenn der Sprecher keine Einstellung der Geschwindigkeit zulässt. Damit dies funktioniert, müssen Sie das Programm sox auf Ihrem System installieren (Debian Nutzer: apt-get install sox). Diese Einstellung wird jedoch nicht benutzt, wenn Sie Text mit SSML vorlesen lassen. (Siehe ) Die Liste der ALSA-Geräte umfasst alle PCM-Geräte und Module, die in Ihrem System eingerichtet sind. Die meisten davon werden nicht funktionieren. Sie müssen selbst herausfinden, welches Gerät bei Ihnen funktioniert. Im Zweifel wählen Sie Standard. Einrichtung der Textunterbrechung Wenn Sie auf die Karteikarte Unterbrechung in kttsmgr klicken, öffnet sich die Karteikarte Unterbrechung. Die Sprachausgabeverwaltung von &kde; (Karteikarte Unterbrechung). Die Sprachausgabeverwaltung &kde; (Karteikarte Unterbrechung) Auf dieser Karteikarte können Sie besondere Aktionen einrichten, die immer dann ausgeführt werden, wenn der Textauftrag von einer Nachricht mit höherer Priorität unterbrochen wird. &ktts; verarbeitet vier Arten von Sprachaufträgen: Normalen Text Nachrichten Warnungen Ausgaben von Screen-Readern Die Ausgabe von Screen-Readern hat die höchste Priorität. Sie wird allen anderen Aufträgen vorgezogen und hält diese Aufträge an. Nachdem die Ausgabe der Screen-Reader vorgelesen wurde, werden die angehaltenen Aufträge wieder aufgenommen. Warnungen haben die nächsthöhere Priorität. Diese Stufe ist wichtigen Nachrichten wie z. B. "Prozessor wird zu heiß" vorbehalten. Eine Warnung hält die Ausgabe von Nachrichten und normalem Text an. Diese Aufträge werden nach dem Vorlesen der Warnung wieder fortgesetzt. Nachrichten haben die nächste Priorität. Eine Nachricht unterbricht normalen Text. &kmouth; ist ein Beispiel für eine Anwendung, die Nachrichten ausspricht. Wenn Sie z. B. gerade einen langen Text auf einer Webseite vorlesen lassen, können Sie mit &kmouth; trotzdem jemanden begrüßen, der gerade den Raum betritt. Alle vier Auftragsarten werden in Warteschlangen abgearbeitet, mit Ausnahme der Ausgabe von Screen-Readern. Wenn eine Anwendung die Ausgabe eines Screen-Readers schickt, während &ktts; gerade eine solche vorliest, wird diese Ausgabe angehalten und beendet. Wird ein Textauftrag durch eine Nachricht, Warnung oder die Ausgabe eines Screen-Readers unterbrochen, fügt &ktts; die Audioausgabe in die Warteschlange ein. Diese Mitteilung wird vorgelesen, wenn ein normaler Textauftrag unterbrochen wird. Diese Audiodatei wird immer dann abgespielt, wenn ein normaler Textauftrag unterbrochen wird. Wenn sowohl Einleitender Klang als auch Einleitende Nachricht aktiv sind, wird der Einleitende Klang vor der Einleitenden Nachricht abgespielt. Diese Mitteilung wird vorgelesen, wenn ein normaler Textauftrag nach einer Unterbrechung wieder aufgenommen wird. Diese Audiodatei wird abgespielt, wenn ein unterbrochener Textauftrag fortgesetzt wird. Die Einstellungen auf dieser Karteikarte gelten nur für normale Textaufträge. Für Nachrichten, Warnungen und die Ausgaben von Screen-Readern gibt es keine besonderen Aktionen, wenn diese durch eine Nachricht mit höherer Priorität unterbrochen werden. Das Vorlesen von Webseiten-Inhalten In &konqueror;, dem Webbrowser von &kde;, können Sie den Text der angezeigten Webseite vorlesen lassen. Überprüfen Sie zuerst, ob &ktts; läuft. Markieren Sie dann den Text, der vorgelesen werden soll, und wählen Sie im Hauptmenü Werkzeuge Text vorlesen . Nach kurzer Zeit sollte die Sprachausgabe beginnen. Es ist fast immer sinnvoll, den gewünschten Text einer Webseite zu markieren. Sie können diesen Schritt auch überspringen, aber dann werden viele &HTML;-Vorspannzeilen und andere unsichtbare Marken ebenfalls vorgelesen. Sprachausgabe im Texteditor &kate; In &kate; dem erweiterten Texteditor von &kde;, können Sie angezeigten Text vorlesen lassen. Überprüfen Sie zuerst, ob &ktts; läuft. Markieren Sie dann den Text, der vorgelesen werden soll, und wählen Sie im Hauptmenü Werkzeuge Text vorlesen . Dann sollte die Sprachausgabe beginnen. Sie müssen nicht unbedingt Text markieren; in diesem Fall wird die ganze Datei vorgelesen. Dies funktioniert auch, wenn &kate; in andere Anwendungen eingebettet ist, wie z. B. in &konqueror; oder in &quanta;. Vorlesen von Nachrichten (Knotify) KNotify ist das Nachrichtensystem von &kde;, das Sie über von Ihnen festgelegte Ereignisse benachrichtigt. Sie können den Text dieser Nachrichten auch von &ktts; vorlesen lassen. In &konversation;, dem IRC-Programm von &kde;, können Sie verschiedene Arten von Nachrichten einrichten. Sie können &konversation; beispielsweise so einrichten, dass Sie benachrichtigt werden, wenn in einem IRC-Kanal eine Nachricht auftaucht, in der Ihr Nickname vorkommt. Mit &ktts; können Sie sich dann den IRC-Nachrichtentext vorlesen lassen. Unterstützt ein &kde;-Programm KNotify, erscheint ein Menüeintrag Benachrichtigungen im Menü Einstellungen dieses Programms. Die hier möglichen Einstellungen für KNotify unterscheiden sich je nach Anwendung. Um mit &ktts; KNotify-Nachrichten vorlesen zu lassen, starten Sie kttsmgr und klicken auf Benachrichtigungen. Die Karteikarte Benachrichtigungen erscheint. Die Sprachausgabeverwaltung von &kde; (Karteikarte Benachrichtigungen). Die Sprachausgabeverwaltung von &kde; (Karteikarte Benachrichtigungen) Markieren Sie dieses Ankreuzfeld, um das Vorlesen von &kde;-Benachrichtungen einzuschalten. Ist diese Einstellung nicht markiert, sind die übrigen Einstellungen deaktiviert und &ktts; liest keine Benachrichtigungen vor. Ist diese Einstellung markiert, werden Benachrichtigungen, bei denen ein Klang abgespielt wird, von &ktts; nicht vorgelesen. Verwenden Sie diese Knöpfe, um Ereignisse zur Liste hinzuzufügen oder daraus zu löschen. Wenn Sie auf den Knopf Hinzufügen klicken, erscheint ein Dialog, in dem Sie die Anwendung und das Ereignis auswählen können, das Sie zur Liste hinzufügen wollen. Dieses Ereignis liest die Nachricht vor, die &konversation; verschickt, wenn jemand in einer IRC-Nachricht Ihren Nicknamen erwähnt. Alle anderen Ereignisse, die von &konversation; verschickt werden, werden von &ktts; ignoriert. Alle Ereignisse, für die in der Liste nichts anderes angegeben ist, werden von &ktts; ignoriert. Verwenden Sie dieses Auswahlfeld, um festzulegen, was &ktts; tun soll, wenn ein Ereignis eintrifft. Sie haben folgende Auswahlmöglichkeiten: Ereignis vorlesen Liest den Ereignisnamen, der in der Liste der Ereignisse aufgeführt ist. Benachrichtigung vorlesen Liest die Nachricht so vor, wie sie von der Anwendung verschickt wird. Benachrichtigung nicht vorlesen Dieses Ereignis wird überhaupt nicht vorgelesen. Text vorlesen: Liest den Text vor, den Sie im Eingabefeld rechts eingeben. Wenn Sie Benutzerdefinierten Text vorlesen ausgewählt haben, geben Sie den gewünschten Text ein. Sie können dabei die folgenden Platzhalter verwenden: %e Der Name des Ereignisses %a Der Name der Anwendung, die das Ereignis verschickt hat %m Die Nachricht, die die Anwendung verschickt hat Testen Sie die Nachricht, in dem Sie hier klicken. Sie können hier die Eigenschaften des gewünschten Sprechers eingeben. Standard wählt den Sprecher aus, der in der Liste auf der Karteikarte Sprecher als oberster Eintrag angezeigt wird. Sehen Sie dazu auch . Beachten Sie, dass es drei Ebenen für Ereignisse gibt. Ist für ein bestimmtes Ereignis einer bestimmten Anwendung eine Aktion festgelegt, wird diese ausgeführt. Andernfalls wird die Aktion für alle anderen Ereignisse der bestimmten Anwendung ausgeführt. Als letzte Möglichkeit kommt die Aktion zum Tragen, die unter Standard (alle anderen Ereignisse) festgelegt wurde. Das Ereignis Alle Benachrichtungen für die Anwendung Standard (alle anderen Ereignisse kann nicht aus der Liste gelöscht werden. Hierfür können Sie die vorzulesenden Benachrichtigungen wie folgt festlegen: keine Kein Ereignis wird vorgelesen. Benachrichtigungsdialoge Vorgelesen werden Benachrichtigungen, die eine Bestätigung erwarten. Passive Aufklappfenster Benachrichtigungen, die einen passiven Dialog anzeigen, der automatisch geschlossen wird, werden vorgelesen. Benachrichtungsdialoge und passive Aufklappfenster Benachrichtigungen, die auf dem Bildschirm angezeigt werden, passiv oder nicht, werden vorgelesen. alle Benachrichtigungen Alle Benachrichtungen, egal ob Sie auf dem Bildschirm angezeigt werden oder nicht, werden vorgelesen. Filter zur Zeichenkettenersetzung bieten eine gute Möglichkeit in &ktts; falsch betonte oder fehlerhaft ausgesprochene Nachrichten zu korrigieren. Die Datei kmail.xml, die zum Lieferumfang von &ktts; gehört, ist ein gutes Beispiel. Sie entfernt die Tags br und b aus den Nachrichten, die KMail versendet, und zudem den Ausdruck /local/inbox, da dieser in den meisten Fälle als vorausgesetzt angenommen werden kann. Lesen Sie dazu auch . Verwenden Sie den Knopf Speichern, um die Einstellungen für die Benachrichtigungen in eine Datei zu speichern. Verwenden Sie den Knopf Laden, um gespeicherte Einstellungen aus einer Datei zu laden. Die geladenen Ereignisse werden mit den Ereignissen in der Liste zusammengeführt. Wenn Sie mit einer leeren Liste beginnen wollen, klicken Sie auf Löschen. Alle Einträge außer Alle Benachrichtungen werden gelöscht. Klicken Sie auf Anwenden oder OK, um die neuen Einstellungen zu übernehmen. SSML Die Speech Synthesis Markup Language (SSML) ist ein W3C-Standard, um Text für eine Sprachausgabe zu markieren. Dieser Standard enthält Marken für die Steuerung von Stimmen, der Sprechgeschwindigkeit, der Lautstärke, des Geschlechts der Stimme und der Tonhöhe. Außerdem Marken für die Steuerung der Aussprache von zum Beispiel Abkürzungen. SSML ist ein Teil der VoiceXML-Spezifikation, einem weiteren W3C-Standard. Zur Zeit unterstützt &ktts; SSML nur teilweise und nur in den Grundfunktionen. Folgende Einschränkungen sind vorhanden: Arbeitet nur mit Sprechern von Festival Interactive und Hadifix. Sie müssen die rab_diphone Stimme (britisch männlich) installieren, da dies die Standardstimme ist, die Festival bei der Ausgabe von SSML benutzt. Die Einstellung Geschwindigkeit auf der Karteikarte Audio wird nicht berücksichtigt, wenn Sie Text mit SSML vorlesen lassen. Wenn die Einstellungen für Geschwindigkeit oder Tonlage im Festival-Konfigurationsdialog nicht auf 100% eingestellt ist, wird SSML-Text üblicherweise sehr monoton gesprochen. Mit dem folgenden Beispieltext können Sie mit SSML experimentieren. Wer hat in meinem Bett geschlafen? fragte Papa Bär. Wer hat in meinem Bett geschlafen? fragte Mama Bär. Wer hat in meinem Bett geschlafen? fragte das Bärenkind. ]]> Ein bessere Unterstützung von SSML ist für die nächsten Versionen von &ktts; geplant. Filter (Fortgeschrittene) Filter sind eine der fortgeschrittenen Fähigkeiten von &ktts;. Für die normale Arbeit mit &ktts; sind Filter nicht erforderlich. In Filtern wird Text bearbeitet, ehe er zum Sprachsynthesizer geschickt wird. Sie sind nützlich für die Verbesserung der Aussprache, um falsch gesprochene Worte oder Abkürzungen zu ersetzen, eine passende Sprache und Sprecher auszuwählen oder um bestimmte Mängel von Sprachsynthesizern und deren Stimmen zu umgehen. &ktts;-Nachrichtentypen Um die Arbeitsweise von Filtern zu verstehen, ist es wichtig zu wissen, wie &ktts; mit einem Text arbeitet. &ktts; unterscheidet vier Arten von Texten. Ausgaben von Screen-Readern Warnungen Nachrichten Textaufträge Der Typ wird von der Anwendungen festgelegt, die eine Nachricht an &ktts; verschickt. Die Ausgabe von Screen-Readern hat die höchste Priorität. Sie wird allen anderen Aufträgen vorgezogen und hält diese Aufträge an. Wenn die Ausgabe der Screen-Reader vorgelesen ist, werden die angehaltenen Aufträge wieder fortgesetzt. Warnungen haben die nächste Priorität. Diese Stufe ist wichtigen Nachrichten wie z. B. "Prozessor wird zu heiß" vorbehalten. Eine Warnung hat Vorrang und hält die Ausgabe von Nachrichten und normalem Text an. Diese Aufträge werden nach der Ausgabe der Warnung wieder fortgesetzt. Nachrichten haben die nächsthöchste Priorität. Eine Nachricht unterbricht normalen Text. &kmouth; ist ein Beispiel für eine Anwendung, die Nachrichten verwendet. Während Sie z. B. einen langen Text auf einer Webseite vorlesen lassen, können Sie mit &kmouth; jemanden begrüßen, der gerade den Raum betritt. &kde;-Benachrichtigungen sind ebenfalls Nachrichten. Lesen Sie dazu . Der Rest sind einfache Textaufträge. Jeder Auftrag, den Sie von der Karteikarte Aufträge anstoßen, ist ein Textauftrag. KSayit ist ein Beispiel für eine Anwendungen, die Textaufträge verwendet. Textaufträge sind für die Ausgabe längerer Texte gedacht, die keine besondere Dringlichkeit besitzen. Alle vier Auftragsarten werden in Warteschlangen abgearbeitet, mit Ausnahme der Ausgabe von Screen-Readern. Wenn eine Anwendung die Ausgabe eines Screen-Readers schickt, während &ktts; gerade eine solche vorliest, wird diese Ausgabe angehalten und beendet. Filterarten Zuerst müssen Sie wissen, dass Filter nie auf die Ausgabe von Screen-Readern angewendet werden. Sie werden auf normale Warnungen, Nachrichten und Textaufträge sowie auf &kde;-Nachrichten angewendet. Es gibt zwei Arten von Filtern - normale Filter und Satzgrenzenerkennungsfilter (SDB-Filter). SBDs unterteilen Text in einzelne Sätze. Dadurch kann &ktts; schneller mit dem Vorlesen beginnen, da nur der erste Satz synthetisiert werden muss, nicht der ganze Textauftrag. Damit können Sie außerdem auf der Karteikarte Aufträge satzweise vor- oder zurückspringen oder anhalten und abbrechen, auch wenn der Sprachsynthesizer dies nicht direkt unterstützt. Normale Filter bearbeiten den Text und geben ihn an den nächsten Filter weiter. Zur Zeit gibt es drei Arten von normalen Filtern. Zeichenkettenersetzer &XML;-Umformer Sprecherauswahl Filter sind als Module ausgeführt. In Zukunft kann es noch weiter Arten von Filtern geben. Zeichenkettenersetzer ersetzen Teile eines Textes durch anderen Text. Die zu ersetzenden Teile können Sie entweder als Worte oder als reguläre Ausdrücke angeben. &ktts; wird mit vordefinierten Zeichenkettenersetzerfiltern ausgeliefert, die das Ersetzen von Chat-Emoticons wie ":-)" durch Text oder für die Umformatierung von Nachrichten aus &konversation; oder &kmail; in eine besser verständliche Form ermöglichen. &XML;-Umformer verwenden eine XSLT-Datei (&XML; Style Language - Transforms) um &XML; von einem Format in ein anderes Format umzuwandeln. Im Lieferumfang von &ktts; sind einige XSLT-Dateien zur Übersetzung von &XHTML; in SSML enthalten. Mit Sprecherauswahlfiltern können Sie Aufträge abhängig vom Inhalt des Textes oder abhängig von dem Programm, das den Text an &ktts; geschickt hat, an einen Sprecher schicken. Wenn Sie zum Beispiel auf der Karteikarte Sprecher eine weibliche Stimme eingestellt haben, können Sie Text von KDE-Nachrichten darüber vorlesen lassen. Siehe . Jeder dieser verschiedenen Filter hat einstellbare Regeln, nach denen er für eine Sprachausgabe angewendet wird. Wenn der Filter feststellt, dass seine Regeln nicht zutreffen, gibt er den Text unverändert an den nächsten Filter weiter. Wenn ein Textauftrag, eine Nachricht, eine Warnung oder eine &kde;-Nachricht an &ktts; geschickt wird, durchläuft der Text alle aktiven Filter, die auf der unten gezeigten Karteikarte eingerichtet wurden. Die Filter werden in der Reihenfolge von oben nach unten abgearbeitet. Danach gehen nur Textaufträge weiter zu den Satzgrenzenerkennungsfiltern (SBD), &kde;-Nachrichten jedoch nicht. Anders als bei normalen Filtern beendet der erste SBD-Filter, der den Text ändert, die weitere Bearbeitung durch andere Filter. Einrichtung der Filter Klicken Sie auf den Karteikartenreiter Filter in kttsmgr, um Filter einzurichten. Die Sprachausgabe-Verwaltung von &kde; (Karteikarte Filter) Die Sprachausgabe-Verwaltung &kde; (Karteikarte Filter) Dies zeigt die Liste der eingerichteten normalen Filter. Ist ein Filter nicht angekreuzt, ist er nicht aktiviert und wird nicht benutzt. Filter werden der Reihe nach von oben nach unten abgearbeitet. Klicken Sie hier, um einen neuen Filter einzufügen. Wählen Sie die Art des Filters aus, und es werden die weiter unten folgenden Einrichtungsdialoge angezeigt. Klicken Sie hier, um einen Filter zu entfernen. Um die Einstellungen für einen Filter zu ändern, klicken Sie hier. Es werden die weiter unten folgenden Einrichtungsdialoge angezeigt. Mit einem Klick auf diese Knöpfe können Sie einen Filter in der Liste nach oben oder unten verschieben. Hier sehen Sie die Satzgrenzenerkennungsfilter. Beim ersten Start von &ktts; wird als Vorgabe ein Satzgrenzenerkennungsfilter automatisch eingerichtet. Sie können dessen Einstellungen verändern oder weitere Satzgrenzenerkennungsfilter hinzufügen, Anfängern wird aber davon abgeraten. Mit diesem Knopf können Sie Satzgrenzenerkennungsfilter hinzufügen, entfernen, bearbeiten, oder ihre Reihenfolge ändern. Klicken Sie hier, sonst werden Ihre Einstellungen nicht übernommen. Einrichtung der Zeichenkettenersetzungsfilter Für die Einrichtung von Zeichenkettenersetzungsfiltern müssen Sie eine Liste von Worten oder regulären Ausdrücken als Vergleichsmuster eingeben. Werden diese Muster im Text gefunden, dann wird der Text gegen den zugehörigen Ersatztext ausgetauscht. Groß- und Kleinschreibung wird beim Vergleich nicht beachtet. Zeichenkettenersetzer Zeichenkettenersetzer Geben Sie für Ihren Filter einen Namen ein. Diesen Namen können Sie beliebig wählen, er muss sich nur von den Namen der anderen Filter unterscheiden. Dies ist die Liste der Worte und regulären Ausdrücke. Der Filter vergleicht den Text mit den Zeichenketten in der Spalte Übereinstimmung und ersetzt ihn bei Übereinstimmung mit der Zeichenkette aus der Spalte Ersetzen durch. Die Liste wird in der angezeigten Reihenfolge von oben nach unten abgearbeitet. Klicken Sie hier, um ein anderes Wort oder einen regulären Ausdruck in die Liste einzufügen. Klicken Sie hier, um das markierte Wort oder den regulären Ausdruck in der Liste zu verschieben. Klicken Sie hier, um ein vorhandenes Wort oder einen regulären Ausdruck in der Liste zu ändern. Klicken Sie hier, um das markierte Wort oder den regulären Ausdruck aus der Liste zu entfernen. Mit diesen Knöpfen können Sie eine Liste von Worten oder regulären Ausdrücken aus einer Datei laden, die aktuelle Liste speichern oder löschen. Laden Sie eine Liste aus einer Datei, werden die Einträge aus der Datei an die vorhandene Liste angehängt. Ist hier eine Sprache eingetragen, wird der Filter nur angewendet, wenn der Sprecher für den Textauftrag eine der hier eingetragenen Sprachen spricht. Klicken Sie auf den Knopf, um eine Liste der Sprachen anzeigen zu lassen. Sie können auch mehrere Sprachen auswählen, wenn Sie beim Mausklick die &Strg;-Taste gedrückt halten. Ist hier ein Wert eingetragen, wird der Filter nur angewendet, wenn der Text von einer der angegebenen Anwendungen kommt. Sie können mehrere Programme getrennt durch Kommata eingeben. Beispiel: konversation,kmail Die Anwendungs-ID laufender Programme erhalten Sie mit dem Programm &kdcop;. Die &DCOP;-Nummern müssen Sie weglassen. Wenn zum Beispiel &kdcop; die Anwendungs-ID kopete-3432 anzeigt, dürfen Sie nur kopete eingeben. Der Zeichenkettenersetzungsfilter wird nur dann auf den Text angewendet, wenn alle Bedingungen mit einem Eintrag im Kasten Diesen Filter anwenden bei übereinstimmen. Sind alle Eingabefelder leer, wird der Filter auf alle Texte angewendet. Alle Vergleiche beachten Groß- und Kleinschreibung. Beim Vergleich von Worten benutzt der Zeichenkettenersetzungsfilter reguläre Ausdrücke in der Form \sWort\s. Die Worte müssen also durch Trennzeichen (Leerzeichen) beidseitig begrenzt sein. In diesem Handbuch finden Sie keine Anleitung zum Schreiben von regulären Ausdrücken. Wenn Sie aber den &kde;-Editor für reguläre Ausdrücke installiert haben, können Sie ihn in den Dialogen Hinzufügen oder Bearbeiten als Hilfe zum Zusammenstellen dieser Ausdrücke aufrufen. Den &kde;-Editor für reguläre Ausdrücke finden Sie im Paket tdeutils. Im Lieferumfang von &ktts; sind einige Dateien mit Wortlisten enthalten; unter anderem eine Liste mit Emoticons wie ":-)", einige Abkürzungen für IRC oder Messaging-Programme und eine Liste mit weiteren Abkürzungen. Es gibt auch eine Liste mit Sonderzeichen, mit der die aktuelle Version der polnischen Festival-Stimme Probleme hat. Wenn Sie eigene Wortlisten erstellen, können Sie diese mit Speichern in eine Datei schreiben und an das &ktts;-Team schicken, das die Listen dann in die nächste Version aufnimmt. Einrichtung der &XML;-Umformer-Filter &XML;-Umformer übersetzen &XML; mit Hilfe von XSLT-Dateien aus einem Format in ein anderes Format. XSLT (&XML; Style Language - Transforms) ist ein W3C-Standard für solche Umformungen. Es kann aber nur auf wohlgeformtes XML angewendet werden. Das Hilfsprogramm xsltproc muss auf Ihrem System installiert sein. &XML;-Umformer &XML;-Umformer Geben Sie für Ihren Filter einen Namen ein. Diesen Namen können Sie beliebig wählen, er muss sich nur von den Namen der anderen Filter unterscheiden. Geben Sie den vollständigen Pfad zur XSLT-Datei für die Umwandlung ein. Geben Sie den Pfad für das Programm xsltproc ein. Wenn xsltproc über die Umgebungsvariable PATH erreichtbar ist, reicht auch xsltproc. Wenn hier ein Wert angegeben ist, wird der Filter nur auf &XML;-Dateien mit einer Spezifikation mit dem eingegebenen Text am Anfang angewendet. Zum Beispiel html im Eingabfeld DOCTYPE passt auf ]]>.. Ist hier ein Wert eingetragen, wird der Filter nur angewendet, wenn der Text von einer der angegebenen Anwendungen kommt. Sie können mehrere Programme getrennt durch Kommata eingeben. Beispiel: konversation,kmail Die Anwendungs-ID laufender Programme erhalten Sie mit dem Programm &kdcop;. Die &DCOP;-Nummern müssen Sie weglassen. Wenn zum Beispiel &kdcop; die Anwendungs-ID kopete-3432 anzeigt, dürfen Sie nur kopete eingeben. Der &XML;-Umformerfilter bearbeitet den Text nur dann, wenn das angegebene "root"-Element oder der DOCTYPE übereinstimmen und die Anwendungs-ID mit dem Eintrag in Diesen Filter anwenden, wenn übereinstimmt. Ist hier nichts eingetragen, wird die Prüfung nicht durchgeführt. Ist überhaupt kein Eintrag vorhanden, wird der Filter auf alle Texte angewendet. Sie sollten aber zumindest ein Eingabefeld ausfüllen, da die meisten Textaufträge nicht im &XML;-Format übermittelt werden. Einrichtung der Sprecherauswahlfilter Mit dem Sprecherauswahlfilter können Sie Texte an einen bestimmten Sprecher schicken, der auf der Karteikarte Sprecher eingerichtet ist, oder an einen Sprecher mit bestimmten Eigenschaften. Sie können zum Beispiel festlegen, dass Texte von kmail von einer weiblichen Stimme vorgelesen werden sollen. Siehe Bevor &ktts; einen Text an die Filter übergibt, sucht es einen Sprecher für den Text. Der Sprecher wird anhand der Sprecher-Eigenschaften, die das Programm vorgibt, das den Text an &ktts; schickt, und den Eigenschaften der auf der Karteikarte Sprecher eingerichteten Sprecher ausgewählt. Mit dem Sprecherauswahlfilter können Sie den gewählten Sprecher überschreiben. Sprecherauswahl Sprecherauswahl Geben Sie für Ihren Filter einen Namen ein. Diesen Namen können Sie beliebig wählen, er muss sich nur von den Namen der anderen Filter unterscheiden. Ist hier ein Wert eingetragen, wird der Filter angewendet, falls der Text den eingegebenen regulären Ausdruck enthält. Ist auf Ihrem System der &kde;-Editor für reguläre Ausdrücke installiert, können Sie diesen mit einem Klick auf den Knopf aufrufen, um Hilfe bei der Eingabe zu erhalten. Um eine schnellere Verarbeitung zu erzielen, sollten Sie versuchen, den regulären Ausdruck am Anfang der Zeichenkette zu "verankern", d. h., beginnen Sie den regulären Ausdruck mit . Ist hier ein Wert eingetragen, wird der Filter nur angewendet, wenn der Text von einer der angegebenen Anwendungen kommt. Sie können mehrere Programme getrennt durch Kommata eingeben. Beispiel: konversation,kmail Die Anwendungs-ID laufender Programme erhalten Sie mit dem Programm &kdcop;. Die &DCOP;-Nummern müssen Sie weglassen. Wenn zum Beispiel &kdcop; die Anwendungs-ID kopete-3432 anzeigt, dürfen Sie nur kopete eingeben. Legen Sie hier die Eigenschaften des von Ihnen gewünschten Sprechers fest. Wenn der Text die oben gezeigten Filterbedingungen erfüllt, wird der Sprecher ausgewählt, der den gewünschten Anforderungen am ehesten entspricht. Klicken Sie auf den Knopf rechts, um den Dialog Sprecherauswahl anzuzeigen. Siehe Verwenden Sie diese Knöpfe, um Ihre Sprechereinstellungen zu speichern oder zu laden oder alle Einstellungen zu löschen. Der Sprecherauswahlfilter wird nur dann auf den Text angewendet, wenn alle Bedingungen mit einem Eintrag im Kasten Diesen Filter anwenden bei zutreffen. Sie müssen mindestens eine Bedingung eintragen. Am einfachsten lernen Sie die Einrichtung der Sprecherauswahl durch Ausprobieren. Schalten Sie die Sprecherauswahl ab und geben Sie Text zum Vorlesen ein. Überprüfen Sie auf der Karteikarte Aufträge, welchen Sprecher &ktts; auswählt. Schalten Sie die Sprecherauswahl wieder ein, ändern Sie einige Eigenschaften und prüfen Sie, wie sich die Auswahl des Sprechers verändert. Dazu müssen Sie natürlich mehr als einen Sprecher eingerichtet haben, sonst ist der Filter unwirksam. Einrichtung der Satzgrenzenerkennungsfilter Satzgrenzenerkennungsfilter (SBD) unterteilen Text in einzelne Sätze. Das ist wichtig, weil &ktts; dann schneller mit dem Vorlesen beginnen kann, da nur der erste Satz verarbeitet werden muss und nicht der ganze Textblock, was sehr lange dauern kann, Sie dann Texte mit auf der Karteikarte Aufträge satzweise vor- und zurückspulen können Sie Textaufträge dann auf der Karteikarte Aufträge anhalten oder abbrechen können, auch wenn der Sprachsynthesizer diese Funktion nicht unterstützt. Aus diesen Gründen wird der normale Satzgrenzenerkennungsfilter automatisch eingerichtet, wenn Sie kttsmgr zum ersten Mal starten. Er kann nicht abgeschaltet, nur entfernt werden. Ändern Sie nichts an diesem Filter, es sei denn, Sie wissen, was Sie tun. Sie können aber zusätzliche SBD-Filter hinzufügen, um bestimmte Probleme zu lösen. Die polnische Festival-Stimme vom Februar 2005 hat zum Beispiel die lästige Eigenschaft, auch Satzzeichen wie den Punkt am Ende eines Satzes vorzulesen. Dieses Problem können Sie nicht mit einem Zeichenkettenersetzungsfilter zum Löschen der Punkte beheben, da dann der normale SBD-Filter keine Sätze mehr erkennt. Verwenden Sie statt dessen eine geänderte Version des normalen SBD-Filter, die gleichzeitig Satzgrenzen erkennt und entfernt. Dazu fügen Sie einen zusätzlichen SBD-Filter ein und klicken auf Laden, um die mitgelieferte Datei polish_festival_sbdrc zu laden. Satzgrenzenerkennungsfilter vergleichen Text mit einem regulären Ausdruck für Satzenden und fügen ein Tabulatorzeichen (Dezimalkode 8) an den Satzgrenzen ein (Tabulatorzeichen werden vor dem Filtern automatisch aus dem Text entfernt). Beachten Sie, dass der Standard-Satzgrenzenerkennungsfilter die Zeichensetzung beibehält. SBD-Filter werden nie auf &kde;-Nachrichten (knotify), Warnungen, Nachrichten oder die Ausgabe von Screen-Readern angewendet. Wenn Sie aus Versehen den normalen Satzgrenzenerkennungsfilter entfernt haben, können Sie diesen wieder einfügen, indem Sie die in &ktts; enthaltene Datei standard_sbdrc laden. Sprecherauswahl (Erweitert) Auf der Karteikarte Sprecher können Sie eine beliebige Anzahl Sprecher einrichten. Siehe . Sendet eine Anwendung Text an &ktts;, kann Sie auch die gewünschten Eigenschaften des Sprechers übergeben. &ktts; wählt aus den eingerichteten Sprechern den passendsten aus, um den Wünschen der Anwendung zu entsprechen. So kann eine Anwendung beispielsweise für den Text eine weibliche englische Stimme anfordern. Ist ein englischer Sprecher mit weiblicher Stimme eingerichtet, wird dieser verwendet. Sind nur männliche Sprecher für die englische Sprache installiert, wird einer von diesen ausgewählt. Übermittelt die Anwendung keine gewünschten Eigenschaften, wird der Sprecher ausgewählt, der an erster Stelle in der Liste auf der Karteikarte Sprecher angezeigt wird. Wenn eine Anwendung die Eigenschaften des gewünschten Sprechers festlegt, kann sie bestimmte Eigenschaften als "vorrangig" markieren. So kann eine Anwendung festlegen, dass eine laute weibliche Stimme gewünscht wird und dabei der Eigenschaft "laut" den Vorrang vor der Eigenschaft "weiblich" geben. Ist eine leise weibliche Stimme und eine laute männliche Stimme eingerichtet, wählt &ktts; die laute männliche Stimme aus. Da die Eigenschaft "Sprache" ein kritischer Parameter bei der Verständlichkeit der ausgegebenen Texte ist, gilt diese immer als "vorrangige" Eigenschaft. Auf der Karteikarte Sprecherauswahl können Sie die Sprechereinstellungen für die Anwendung überschreiben. Die Karteikarte wird angezeigt, wenn Sie den Knopf Sprecher wechseln auf der Karteikarte Aufträge klicken Sie den Knopf Sprecher im Dialog Filtereinrichtung für einen Sprachauswahlfilter anklicken Sie den Knopf Sprecher auf der Karteikarte Benachrichtigungen klicken. Sprecherauswahl Sprecherauswahl Die Karteikarte bietet drei Möglichkeiten zum Festlegen der gewünschten Sprechereigenschaften: Verwendung des Standardsprechers (der oberste auf der Karteikarte Sprecher). Mit anderen Worten: Es werden keine Sprechereigenschaften festgelegt. Verwendung des Sprechers, dessen Eigenschaften am ehesten den angegebenen entsprechen. Verwendung des passendsten Sprechers, der alle Eigenschaften eines eingerichteten Sprechers aufweist. Wenn Sie die Einstellungen des Sprechers nicht löschen oder bearbeiten, wählt &ktts; diesen Sprecher aus. Andernfalls wählt &ktts; den Sprecher aus, der am ehesten den ursprünglich eingestellten Eigenschaften entspricht. Wählen Sie die Methode zur Eingabe der gewünschten Sprechereigenschaften, indem Sie auf einen der Auswahlknöpfe klicken. Wählen Sie hier die Eigenschaften des gewünschten Sprechers aus. Wenn diese Eigenschaft keine Rolle spielt, geben Sie nichts ein. Markieren Sie dieses Ankreuzfeld, wenn die Eigenschaft "Vorrang" vor anderen Eigenschaften haben soll. Sie können hier auch mehrere Markierungen setzen. Da die Sprache ein kritischer Faktor beim Verstehen der Ausgabe ist, wird diese immer als vorrangige Eigenschaft behandelt. Sie werden diese Eigenschaft selten verwenden. Der einzige Fall, bei dem Sie möglicherweise das Attribut Sprache angeben wollen, liegt vor, wenn Sie wissen, dass eine bestimmte Anwendung Text in einer anderen Sprache als der in der Arbeitsumgebung eingestellten versendet. Dies ist eine Liste der Sprecher, die in &ktts; eingerichtet sind. Wenn Sie einen davon auswählen, übernehmen Sie im Prinzip die Eigenschaften dieses Sprechers. Ist dieser Sprecher immer noch eingerichtet, wenn ein Text übergeben wird, kommt es zu einer vollständigen Übereinstimmung und dieser Sprecher wird ausgewählt. Wenn Sie diesen Sprecher später löschen oder seine Einstellungen ändern, kann es sein, dass er nicht mehr ausgewählt wird. Es wird immer der Sprecher ausgewählt, der den ursprünglich festgelegten Eigenschaften am ehesten entspricht. Die Eigenschaft Sprache verdient besondere Aufmerksamkeit, weil Text, wenn er von einem Sprecher vorgelesen wird, dessen Sprache von der Sprache des Textes abweicht, wahrscheinlich unverständlich ist. Daher ist Sprache immer eine bevorzugte Eigenschaft. Wenn Sie eine Sprache vorgeben, wird die voreingestellte Sprache überschrieben, ansonsten wird die in &ktts; gewählte Sprache benutzt. Wenn eine Anwendung, die Text an &ktts; schickt, keine Sprache vorgibt, wählt &ktts; die Sprache des ersten Sprechers in der Liste auf der Karteikarte Sprecher. Mit anderen Worten: es wird angenommen, dass der oberste Sprecher in der Liste die Sprache Ihrer Arbeitsumgebung spricht. Um alle Eigenschaften im Bereich Sprecher verwenden, der am ehesten dem Folgenden entspricht zu löschen, klicken Sie auf den Auswahlknopf Standardsprecher verwenden und dann auf Sprecher verwenden, der am ehesten dem Folgenden entspricht. Befehlsreferenz Muss noch geschrieben werden Entwicklerhandbuch für &ktts; &ktts; bietet zwei Schnittstellen für Anwendungsprogrammierer (APIs): Die Sprachausgabe-API, von &kde;, mit der Programmierer ihren Anwendungen TTS-Fähigkeiten verleihen können. Anwendungen kommunizieren mit KTTSD über &DCOP;. Die KTTSD-Modul-API, mit der Sprachsynthesizer zu KTTSD hinzugefügt werden, sodass &ktts; diese Synthesizer benutzen kann. Der folgende Abschnitt enthält eine kurze Beschreibung der &kde;-Schnittstelle der Sprachausgabe-API von &kde;. Die vollständige Dokumentation für beide APIs finden Sie auf der &kde; Accessibility Webseite (http://accessibility.kde.org). Die &DCOP;-Schnittstelle von &ktts; Anwendungen fordern Sprachausgabedienste über die &DCOP;-Schnittstelle von &kde; vom Programm kttsd über das Objekt KSpeech an. Geben Sie die folgende Befehle in einer &konsole; ein: Wenn KTTSD noch nicht gestartet wurde kttsd Um einen Textauftrag in die Warteschlange zu stellen dcop kttsd KSpeech setText "Text" "Sprecher" dabei ist Text der Text zum Vorlesen und Sprecher ein Sprachcode wie z. B. en, de &etc; Dieser Befehl liest den Text nicht direkt vor, sondern stellt ihn als Textauftrag in die Warteschlange. Beispiel: dcop kttsd KSpeech setText "Dies ist ein Test." "de" Um den letzten Textauftrag aus der Warteschlange vorzulesen dcop kttsd KSpeech startText 0 In diesem Fall steht 0 für den letzten Textauftrag in der Warteschlange. Sie können auch eine Auftragsnummer angeben. (Ohne Auftragsnummer ist die Eingabe 0 erforderlich). Um den gerade gesprochenen Textauftrag anzuhalten dcop kttsd KSpeech stopText 0 Es hängt vom benutzten Sprachmodul ab, ob die Ausgabe sofort anhält. Es gibt noch mehr Befehle, die Sie einsetzen können. Für eine Liste aller Befehle geben Sie dcop kttsd KSpeech ein oder lesen Sie die &kde; Sprachausgabe-API. Fragen und Antworten &reporting.bugs; &updating.documentation; kttsmgr stürzt sofort ab, wenn es gestartet wird. Ich habe Debug-Unterstützung einkompiliert, aber ich bekomme keine Rückverfolgung. GStreamer ist abgestürzt und &ktts; wurde dabei beendet. Wahrscheinlich müssen Sie GStreamer noch "registrieren". Bei GStreamer 0.8.x lautet der Befehl gst-register-0.8. Wenn das Problem dadurch nicht gelöst ist, ist möglicherweise eine nicht kompatible Version von GStreamer installiert. Sie können versuchen GStreamer zu aktualisieren oder zu deinstallieren. Die Audioausgabe über ALSA funktioniert nicht, wenn ich gleichzeitig mit einer anderen Anwendung Musik abspiele. Wenn ich einen Textauftrag anhalte, friert &ktts; ein. Auf der &konsole; erscheint eine Meldung, die besagt: "unable to open PCM". Auf Ihrem System besteht das Problem, dass Konflikte bei ALSA auftreten, die die ein gleichzeitiges Öffnen mehrerer PCM-Geräte verhindern. Hinweise für mögliche Lösungen finden Sie auf der Webseite des ALSA-Projektes (dmix) unter www.alsa-project.org. Ich muss noch einmal von vorne anfangen. Wie kann ich &ktts; vollständig beenden? Geben Sie die folgenden Befehle in einer &konsole; ein: killall kttsd killall kttsmgr Wie kann ich die Fehlerausgabe von kttsd sehen? Öffnen Sie zwei &konsole;-Fenster. Starten Sie erst kttsd im einen Fenster, dann kttsmgr im anderen. Ich habe eine zusätzliche Stimme für Festival aus dem Internet geladen. Ich habe sie installiert und kann sie in Festival benutzen, aber kttsmgr zeigt diese Stimme nicht an. Fügen Sie in der Datei $TDEHOME/share/apps/kttsd/festivalint/voices die neue Stimme hinzu. Als Anleitung können Ihnen dabei die anderen Einträge dienen. Wenn das erfolgreich ist, schicken Sie bitte einen Patch zusammen mit der &URL;, auf der Sie die Stimme gefunden haben, an die Entwickler. Keiner der genannten Sprachsynthesizer unterstützt meine Sprache. Wo kann ich einen Synthesizer für meine Sprache bekommen? Suchen Sie bei Google(tm). Diese Verknüpfung könnte auch hilfreich sein. Wenn Sie einen freien Synthesizer für Ihre Wunschsprache finden und dafür Unterstützung zu &ktts; hinzufügen wollen, setzen Sie sich mit den Entwicklern in Verbindung. Quelloffene Synthesizer werden besonders gesucht. Wenn Sie einen kommerziellen Synthesizer kennen, können Sie versuchen, den Hersteller dazu zu überreden, den Entwicklern eine freie Kopie zu überlassen. Bis dahin können Sie versuchen, den Synthesizer mit dem Befehlmodul zu benutzen. Siehe . &ktts; liest zu langsam vor. Wie kann ich die Geschwindigkeit erhöhen? Auf der Karteikarte Audio gibt es eine Einstellung Geschwindigkeit. Damit dies funktioniert, muss das Programm sox installiert und über die Umgebungsvariable PATH auffindbar sein. Einige Synthesizermoduls wie Festival Interactive bieten selbst auf der Karteikarte für Sprechereinrichtung eine Einstellung für Geschwindigkeit an. Abhängig von der gewählten Stimme ist diese aktiv oder inaktiv. Das funktioniert bei einigen Sachen, aber Webseiten werden immer noch zu langsam vorgelesen. Die Einstellungen für die Sprechgeschwindigkeit werden ignoriert, wenn &ktts; &HTML; vorliest. (Das liegt daran, dass das HTML in SSML umgewandelt wird. SSML verfügt über eigene Tags, mit denen die Geschwindigkeit gesteuert wird.) Deaktivieren Sie entweder den Filter für die Umwandlung von &HTML; nach &XML; (siehe ) oder, wenn Sie ganz mutig sind, ändern Sie die .xsl-Datei des &HTML;-nach-SSML-Umformerfilters, und setzen Sie die Sprechgeschwindigkeit herauf. Ich schaffe es nicht, dass Webseiten mit einer weiblichen Stimme vorgelesen werden. Ich habe einen weiblichen Festival-Sprecher eingerichtet, aber &ktts; liest die Webseiten mit einer männlichen Stimme vor. Bei Festival 1.95 beta scheint das Tag SABLE GENDER nicht zu funktionieren. Damit Festival keine Fehler produziert, verwirft die xsl-Datei zum Umwandeln von SSML nach SABER die GENDER-Tags. Das Gleiche gilt auch für die VOICE-Tags. Ich habe den &HTML;-&XML;-Umformerfilter eingerichtet, aber bei Verwendung des Moduls für Festival werden Webseiten nicht vorgelesen. Bedingt durch einen Fehler in Festival 1.95 beta müssen Sie die (männliche britische) Stimme rab_diphone installieren, damit SABLE überhaupt funktioniert. Das müssen Sie selbst dann tun, wenn Sie diese Stimme nicht zum Vorlesen von Webseiten benutzen. Stellen Sie außerdem sicher, dass das Programm xsltproc installiert und über die Umgebungsvariable PATH zu finden ist. Bestimmte Zeichen oder Interpunktionszeichen scheinen Fehler beim Synthesizer zu verursachen, sodass ganze Sätze übersprungen oder nur Kauderwelsch ausgegeben wird. Was kann ich dagegen tun? Stellen Sie zunächst sicher, dass die Option Zeichenkodierung auf den richtigen Wert für die entsprechende Sprache eingestellt ist. Gibt es Probleme mit bestimmten Zeichen oder Wörtern, können diese möglicherweise durch einen Zeichenkettenersetzungsfilter behoben werden. Verwirren bestimmte Interpunktionszeichen den Synthesizer, müssen Sie einen Satzgrenzenerkennungsfilter einrichten. Siehe . Ich habe einen eigenen Zeichenkettenersetzungsfilter hinzugefügt und nun kann ich in &ktts; nicht mehr satzweise vor- oder zurückgehen. Auf dem Karteireiter Aufträge wird angezeigt, der Auftrag bestehe nur aus einem Satz. Was mache ich falsch? Interpunktionszeichen (Punkt, Fragezeichen, Ausrufezeichen, Komma und Semikolon) dürfen Sie nicht ausfiltern. Benutzen Sie für diese Zeichen stattdessen einen Filter zur Satzgrenzenerkennung. Danksagungen und Lizenz &ktts; Programm Copyright © 2002 José Pablo Ezequiel "Pupeno" Fernández pupeno@kde.org Aktueller Betreuer: Gary Cramblitt garycramblitt@comcast.net Mitwirkende: Olaf Schmidt ojschmidt@kde.org Gunnar Schmi Dt gunnar@schmi-dt.de Paul Giannaros ceruleanblaze@gmail.com Copyright der Dokumentation © 2004 Gary R. Cramblitt garycramblitt@comcast.net Übersetzung Burkhard Lücklueck@hube-lueck.de &underFDL; &underGPL; Die Sprachsynthesizer, die von &ktts; genutzt werden, haben ihre eigene Lizenz, die Sie in der zugehörigen Dokumentation oder auf den betreffenden Webseiten finden. Es gibt auch Stimmen, die eine eigene Lizenz besitzen. Installation Woher Sie &ktts; bekommen &install.intro.documentation; (In Zukunft) Debian Installationsbefehl: apt-get install tdeaccessibility Sie finden Quelltexte und übersetzte Pakete auf der &kde; Accessibility Webseite (http://accessibility.kde.org). Wenn Sie Zugriff auf das KDE Quellcodearchiv haben, können Sie das Paket tdeaccessibility mit &ktts; daraus herunterladen. &ktts; finden Sie im Ordner kttsd. Außerdem finden Sie den Quellcode von tdeaccessibility unter ftp://ftp.kde.org/pub/kde/. Voraussetzungen Unbedingt erforderlich: &kde; Version 3.2 oder neuer. Ein Sprachsynthesizer. Die folgenden Synthesizer und Sprachen werden zur Zeit unterstützt. Festival Amerikanisches Englisch, Britisch, Spanisch, Deutsch, Finnisch, Tschechisch, Polnisch, Russisch, Italienisch, Französisch, Kanadisches Französisch, Kiswahili, Zulu und Ibibio. Festival Lite (flite) Englisch Hadifix (&mbrola; und txt2pho) Deutsch, Ungarisch Epos Tschechisch, Slowakisch FreeTTS Englisch KTTS arbeitet mit auch mit jedem Sprachsynthesizer, der auf der Befehlszeile in einer &konsole; gestartet werden kann. Die Liste der oben genannten Sprachen kann unvollständig oder veraltet sein. Ziehen Sie daher die Beschreibung der Synthesizer zu den unterstützten Sprachen zu Rate. Schauen Sie auch auf der Webseite von &ktts;, nach Informationen, die noch nicht in diesem Handbuch enthalten sind. &ktts; benutzt eine anpassungsfähige Modul-Architektur für Sprachsynthesizer. Wenn Sie &ktts; für die Nutzung eines anderen Synthesizers erweitern möchten, setzen Sie sich mit dem Entwicklerteam in Verbindung. Spezielle Anleitungen zu den verschiedenen Sprachsynthesizern finden Sie in . Zumindest eines der folgenden Audiosysteme: &kde; &arts;-Soundsystem. &arts; wird normalerweise zusammen mit &kde; installiert. ALSA (Advanced &Linux; Sound Architecture). ALSA ist auf den meisten Systemen mit &Linux; bereits installiert. (www.alsa-project.org) GStreamer in der Version 0.8.7 oder neuer. Beachten Sie: Vergewissern Sie sich, dass die Module für GStreamer registriert sind, indem Sie vor der Verwendung von GStreamer in &ktts; den Befehl gst-register aufrufen. (http://gstreamer.freedesktop.org) aKode-Bibliothek. aKode ist eine Dekoderbibliothek, die zu &kde; gehört. Das &kde;-Projekt wird die Unterstützung von &arts; wahrscheinlich mit der Version 4 von &kde; einstellen. Einige Anwender erleben in Zusammenhang mit ALSA Konflikte bei der Audioausgabe. Wenn Ihr System auch dazu zählt, können Sie nicht gleichzeitig Musik abspielen und einen Text vorlesen lassen. &ktts; friert zudem ein, wenn Sie einen Textauftrag anhalten und dann einen weiteren starten. Mögliche Lösungen für dieses Problem finden Sie auf der Webseite von ALSA (dmix). Mit Stand Juli 2005 unterstützt aKode noch keine echten Pausen. Wenn Sie einen Textauftrag in &ktts; anhalten, wird der aktuelle Satz noch zuende vorgelesen. Zusätzliche Komponenten: Das Audio-Programm sox wird für die allgemeine Einstellung der Sprechgeschwindigkeit benutzt, ist aber sonst nicht zwingend notwendig. Debian-Nutzer können sox mit dem Befehl apt-get install sox installieren. Das Programm ist auf den meisten &Linux;-CDs bereits enthalten. Das Programm xsltproc wird für die Unterstützung von SSML und für den &XML;-Umwandlungsfilter benutzt, ist aber nicht zwingend notwendig. Debian-Nutzer können xsltproc mit dem Befehl apt-get install xsltproc installieren. Kompilierung und Installation Um &ktts; zu kompilieren, brauchen Sie eine aktuelle Entwicklungsumgebung von KDE (Version 3.4 oder neuer) einschließlich der Pakete tdelibs und arts. Haben Sie &ktts; als tarball (mit tar gepacktes Archiv) heruntergeladen, melden Sie sich als normaler Nutzer an und entpacken den tarball in einen passenden Ordner. Wechseln Sie in diesen Ordner und geben Sie die folgenden Befehle ein: ./configure make Die folgenden Optionen für configure sind verfügbar: Standardoption Beschreibung Alternative --with-arts Erstellt das Audiomodul für arts. --without-arts --with-alsa=check Erstellt das Audiomodul für ALSA. --with-alsa=no --with-gstreamer=no Übergeht das Erstellen des Audiomodul für GStreamer. --with-gstreamer=check --with-akode=no Übergeht das Erstellen des Audiomoduls für aKode. --with-akode=check In &kde; 4 wird das Modul &arts; wahrscheinlich entfernt oder zumindest nur noch auf Anforderung erstellt. Die folgenden Module für Sprachsynthesizer werden standardmäßig erstellt. Einige davon besitzen eine Laufzeitabhängigkeit von nicht-freier Software. (Nicht-frei nach den Richtlinien der Debian-Distribution). Die Spalte "configure-Option zum Abschalten des Erstellens" zeigt den configure-Parameter an, der das Übergehen des Erstellens bewirkt. Synth Lizenz configure-Option zum Abschalten des Erstellens Festivalfree--disable-kttsd-festivalint Festival Litefree--disable-kttsd-flite Eposfree--disable-kttsd-epos Befehlfree--disable-kttsd-command Hadifixnicht-frei--disable-kttsd-hadifix FreeTTSnicht-frei--disable-kttsd-freetts Als Voreinstellung wird &ktts; in /opt/kde3 installiert. Ist dieser Ordner nicht in der Umgebungsvariable $TDEDIRS aufgeführt, müssen Sie als Option --prefix=Ziel angeben. Zum Beispiel ./configure --prefix=/usr/local make Auf Debian-Systemen ist /usr/local der richtige Ordner für Programme, die aus den Quellen übersetzt werden. Melden Sie sich als root an und installieren Sie den übersetzten kttsd; mit den folgenden Befehlen: su make install Wenn Sie die Quelltexte von &ktts; aus dem Quelltextarchiv für tdeaccessibility beziehen oder den jede Nacht aktuell erstellten Tarball heruntergeladen haben, übersetzen und installieren Sie das Programm mit folgenden Befehlen: cd tdeaccessibility echo kttsd>inst-apps make -f Makefile.cvs ./configure cd kttsd make su make install Einrichtung Bevor Sie &ktts; benutzen, überprüfen Sie zuerst, ob Ihr Sprachsynthesizer richtig arbeitet. Folgen Sie den Anweisungen, die Sie mit dem Synthesizer erhalten haben. In einigen Fällen benötigen Sie Schreibzugriffsrechte auf das Audiogerät. chmod a+rw /dev/dsp* Arbeiten mit Festival (Interactive) Festival ist einer der besten freien TTS-Synthesizer, dessen Quellcode offengelegt ist. Die Qualität der Stimmen ist im Allgemeinen gut, und es werden mehrere Stimmen und Sprachen unterstützt. Bei vielen Stimmen können Sie Lautstärke, Sprechgeschwindigkeit und Tonhöhe mit &ktts; einstellen. Sprachsynthesizer: Festival Interactive &URL;: http://www.cstr.ed.ac.uk/projects/festival/ Debian Installationsbefehl: apt-get install festival Sie müssen mindestens eine Sprache installieren. Hilfe dazu finden Sie in den Anleitungen, die mit Festival geliefert werden. Möchten Sie Webseiten vorlesen lassen, müssen Sie die (männliche britische) Stimme rab_diphone installieren. Zusätzliche englische Festival Stimmen finden Sie unter http://hts.ics.nitech.ac.jp/. Zusätzliche spanische, englische und deutsche Stimmen finden Sie unter http://cslu.cse.ogi.edu/tts/download/ Für diese Stimmen müssen Sie ein zusätzliches Modul kompilieren, daher brauchen Sie den Quellcode von Festival. Die deutschen Stimmen unterliegen Einschränkungen bei der Weitergabe. Eine männliche finnische Stimme finden Sie unter http://www.ling.helsinki.fi/suopuhe/download/. Eine männliche polnische Stimme finden Sie unter http://www.artegence.com/download/voicexml/speech/festival_polish_voice.tgz. Eine männliche russische Stimme finden Sie unter http://nshmyrev.narod.ru/festival/festival.html Diese Stimme setzt Festival 1.95 beta oder neuer voraus. Die Stimme ist immer noch in einem frühen Entwicklungsstadium. Entpacken Sie die Software in festival/lib/voices/russian/. Wenn Sie die russischen Stimmen einrichten, müssen Sie für die Stimmen msu_ru_nsh_diphone eingeben. Wählen Sie eine kyrillische (8-Bit-)Kodierung wie zum Beispiel KOI8-R. Italienische Stimmen für Festival 1.95 beta sind hier verfügbar: http://www.csrf.pd.cnr.it/TTS/It-FESTIVAL-download.htm. Wenn Sie beim Auspacken CRC-Fehler bekommen, versuchen Sie das Herunterladen erneut. Swahili-, Zulu- und Ibibio-Stimmen für Festival 1.95 beta sind hier verfügbar: http://www.llsti.org/. Unglücklicherweise funktioniert die dort ebenso verfügbare Hindi-Stimme nicht mit &ktts;. Kommerziell vertriebene Stimmen, darunter eine Stimme für kanadisches Französisch, können bei Cepstral, LLC erworben werden. Die Adresse lautet: http://www.cepstral.com/ Die FAQ auf der Supportseite enthält Informationen darüber, wie die angebotenen Stimmen in Festival eingebunden werden. Festival ist normalerweise in den &Linux;-Distributionen enthalten. Suchen Sie Festival daher als erstes auf den CDs Ihrer Distribution. Wenn Sie die polnischen, ungarischen oder tschechischen Sprachen benutzen wollen, muss die Option Kodierung auf ISO 8859-2 eingestellt werden. Wenn Sie die russische Stimme benutzen wollen, muss die Option Kodierung auf ein 8-Bit-Kyrillisch wie zum Beispiel KOI8-R eingestellt werden. Arbeiten mit Festival und &mbrola; Festival kann gemeinsam mit dem &mbrola;-Synthesizer eingesetzt werden. Dann übernimmt Festival die lexikalische Analyse und &mbrola; erzeugt daraus die Audioausgabe. Das &mbrola;-Programm und die &mbrola;-Stimmen können heruntergeladen werden von http://festvox.org/mbrola/. Beachten Sie die mitgelieferten Anweisungen in der Datei readme.txt Beachten Sie, dass &mbrola; kein vollständiges Sprachausgabesystem ist. &mbrola; generiert Sprache aus Diphon-Dateien. Sie brauchen zusätzliche Software, um diese Diphone zu erstellen. Festival erzeugt diese von &mbrola; benötigten Diphone. txt2pho kann auch aus deutschen Texten Diphone erzeugen. Weitere Informationen finden Sie unter . Es gibt drei Möglichkeiten, Festival zusammen mit &mbrola; zu benutzen. &mbrola; Wrapper. Zur Zeit arbeitet dieses Verfahren nur mit englischen Stimmen. IMS German Festival. Festival-Czech. Arbeiten mit Festival und &mbrola;-Wrappern Bei diesem Verfahren wird zusätzlicher Wrapper-Code zu Festival hinzugefügt, um &mbrola;-Stimmen zur Sprachsynthese zu benutzen. Beachten Sie, dass die &mbrola;-Stimmendateien nicht im &mbrola;-Ordner installiert werden, sondern im Ordner festival/lib/. Anleitungen finden Sie unter http://www.cstr.ed.ac.uk/projects/festival/mbrola.html Arbeiten mit IMS German Festival IMS German Festival ist eine veränderte Version von Festival für deutsche &mbrola;-Stimmen. Erforderlich ist entweder Festival Version 1.4.1 oder Festival 2.0 (1.95beta). Zuerst installieren Sie Festival und &mbrola;, dann laden Sie MS German Festival von http://www.ims.uni-stuttgart.de/phonetik/synthesis/festival_opensource.html. Anweisungen finden Sie in der Datei README im Paket, das Sie heruntergeladen haben. (Für die Verwendung mit Festival 2.0 ist das Einspielen der Fehlerkorrekturen nicht erforderlich, Sie müssen nur Festival neu übersetzen). Fügen Sie dann folgende Zeilen in die Datei festival/lib/siteinit.scm ein. (voice-location "german_de1_os" "/usr/local/mbrola/de1" "German Female, IMS Festival de1") (voice-location "german_de2_os" "/usr/local/mbrola/de2" "German Male, IMS Festival de2") (voice-location "german_de3_os" "/usr/local/mbrola/de3" "German Female, IMS Festival de3") direkt über der Zeile (provide 'siteinit) Auf einigen Systemen müssen Sie die Datei /etc/festival.scm bearbeiten. Fügen Sie nur die Zeilen für Ihre installierten deutschen Stimmen ein. Ersetzen Sie den richtigen Pfad in /usr/local/mbrola/. Zur Zeit der Erstellung dieses Handbuchs funktionieren die deutschen de4, de5, oder de6 Stimmen nicht mit IMS German Festival . Arbeiten mit Festival-Czech Dieses Verfahren benutzt besonderen Code, um die Sprache über Festival mit einer tschechischen &mbrola;-Stimme auszugeben. Besorgen und installieren Sie sich zunächst Festival und &mbrola; und sorgen Sie dafür, dass beide funktionieren. Dann laden Sie Festival-Czech von http://www.freebsoft.org/festival-czech Ersetzen Sie in den folgenden Anweisungen die Ordner durch die entsprechenden Ordner auf Ihrem System. Entpacken Sie das Programm mit tar in einen passenden Ordner und erzeugen Sie das Lexikon. Die ausführbare Datei Festival muss in Ihrem PATH liegen. cd /usr/local tar xvfz festival-czech.tar.gz cd festival-czech make Laden Sie die Stimmendatei cz2 von der &mbrola;-Seite und entpacken sie mit unzip in den &mbrola;-Ordner. cd /usr/local/mbrola mkdir cz2 cd cz2 unzip cz2-001009.zip Schreiben Sie die folgenden Zeile in die Datei festival/lib/siteinit.scm. (set! czech-lexicon-file "/usr/local/festival-czech/czech-lexicon.out") (set! load-path (cons "/usr/local/festival-czech" load-path)) (require 'czech) (set! czech-mbrola_database "/usr/local/mbrola/cz2/cz2") (set! mbrola_progname "/usr/local/mbrola/mbrola") (voice-location "czech_mbrola_cz2" "/usr/local/mbrola/cz2" "Czech Male, MBROLA") (require 'czech-mbrola) direkt über der Zeile (provide 'siteinit) (Auf manchen Systemen finden Sie diese Datei unter /etc/festival.scm). Arbeiten mit Festival Lite (flite) Festival Lite ist ein freier, quelloffener Sprachsynthesizer, der zur Zeit nur eine begrenzte Anzahl von Stimmen und Sprachen unterstützt. Er ist ein einfacher Sprachsynthesizer mit noch ausreichender Stimmenqualität. Mit &ktts; können Sie bei diesem Sprachsynthesizer weder Tonhöhe, Lautstärke noch Sprechgeschwindigkeit einstellen. Sprachsynthesizer: Festival Lite (flite) &URL;: http://www.speech.cs.cmu.edu/flite/index.html Debian Installationsbefehl: apt-get install flite flite ist normalerweise in den &Linux;-Distributionen enthalten. Suchen Sie flite daher als erstes auf den CDs Ihrer Distribution. Kompilieren und installieren Sie flite mit Hilfe der Anweisungen in der mitgelieferten Datei README. Arbeiten mit Hadifix (&mbrola; und txt2pho) Hadifix ist ein zweistufiger Sprachsynthesizer, der mit Diphonen arbeitet. Das Programm txt2pho übersetzt Text in Diphone und der &mbrola;-Sprachsynthesizer erzeugt daraus den Klang. Die Sprachqualität ist gut, aber die Unterstützung ist zur Zeit auf wenige Sprachen begrenzt. Sie können Stimme, Tonhöhe, Sprechgeschwindigkeit und Lautstärke über kttsmgr einstellen. Sprachsynthesizer: Hadifix &URL;: siehe unten Debian Installationsbefehl: Keiner Installieren Sie zuerst Hadifix. Laden Sie die ausführbare Datei &mbrola; von http://festvox.org/mbrola/. Installieren Sie &mbrola; im Ordner /usr/local/mbrola. Laden Sie mindestens eine deutsche Sprachdatei von der &mbrola;-Seite und entpacken sie mit unzip in den Ordner /usr/local/mbrola. txt2pho finden Sie unter http://www.ikp.uni-bonn.de/dt/forsch/phonetik/hadifix/HADIFIXforMBROLA.html. Entpacken Sie txt2pho mit unzip nach /usr/local/txt2pho. Bearbeiten Sie die Datei txt2phorc und geben die richtigen Pfade ein. Kopieren Sie entweder txt2phorc nach ~/.txt2phorc oder nach /etc/txt2pho, hier muss das "rc" am Ende des Dateinamens entfernt werden. Wählen Sie in kttsmgr die Sprache Deutsch (de), und fügen Hadifix hinzu. Auf der Karteikarte Einrichtung Sprecherauswahl wählen Sie eine Stimme und stellen die Pfade zu &mbrola; und txt2pho richtig ein. Klicken Sie auf Test, um die Einstellungen zu überprüfen. Eine ungarische Implementierung von &mbrola; und txt2pho finden Sie auf http://tkltrans.sourceforge.net/. Arbeiten mit Epos Epos ist ein freier, quelloffener Sprachsynthesizer für die tschechische und slowakische Sprache. Er ist ein einfacher Sprachsynthesizer mit noch ausreichender Stimmenqualität. Mit &ktts; können Sie bei diesem Sprachsynthesizer nur die Lautstärke einstellen. Sprachsynthesizer: Epos TTS Synthesis System &URL;: http://epos.ure.cas.cz/ Debian Installationsbefehl: apt-get install epos Starten Sie kttmsgr. Auf der Karteikarte Sprecher klicken Sie auf Hinzufügen. Wählen Sie die tschechische oder slowakische Sprache und Epos TTS-Sprachsynthesizer. Wenn die Epos-Programme nicht in Ihrem PATH stehen, geben Sie den Pfad zu den Programmen auf der Karteikarte Sprecher ein. In den Eingabefeldern können Sie zusätzliche Parameter für die Programme eingeben. Geben Sie in einer &konsole; epos -h oder say -h, um weitere Informationen zu erhalten. Arbeiten mit FreeTTS FreeTTS ist ein freier, quelloffener Sprachsynthesizer, der in &Java; geschrieben wurde, d. h. Sie müssen die &Java; Virtual Machine auf Ihrem System installieren. Mit &Java; können weder Tonhöhe, Lautstärke noch Sprechgeschwindigkeit einstellen. Sprachsynthesizer: FreeTTS &URL;: http://sourceforge.net/projects/freetts/ Debian Installationsbefehl: Keiner Arbeiten mit dem Befehlsmodul Das Befehlsmodul ermöglicht Ihnen die Benutzung von &ktts; mit jedem beliebigen Sprachsynthesizer, der in einer &konsole; auf der Befehlszeile angesteuert werden kann. Sprachsynthesizer: Befehl &URL;: keine Debian Installationsbefehl: Keiner Am besten benutzen Sie einen Befehl, der die Sprachausgabe in eine temporäre Audiodatei (wav) schreibt, anstatt die Ausgabe direkt zum Audiogerät zu schicken Wenn sich die erforderliche Kodierung der Texte für den Sprachsynthesizer von der Kodierung Ihrer Arbeitsfläche unterscheidet, müssen Sie die Texte mit dem Parameter %f an den Synthesizer schicken. &ktts; schreibt den Text dann in der angegebenen Kodierung in die temporäre Datei. Wenn Sie auf der Befehlszeile Text mit dem Parameter %t an den Synthesizer schicken, wird die Kodierung Ihrer Arbeitsfläche benutzt. Mit der Auswahl von Daten als Standardeingabe schicken können Sie versuchen, dieses Problem zu lösen, wenn der Synthesizer Eingaben von StdIn (Standardeingabekanal) annimmt. Als Beispiel hier ein Befehl, um polnischen Text mit ISO 8859-2 an Festival zu schicken und dabei Satzzeichen auszufiltern. cat %f | tr '(){}[]"' ' ' | festival --tts --language polish &documentation.index;