Text2Speech
Text2Speech | |
---|---|
Zweck / Funktion | |
Sprachausgabe über Fhem | |
Allgemein | |
Typ | Gerätemodul |
Details | |
Dokumentation | EN / DE |
Support (Forum) | Unterstützende Dienste |
Modulname | 98_Text2Speech.pm |
Ersteller | tobiasfaust (Forum / Wiki) |
Wichtig: sofern vorhanden, gilt im Zweifel immer die (englische) Beschreibung in der commandref! |
Das Modul Text2Speech ermöglicht es, eine Sprachausgabe über FHEM zu realisieren. Das Modul ist Client-Server-fähig.
Definition Lokale Architektur
Voraussetzung ist ein installierter Mplayer:
sudo apt-get install mplayer
Danach den Mplayer für alle aufrufbar machen
a) per SUDOERS
EDITOR=nano visudo
Dort an letzter Stelle eintragen:
ALL ALL = NOPASSWD: /usr/bin/mplayer
b) oder(!) per GruppenRechte
sudo usermod -aG audio fhem
Hat man Mplayer per Gruppenrechte verfügbar gemacht, muss aber später folgendes Attribut gesetzt sein. Damit wird verhindert, dass Mplayer mit dem defaultmäßig eingestellten "sudo" aufgerufen wird, welches für a) per sudoers gebraucht wird.
attr MyTTS TTS_MplayerCall /usr/bin/mplayer
Empfohlen wird die Nutzung von MP3Wrap. Dadurch wird bei wiederholten Sprachbausteinen ein deutlich flüssigerer Sprachfluss erreicht:
sudo apt-get install mp3wrap
per aplay -l erhält man eine Liste der möglichen Audio Ausgabedevices. Von dem gewünschten Ausgabedevice ermittelt man nun die Kartennummer und das Subdevice. Mit diesen Daten kann man nun das Modul Text2Speech definieren:
define MyTTS Text2Speech hw=0.0; attr MyTTS room Text2Speech; attr MyTTS TTS_UseMP3Wrap 1; attr MyTTS verbose 4;
Ein erster Test kann wie folgt durchgeführt werden (als Einzeiler, ohne Zeilenumbruch einzugeben):
set MyTTS tts Das ist ein Test. Jetzt prüfen wir, ob wir etwas aus dem angeschlossenen Lautsprecher hören. Beim ersten Mal haben wir allerdings noch Sprechpausen. Spätestens beim zweiten Durchlauf ist der Textfluss flüssiger.
Hört man etwas aus dem Lautsprecher, so führen wir das Kommando ein zweites Mal aus. Jetzt sollte es sich besser anhören. Bleiben die Lautsprecher stumm, so ist das fhem-Log zu kontrollieren. Gegebenenfalls ist das verbose-Level auf 5 zu stellen.
War der Test erfolgreich, kann das verbose-Attribut wieder gelöscht werden.
Abhängigkeiten der lokalen Sprachengines
Für beide lokale Engines ist lame
für die Umwandlung von .wav in .mp3 notwendig:
sudo apt-get install lame
Espeak
sudo apt-get install espeak
SVOX-pico
sudo apt-get install libttspico-utils
Für ARM/Raspbian sind die libttspico-utils
leider nicht verfügbar, deswegen müsste man diese selbst kompilieren oder das vorkompilierte Paket aus dieser Anleitung verwenden, folgend in aller Kürze:
sudo apt-get install libpopt-dev cd /tmp wget http://www.dr-bischoff.de/raspi/pico2wave.deb sudo dpkg --install pico2wave.deb
Definition Client-Server Architektur
Es gibt Installationen, bei denen der FHEM-Server z.B. im Keller steht, die Sprachausgabe soll aber räumlich entfernt stattfinden, z.B. im Wohnzimmer. Hierzu ist am Zielort eine FHEM-Instanz anzulegen, z.B. über einen Raspberry Pi, IP: 192.168.178.10. Auf dem FHEM-Server ist Text2Speech als Remote zu definieren:
define MyTTS Text2Speech 192.168.178.10:7072 fhempasswd; attr Text2Speech room Text2Speech;
Am Zielort ist Text2Speech auf dem Raspi wie folgt zu definieren:
attr global globalpassword fhempasswd; define MyTTS Text2Speech hw=0.0; attr MyTTS room Text2Speech; attr MyTTS TTS_UseMP3Wrap 1; attr MyTTS verbose 4;
Bitte die Installation von Mplayer und Mp3Wrap nicht vergessen! Danach der Test wie oben angegeben.
Sprachausgabe per Bluetooth-Lautsprecher
Es ist ebenfalls möglich die Sprachausgabe nicht über einen direkt per Kabel angeschlossenen Lautsprecher auszugeben, sondern per Bluetooth an einen oder mehrere Bluetooth-Lautsprecher. Der Test2Speech-Author verwendet einen CreativeD80. Dabei ist auf dem Client mit der lokal eingerichteten Text2Speech-Instanz folgendes vorzunehmen:
1. USB-Bluetooth-Stick verbinden per lsusb prüfen, ob der Stick erkannt wurde.
2. Bluetooth Bibliotheken installieren
sudo apt-get install bluez bluez-alsa mplayer
3. Bluetooth für eine AudioVerbindung konfigurieren Dazu in /etc/bluetooth/audio.conf in der General section folgendes einfügen:
Enable=Source,Sink,Headset,Gateway,Control,Socket,Media
4. den Rechner neu starten
sudo reboot
5. Den Bluetooth-Lautsprecher lokalisieren Den Lautsprecher in den Pairing-Modus versetzen. Erst Dadurch wird er im Scanning sichtbar
hcitool scan
Folgendes Ergebnis sollte kommen:
Scanning ... 11:22:33:44:55:66 device 1 12:34:56:78:90:12 device 2
6. eine RFComm Connection vorbereiten Dazu /etc/bluetooth/rfcomm.conf editieren und folgendes eintragen (Mac-Adresse anpassen!)
rfcomm0 { # Automatically bind the device at startup bind no; # Bluetooth address of the device device 11:22:33:44:55:66; # RFCOMM channel for the connection channel 3; # Description of the connection comment "This is Device 1's serial port."; }
7. rebooten
sudo reboot
8. Pairing-Key vergeben Die meisten Bluetoothgeräte verlangen einen Schlüssel während des Pairings. Der Creative-D80 erwartet den Schlüssel 0000
bluetooth-agent 0000 &
9. Das eigentliche Pairing Den Lautsprecher in den Pairing-Modus versetzen. Danach:
sudo rfcomm connect rfcomm0
Jetzt sollte keine Fehlermeldung mehr kommen....
10. Alsa konfigurieren Der Bluetooth-Lautsprecher muss nun noch als Alsa-Audiodevice bekannt gemacht werden. Dazu muss /etc/asound.conf erstellt werden. MAC anpassen!
pcm.bluetooth { type bluetooth device 11:22:33:44:55:66 profile "auto" }
Danach Alsa restarten:
/etc/init.d/alsasound restart
11. Testen der Verbindung
mplayer -ao alsa:device=hw=0.0 -nolirc -noconsolecontrols -http-header-fields "User-Agent:Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.22 (KHTML, like Gecko) Chrome/25.0.1364.172 Safari/537.22m" "http://translate.google.com/translate_tts?tl=de&q=Das ist ein Test.";
Links
- Vorstellung und Diskussion des Moduls im Fhem Forum
- Code Snippets: Wetter vorlesen lassen