Σύνθεση ομιλίας (text to speech)

Γενικά είναι γνωστή η δυνατότητα σύνθεσης ομιλίας με το λογισμικό ViaVoice της IBM, το οποίο είναι όμως κλειστό λογισμικό.

Μια άλλη λύση είναι το λογισμικό festival, το οποίο ξεκίνησε από το πανεπιστήμιο του Εδιμβούργου και είναι ελεύθερο λογισμικό. Τώρα υπάρχει ένας γενικός τρόπος για την προσθήκη νέων ομιλιών/γλωσσών, κατά το festvox.

Στο δε Αριστοτέλειο πανεπιστήμιο έχουν κάνει τον εξελληνισμό της εφαρμογής (στην προκειμένη περίπτωση την ανάγνωση ελληνικού κειμένου). Αυτό το είδα τελευταία φορά πριν από 3-4 χρόνια περίπου. Προσπάθησα να βρω περισσότερα τώρα χωρίς πολύ τύχη. Αν κάποιος γνωρίζει, ας μιλήσει.

Η διανομή Fedora Core 2 διαθέτει τη δυνατότητα για χρήση από άτομα με ειδικές ανάγκες. Με την ενεργοποίηση των λεγόμενων “Assistive technologies” του GNOME, είναι δυνατόν το σύστημα να διαβάζει στο χρήστη τι συμβαίνει με αποτέλεσμα ένας τυφλός χρήστης να είναι σε θέση να χρησιμοποιήσει τον υπολογιστή. Μέχρι στιγμής υπάρχει υποστήριξη για αγγλικά στη διανομή.

Υπάρχει και λίστα λογισμικού για σύνθεση και ανάλυση ομιλίας.

Permanent link to this article: https://blog.simos.info/%cf%83%cf%8d%ce%bd%ce%b8%ce%b5%cf%83%ce%b7-%ce%bf%ce%bc%ce%b9%ce%bb%ce%af%ce%b1%cf%82-text-to-speech/