Electronic Speech Systems

Aus C64-Wiki
Zur Navigation springenZur Suche springen
Electronic Speech Systems
Gründungsdatum 1984
Unternehmenssitz Berkeley, Kalifornien, USA
Firmenleitung Dr. Forrest Mozer (Gründer; 1983-99)
Robert L. Blair (President, CEO; 1999-2018)
Dr. Saied Tehrani (President, CEO; seit 2019)
Dustin Forman (Direktor; seit 2007)
Robert Wang (Marketing; seit 2005)
Anzahl der Mitarbeiter ca. 160
Mitarbeiter Todd Mozer (1983-86), Joe Costello, Fred Chan
Branche Sprachsynthese
Website www.esstech.com


Electronic Speech Systems (ESS) ist eine Firma, die sich mit Sprachsynthese beschäftigt, und in den 1980er Jahren Sprachausgabe für Computerspiele entwickelt hat. Der Weltraumphysiker Dr. Forrest Mozer gründete die Firma 1984, um Kapital aus der Forschungsarbeit seines Sohns Todd Mozers zu schlagen, dessen wissenschaftliche Grundlage zur Sprachsynthese er selber im Jahr 1970 erschaffen hatte. Dieser arbeitete an der Universität von Kalifornien an Sprachsynthese. Sprachsynthese erfordert eigentlich spezielle Hardware. Mozer entwickelte eine Möglichkeit, dies auch ohne spezielle Hardware zu erreichen, und mit sehr wenig Speicher auszukommen, welcher in den 1980ern immens teuer war. Mozers Kompression verringerte die Datenmenge um den Faktor 100. Dadurch war es möglich Spiele mit Sprachausgabe auszustatten und diese zusammen mit dem Spiel in den Hauptspeicher des C64 zu bekommen. Die einzige Einschränkung war, dass das Spiel angehalten wurde, wenn eine Sprachausgabe ausgegeben wurde. Ein Spiel mit Sprachausgabe musste daher so programmiert werden, dass die Sprachausgabe nur dann verwendet wurde, wenn dies keine Auswirkung auf die Spielbarkeit besaß. Da die ESS-Sprachausgabe sehr klar war, wurden manche Spiele nur gespielt, um die Sprachausgabe zu hören. Mancher Titel bekam so wesentlich mehr Aufmerksamkeit als das Spiel an sich verdient hätte.

Funktionsweise[Bearbeiten | Quelltext bearbeiten]

Eine Sekunde Sprachausgabe auf dem C64 benötigt zwischen 90 und 625 Bytes. Im Schnitt verwendet ESS etwa 375 Bytes pro Sekunde oder weniger, was genügend Raum für mehrere Sprachausgaben lässt. Die Datenmenge wird durch Datenkompression um den Faktor 100 verringert. Dazu wurde die Sprache aufgenommen und am Computer komprimiert, um die geringe Datenmenge von 90 bis 6256 Bytes zu erreichen. Die Schwierigkeit bestand vor allem darin, die Daten zu entfernen, die nicht benötigt wurden und die Daten zu erhalten, die unbedingt benötigt wurden. Um die Sprachausgabe am C64 möglich zu machen, bedient sich die Software eines Tricks. Die Register des SID-Chips werden deaktiviert und die Sprachausgabe wird durch die Lautstärkeregelung des SID-Chips erreicht. Da der SID-Chip nur 16 Lautstärkestufen besitzt, lässt sich mit dieser Methode natürlich kein all zu gutes Resultat erreichen, für seine Zeit war die Sprachausgabe jedoch außergewöhnlich gut. Mit dieser Software ist es auch möglich die Stimme anzupassen, um z. B. verschiedene Dialekte zu simulieren. Im Spiel Kennedy Approach kann man, wenn man genau hinhört, feststellen, dass die Piloten verschiedene Stimmen besitzen.

Das benutzte Verfahren scheint Sample-Kompression ähnlich wie z.B. ADPCM sowie das Mischen von einzelnen Samples zu benutzen, so stammen z.B. die S-Laute in Impossible Mission quer über alle Sprachausgaben aus dem gleichen Speicherbereich, und das langandauernde Lachen wird aus mehreren sich unterschiedlich stark überlagernden sehr kurzen Samples erzeugt. Insgesamt kommt das Spiel so mit ca. 6 kBytes Daten für rund 30 Sekunden Sprachausgabe aus.[1]

Spiele mit ESS Sprachsynthese[Bearbeiten | Quelltext bearbeiten]

Weblinks[Bearbeiten | Quelltext bearbeiten]

WP-W11.png Wikipedia: ESS Technology Sprache:english


Quellen