Pattern-Wiedergabe - Pattern playback
Die Musterwiedergabe ist ein frühes Sprechgerät, das von Dr. Franklin S. Cooper und seinen Kollegen, darunter John M. Borst und Caryl Haskins , in den Haskins Laboratories in den späten 1940er Jahren gebaut und 1950 fertiggestellt wurde. Es gab mehrere verschiedene Versionen davon Hardware-Gerät. Derzeit überlebt nur einer. Die Maschine wandelt Bilder der akustischen Sprachmuster in Form eines Spektrogramms wieder in Klang um. Mit diesem Gerät konnten Alvin Liberman , Frank Cooper und Pierre Delattre (später hinzu kamen Katherine Safford Harris , Leigh Lisker und andere) akustische Hinweise für die Wahrnehmung phonetischerSegmente (Konsonanten und Vokale). Diese Forschung war grundlegend für die Entwicklung moderner Techniken der Sprachsynthese , Lesegeräte für Blinde, das Studium der Sprachwahrnehmung und Spracherkennung und die Entwicklung der motorischen Theorie der Sprachwahrnehmung .
Zur Tonerzeugung verwendet die Musterwiedergabemaschine eine Bogenlichtquelle, die gegen eine rotierende Scheibe mit 50 konzentrischen Spuren gerichtet ist, deren Transparenzen systematisch variieren, um 50 Harmonische einer Grundfrequenz zu erzeugen. Das Licht wird ferner gegen ein Spektrogramm projiziert, dessen Reflexionsvermögen dem Schalldruckpegel des Teils des Signals entspricht, und wird dann auf eine photovoltaische Zelle gerichtet, durch die die Lichtänderung in Schalldruckänderungen umgewandelt wird.
Die Musterwiedergabe wurde zuletzt 1976 in einer experimentellen Studie von Robert Remez verwendet . Die Musterwiedergabe befindet sich jetzt im Museum der Haskins Laboratories in New Haven, Connecticut .
Die Technik der Musterwiedergabe bezieht sich jetzt auch allgemeiner auf Algorithmen oder Techniken zum Umwandeln von Spektrogrammen , Cochleagrammen und Korrelogrammen von Bildern zurück in Töne.
Digitale Pattern-Wiedergabe
In den 1970er Jahren begannen digitale Pattern-Playbacks die frühere Version zu verdrängen. Ein früher Prototyp wurde von Patrick Nye, Philip Rubin und Kollegen der Haskins Laboratories entwickelt . Es kombinierte einen "Ubiquitous Spectrum Analyzer" [1] für die automatische Spektralanalyse, zusammen mit einem VAX GT-40 Display-Prozessor zur grafischen Manipulation des angezeigten Spektrogramms, einer Form der "Synthesis by Art" und anschließender Re-Synthese mit einem 40 Kanalfilterbank. Diese hybride digitale Hardware/Software-Musterwiedergabe wurde schließlich in den Haskins Laboratories durch das HADES- Analyse- und Anzeigesystem ersetzt, das von Philip Rubin entworfen und in Fortran auf der VAX- Computerfamilie implementiert wurde . Eine modernere Version wurde von Arai und Kollegen beschrieben [2] . Eine Online-Demonstration ist verfügbar [3] .
Siehe auch
- Caryl Haskins
- Haskins-Labors
- Alvin Liberman
- Lesegerät
- Robert Remez
- Philipp Rubin
- Spektrogramm
- Motorische Theorie der Sprachwahrnehmung
- Sprachsynthese
- Grafischer Sound
Verweise
Literaturverzeichnis
- Cooper, FS, Liberman, AM, & Borst, JM, Die Umwandlung hörbarer und sichtbarer Muster als Grundlage für die Forschung zur Sprachwahrnehmung. Proceedings of the National Academy of Sciences , 1951, 37, 318-325.
- Cooper, Franklin S., Delattre, Pierre C., Liberman, AM, Borst, JM & Gerstman, LJ, Einige Experimente zur Wahrnehmung synthetischer Sprachlaute. The Journal of the Acoustical Society of America , 1952, 24, 597-606.
- Cooper, Franklin S., Einige instrumentelle Hilfsmittel zur Sprachforschung. In Bericht des vierten jährlichen Runden Tisches zu Linguistik und Sprachunterricht . Washington, DC: Institut für Sprachen und Linguistik, Georgetown University, 1953, 46-53.
- JM Borst, Die Verwendung von Spektrogrammen für die Sprachanalyse und -synthese, J. Audio Eng. Soz. , 4, 14-23, 1956.
- Liberman, Alvin M., Einige Forschungsergebnisse zur Sprachwahrnehmung. The Journal of the Acoustical Society of America , 1957, 29, 117-123.
- Remez, Robert E., Anpassung der Kategoriegrenze zwischen Sprache und Nichtsprache: Ein Fall gegen Merkmalsdetektoren. Kognitive Psychologie , 1979, 11, 38-57.
- Malcolm Slaney . Pattern Playback von 1950 bis 1995. Proceedings of the 1995 IEEE Systems, Man and Cybernetics Conference . 22.–25. Oktober 1995, Vancouver, Kanada.
- Malcolm Slaney, Pattern Playback in the 90's, in Advances in Neural Information Processing Systems 7 , Gerald Tesauro, David Touretzky und Todd Leen (Hrsg.), MIT Press, Cambridge, MA, 1995.
- T. Arai, K. Yasu und T. Goto, Digital Pattern Playback, Proc. Herbsttreffen. Akustik. Soz. Jpn ., 429-430, 2005.
- T. Arai, K. Yasu und T. Goto, Digitale Musterwiedergabe: Umwandlung von Spektrogrammen in Ton für Bildungszwecke, Acoust. Wissenschaft & Technik. , 27(6), 393-395, 2006