Přehrávání patternu - Pattern playback
Přehrávání vzor je brzy mluvit zařízení, které bylo postaveno Dr. Franklin S. Cooper a jeho kolegové, včetně Johna M. Borst a Caryl Haskins , na Haskins Laboratories v pozdních 1940 a dokončena v roce 1950. Tam bylo několik různých verzí této hardwarové zařízení. V současné době přežívá pouze jeden. Stroj převádí obrázky akustických vzorů řeči ve formě spektrogramu zpět na zvuk. Pomocí tohoto zařízení byli Alvin Liberman , Frank Cooper a Pierre Delattre (později se připojili Katherine Safford Harris , Leigh Lisker a další) schopni objevit akustické podněty pro vnímání fonetickéhosegmenty (souhlásky a samohlásky). Tento výzkum byl zásadní pro vývoj moderních technik syntézy řeči , čtecích strojů pro nevidomé, studium vnímání řeči a rozpoznávání řeči a vývoj motorické teorie vnímání řeči .
K vytváření zvuku používá stroj pro přehrávání vzorů zdroj obloukového světla, který je namířen proti rotujícímu disku s 50 soustřednými stopami, jejichž fólie se systematicky mění, aby vytvořily 50 harmonických základní frekvence. Světlo je dále promítáno proti spektrogramu, jehož odrazivost odpovídá hladině akustického tlaku části signálu, a poté je směrováno k fotovoltaickému článku, pomocí něhož je změna světla převedena na změny akustického tlaku.
Přehrávání vzoru bylo naposledy použito v experimentální studii Roberta Remeza v roce 1976. Přehrávání vzoru nyní sídlí v muzeu v Haskins Laboratories v New Haven, Connecticut .
Technika přehrávání vzoru se nyní obecněji týká algoritmů nebo technik pro převod spektrogramů , kochleagramů a korelogramů z obrázků zpět na zvuky.
Přehrávání digitálních vzorů
V 70. letech minulého století začaly předchozí verze nahrazovat přehrávání digitálních vzorů. Časný prototyp byl vyvinut Patrickem Nye, Philipem Rubinem a kolegy z Haskins Laboratories . Kombinoval „všudypřítomný spektrální analyzátor“ [1] pro automatickou spektrální analýzu, spolu se zobrazovacím procesorem VAX GT-40 pro grafickou manipulaci se zobrazeným spektrogramem, což je forma „syntézy podle umění“ a následná opětovná syntéza pomocí 40 banka filtrů kanálů. Toto hybridní digitální/hardwarové/softwarové přehrávání vzorů bylo nakonec nahrazeno v Haskins Laboratories systémem HADES pro analýzu a zobrazení, který navrhl Philip Rubin a byl implementován ve Fortranu na rodině počítačů VAX . Modernější verzi popsali Arai a kolegové [2] . K dispozici je online ukázka [3] .
Viz také
- Caryl Haskins
- Haskinsovy laboratoře
- Alvin Liberman
- Čtecí stroj
- Robert Remez
- Philip Rubin
- Spektrogram
- Motorická teorie vnímání řeči
- Syntéza řeči
- Grafický zvuk
Reference
Bibliografie
- Cooper, FS, Liberman, AM, & Borst, JM, Interkonverze slyšitelných a viditelných vzorů jako základ pro výzkum vnímání řeči. Sborník Národní akademie věd , 1951, 37, 318-325.
- Cooper, Franklin S., Delattre, Pierre C., Liberman, AM, Borst, JM & Gerstman, LJ, Některé experimenty s vnímáním syntetických zvuků řeči. The Journal of the Acoustical Society of America , 1952, 24, 597-606.
- Cooper, Franklin S., Některé instrumentální pomůcky pro výzkum řeči. Ve zprávě ze čtvrtého setkání u kulatého stolu o lingvistice a výuce jazyků . Washington, DC: Ústav jazyků a lingvistiky, Georgetown University, 1953, 46-53.
- JM Borst, Využití spektrogramů pro analýzu a syntézu řeči, J. Audio Eng. Soc. , 4, 14-23, 1956.
- Liberman, Alvin M., Některé výsledky výzkumu vnímání řeči. The Journal of the Acoustical Society of America , 1957, 29, 117-123.
- Remez, Robert E., Adaptace hranice kategorie mezi řečí a neslovem: Případ proti detektorům funkcí. Kognitivní psychologie , 1979, 11, 38-57.
- Malcolm Slaney . Přehrávání vzorů od roku 1950 do roku 1995. Sborník příspěvků z konference IEEE Systems, Man and Cybernetics Conference z roku 1995 . 22. - 25. října 1995, Vancouver, Kanada.
- Malcolm Slaney, Pattern Playback in the 90's, in Advances in Neural Information Processing Systems 7 , Gerald Tesauro, David Touretzky, and Todd Leen (eds.), MIT Press, Cambridge, MA, 1995.
- T. Arai, K. Yasu a T. Goto, digitální přehrávání vzorů, Proc. Podzimní setkání. Akust. Soc. Jpn ., 429-430, 2005.
- T. Arai, K. Yasu a T. Goto, Přehrávání digitálních vzorů: Převod spektrogramů na zvuk pro vzdělávací účely, Acoust. Sci. & Tech. , 27 (6), 393-395, 2006