Wat is Digitale Signaalverwerking?

 

@ Rutger Teunissen, 2004

 

 

 

Achter de grijze lijn der horizon
Het bulderen - goedmoedig - der kanonnen

 

Wat me ooit, als eersteklasser op het gymnasium, het meest intrigeerde in de bovenstaande regels - afkomstig uit het bij vele generaties scholieren bekende gedicht over de Tweede Wereldoorlog De laatste brief van Bertus Aafjes - was die merkwaardige kwalificatie van bulderende kanonnen: goedmoedig??

Jaren later, op een militair oefenterrein, begreep ik het opeens, toen ik als dienstplichtige van enkele meters afstand een luid knetterende salvo hoorde van een Mach, plompzware mitrailleur. Al vaker hadden we als jeepchauffeurs tijdens oefeningen staan observeren hoe beginnende infanteristen in de verte op de schietbaan bij hun eerste kennismaking met de Mach soms rare schrikbewegingen maakten - een enkeling zelfs half huilend. Dat begrepen we niet goed. Totdat we bij toeval 'n keer heel dicht langs de Mach-schietbaan liepen, terwijl ze met dat ding aan de gang waren. Inderdaad. Op drie meter afstand beleefde je het allemaal heel anders! Niet alleen omdat het geluidsvolume nu boven de pijngrens lag, maar vooral vanwege die volkomen andere, bijtende, metalen klank, als een roffel van mokerslagen op een aambeeld. Van zo dichtbij was het Mach-salvo een huiveringwekkende verklanking van krankzinnig, bruut geweld.

Wat Aafjes zo poëtisch verwoordt is een elementaire, akoestische eigenschap van lucht: door de voortplanting in lucht wordt geluid niet alleen zachter naarmate de geluidsbron verder "achter de grijze lijn der horizon" ligt, maar vindt er tevens een vervorming plaats, waarbij hoge tonen meer worden verzwakt dan lage, ongeveer zoals bij de toonregeling van een versterker, wanneer je het knopje van de hoge tonen tegen de wijzers van de klok in draait. Daardoor wordt de klankkleur doffer en krijgt zelfs 't scherpste geluid een wat ronde, goedmoedige klank. De agressie van de Mach zat 'm dus vooral in de klankkleur!

Kennelijk voert lucht een bewerking uit op geluid, waardoor met het toenemen van de afstand ook de klankkleureigenschappen veranderen. Niet alleen de lucht zelf, maar ook elk object waar (trillende) lucht op een of andere manier tegenaan botst is zo'n geluidsbewerker: een bosrand waar een echo optreedt, een kerk die galm veroorzaakt, de schalbeker van een saxofoon, de zangbodem van een piano, je oorschelpen en gehoorbuis, een stethoscoop, al die dingen voeren bewerkingen uit op geluidstrillingen door er meer of minder complexe reflectiepatronen aan toe te voegen; dat maakt een geluid doffer of briljanter, holler, galmender, nasaler etc. Voorwerpen met een dergelijk timbre-veranderend gedrag worden in de audiowereld filters genoemd.

Filtrerende bewerkingen kunnen zo ingrijpend en specifiek zijn dat je er de objecten die ze uitvoeren soms gemakkelijk aan herkent. Brommers bijvoorbeeld hebben weliswaar allemaal (ongeveer) hetzelfde ontploffingsmotortje dat dezelfde heldere, "neutrale" pulstrein veroorzaakt, maar toch kun je verschillende brommertypen meestal gemakkelijk onderscheiden door het kenmerkende reflectiepatroon, zeg maar het "eigengeluid", van de knalpot: de één knorrend, de ander ronkend, weer een ander schetterend. Een dramatischer voorbeeld is de spraak van mensen die als stembandprothese een elektronische generator in hun strottehoofd hebben zitten, een soort luidsprekertje, waarmee een zoemtoon wordt opgewekt die lijkt op die van de stembanden. Ondanks het "electronisch" en onpersoonlijk karakter van deze zoemtoon zijn taaluitingen toch als zodanig herkenbaar tengevolge van de zeer karakteristieke reflectiepatronen die mond- en keelholten eraan toevoegen.

Tegen het einde van de 19de eeuw had men al een goed inzicht in de relatie tussen spraakklanken en de grootte van de verschillende resonantieruimten in mond- en keelholten. Er werden gummi-modellen van het spraakkanaal gebouwd, die je al knedend in verschillende standen kon zetten, waardoor je verschillende klinkers kon opwekken.

Uit iets latere tijd stamt de in Fig. 1 afgebeelde "mechanische spraaksynthesizer".

 

Rechtsonder bevindt zich een kamertje waarin een veerkrachtige metalen strip in trilling kan worden gebracht bij wijze van stemband; de toonhoogte daarvan is regelbaar met piston V5. Ook ruis kan worden opgewekt (via piston V4) voor het modelleren van niet-stemhebbende klanken (zoals s, g, t). Het spraakkanaal is in een aantal segmenten verdeeld, waarvan de diameters eveneens door middel van pistons instelbaar zijn gemaakt, zodat verschillende klinkers geproduceerd kunnen worden. Buitengewoon goed verstaanbaar bleek een woord als "cigarette". Dergelijke apparaten hebben enorm veel bijgedragen aan een beter begrip van de mechanisch-akoestische oorsprong van spraak en daarmee tevens aan de ontwikkeling van de telecommunicatie.

Alexander Bell, uitvinder van de telefoon en zoon van een spraakdocent voor doven, maakte sinds z'n vroege jeugd al kennis met zulke "talking heads" en kon als schooljongen zijn hond op commando laten grommen en tegelijkertijd met beide handen z'n bek in zodanige standen zetten dat een min of meer herkenbaar "How are you, Grandmama?" hoorbaar werd. Opmerkelijk was dat het beestje van lieverlee soms uit zichzelf rechtop ging zitten grommen en daarbij vreemde kauwbewegingen maakte. Zo ontstond de legende dat Alexander Bell z'n hond had leren praten...

Allerlei zeer uiteenlopende geluidseffecten ontstaan dus simpelweg door de bewerking die voorwerpen door hun vorm, afmetingen en materialen op geluidsgolven uitvoeren. Louter aan die bewerkingen danken ze vaak hun enige betekenis.

Niet alleen de opwekking van geluiden, ook de analyse ervan is in essentie geluidsbewerking. Horen bijvoorbeeld bestaat, fysiologisch en anatomisch gezien, uit een lange keten van bewerkingen waarbij allereerst verschillende omzettingen van medium plaats vinden: van akoestische trilling (luchtdrukfluctuaties) in de gehoorbuis naar mechanische trilling met een heel kleine amplitude bij het trommelvlies, vervolgens via de gehoorbeentjes naar een mechanische trilling met veel grotere amplitude. Die stap is nodig vanwege de zg. impedantie-aanpassing aan de volgende omzetting, nl. die naar het hydraulische systeem van het binnenoor, een slakkehuisvormig buisje, de cochlea, dat is "uitgehouwen" in het bot bij je slapen en gevuld is met vloeistof. Daarin vindt een indrukwekkend stukje vloeistofmechanica plaats dat trillingen van verschillende frequenties (toonhoogten) ruimtelijk van elkaar scheidt. In dat "scheiden" komt het idee van een filter weer naar voren. De zenuwcellen die langs de wand van de cochlea verspreid liggen en als trilhaartjes onophoudelijk in de vloeistof heen en weer bewegen, registreren elk de geluidsintensiteit binnen een heel klein frequentiegebiedje. Een toon van bijvoorbeeld 1000 Hz zal op één specifieke plaats in de cochlea enkele zenuwcellen sterk prikkelen, en een toon van 2000 Hz doet dat met een paar cellen een stukje verderop. De gehoorzenuw die geluidsinformatie naar je hersenen stuurt, bestaat uit een bundel van duizenden van elkaar geïsoleerde "frequentie-kabeltjes". Je zou dus de geluidsbewerking in je oor kunnen aanduiden als die van een frequentie- of spectrum analyzer die bestaat uit een soort filterbank.

 

Signalen en systemen

Zowel geluidseffecten als geluidsanalyse zijn dus het resultaat van zeer uiteenlopende, natuurkundige bewerkingen. Daarbij is sprake van een innige relatie tussen de bewerking en de bewerker: het gaat steeds om objecten die een of andere inwerking hebben, die iets doen. Het maakt daarbij geen wezenlijk verschil in welk medium een geluidsbewerkend object actief is - mechanisch, pneumatisch, hydraulisch, electrisch. En er is evenmin veel inzicht te behalen in het precies aangeven op welk punt je een trilling nog als geluid wilt aanmerken of als iets anders. Daarom worden trillingen, fluctuaties in een of ander medium, meestal kortweg aangeduid als signalen. Een signaal is op te vatten als een fluctuatie-gedrag waarin informatie ligt opgeslagen. Het begrip signaal vertoont ook gelijkenis met wat je in de wiskunde aanduidt als een functie, waarbij sprake is van een afhankelijke en een onafhankelijke variabele.

Bij geluid is de onafhankelijke variabele de tijd en de afhankelijke de amplitude. In zo'n geval spreek je simpelweg van tijdsignalen. Door de invoering van het begrip signaal zijn alle genoemde voorbeelden van bewerkingen op geluid tevens voorbeelden van wat algemener wordt aangeduid als signaalverwerking (signal processing). En de voorwerpen waardoor signalen op een of andere manier veranderen van eigenschappen worden zonder al te veel fantasie signaalverwerkende systemen of kortweg systemen genoemd. Hier heb je dus de meest algemene benaming voor wat we boven in een wat engere zin aanduidden als filter. Een viaduct dat galm toevoegt aan het gejoel van schoolkinderen is dus een voorbeeld van een (signaalverwerkend, akoestisch filter-)systeem.

Bij het begrip systeem denk je in eerste instantie vooral aan het dingmatige, materiële karakter van signaalverwerkers: ze hebben massa, temperatuur, je kunt er metingen aan verrichten etc. Toch gaat het in de signaaltheorie vooral om de werking die systemen uitoefenen op signalen. Ook hier dient zich een begrip uit de wiskunde aan. Net als optellen, aftrekken, vermenigvuldigen en delen, is een systeem een operator die een bewerking uitvoert op een (of meerdere) operand(en). Optellen en vermenigvuldigen zijn voorbeelden van operators met twee operanden, wortel trekken is een operator met één operand. In de signaalverwerking zijn de operanden altijd signalen. De meeste systemen hebben slechts één operand. Een signaal dat door een systeem wordt bewerkt heet inputsignaal en het resultaat van de bewerking outputsignaal. In onderstaande tabel worden enkele voorbeelden gegeven van verschillende systemen met hun input- en outputsignalen.

 

 

Naast de evidente verschillen van medium waarin deze signalen en systemen zich voordoen zijn er nog een paar andere dingen in bovenstaande tabel die opvallen en die een cruciale rol spelen in de signaaltheorie.

Ten eerste is er een duidelijk onderscheid tussen de inputsignalen 1 t/m 4 en de laatste twee. De eerste vier zijn impulsief, eenmalig, terwijl de laatste twee zich in principe onbeperkt in de tijd uitstrekken.

Maar als je kijkt naar de outputsignalen dan blijkt die verdeling toch enigszins gewijzigd. In voorbeeld 2, de reflectie van een handklap tegen een muur, is er duidelijk "iets in de tijd bijgekomen": er is sprake van twee impulsen. Het systeem heeft kennelijk een tijdgedrag dat de responsie wordt genoemd. In een later hoofdstuk zal blijken waarom de responsie op een impuls, kortweg de impulsresponsie, zo veelzeggend is; voor dit moment stellen we slechts vast dat je bij het testen van zeer verschillende trillingssystemen bijna instinctief gebruik maakt van impulsen. Denk aan een handklap, vingerknip of alarmpistool bij het beoordelen van de geluidseigenschappen van een concertzaal of de drumslagen bij de sound check van de geluidsinstallatie bij een popconcert, of een vioolbouwer die op het bovenblad van een viool klopt om een indruk te krijgen van de klankeigenschappen ervan.

Nog veel dramatischer is de impulsresponsie in het derde en vierde voorbeeld. In voorbeeld 3 gaat het om een electrisch systeem dat bestaat uit een weerstand R, spoel L en condensator C. Een dergelijk systeem wordt een trillingskring genoemd, of, wat algemener, een resonator (zie Fig. 2). Een belangrijk kenmerk ervan is dat het een impuls bewerkt tot een outputsignaal dat weliswaar steeds zachter wordt, maar waarbij, in tegenstelling tot de reflectie tegen de muur, geen tijdstip is aan te wijzen waarop de inwerking van het systeem duidelijk, abrupt en definitief tot een einde komt. Daarom wordt een resonator in de signaalverwerking geclassificeerd als een Infinite Impulse Response (IIR) systeem - ook in de nederlandstalige literatuur over signaalverwerking houdt men de engelse terminologieën aan. De eerste twee voorbeelden, waarbij sprake is van een eindige systeemreactie, staan te boek als Finite Impulse Response (FIR) systemen.

Een ander kenmerk van een resonator is dat het een trillingsgedrag vertoont, waarbij de frequentie en de sterkte van de demping afhangen van fysieke grootheden in het systeem, in dit geval van de waarden van R, L en C. Ook het vierde voorbeeld, de stemvork, is een resonator, en wel een mechanisch-akoestische. Als je een stemvork aanslaat met een zachte (rubberen) stok, hoor je een geleidelijk wegstervende toon die vanwege z'n weke, ronde klank soms een pure toon wordt genoemd.

In het vijfde voorbeeld, het veersysteem van een auto, hebben we te maken met een zuiver mechanisch systeem. Hier vormt het wegdek een signaal van de variabele plaats dat zich aan het veersysteem van een rijdende auto manifesteert als een inputsignaal van de variabele tijd. Het outputsignaal bestaat uit datgene wat je als inzittende ervaart van de hobbels in het wegdek; het is aanmerkelijk "vloeiender" dan het inputsignaal; schokken hebben een veel minder abrupt en ook veel minder heftig karakter.

Ook het massa-veer-dempersysteem van een auto is, net als de stemvork en de RLC-kring, zowel een voorbeeld van een IIR-systeem als van een resonator. Alleen zijn hier de resonantiefrequentie en de dempingstijd zo op elkaar berekend dat er nauwelijks meer sprake is van een trillingsgedrag: het is niet de bedoeling dat je van een enkele kuil in de weg enige tijd op en neer deint! Net als bij de eerste vier voorbeelden kun je de kwaliteit van het veersysteem van een auto mooi testen door een impulsachtig inputsignaal, zoals iedereen weet die wel eens een tweedehands auto heeft gekocht: leun beurtelings eventjes op de vier hoekpunten van de auto en laat plotseling los - als er sprake is van oscillatie, dan heeft een schokbreker z'n beste tijd gehad.

Het zesde en laatste voorbeeld, spraak, is in een ander opzicht uniek in dit rijtje. Dit systeem is in principe tijdvariant: tijdens het spreken verandert je mond voortdurend van stand. Dus ook de (akoestische) eigenschappen ervan zijn voortdurend aan verandering onderhevig en dat levert een continue stroom van spraakklankveranderingen op. Bij de analyse van spraak wordt daarom uit gegaan van wat in theaterkringen zo mooi een freeze heet: de mond staat gefixeerd in een bepaalde stand en produceert daarbij een stationaire klank, bv. de "AA-"klinker. De dynamiek van het spreken wordt dan, vergelijkbaar met de losse beeldjes van een film, gerepresenteerd als een reeks van stationaire, in minieme stapjes evoluerende klanken.

Ook al lijkt het er misschien niet op, toch is ook het spraakkanaal in gefixeerde stand een IIR-systeem, zelfs een zeer complex. In tegenstelling tot de stemvork is de uitklinktijd bij spraakklanken zo kort dat je die überhaupt niet als zodanig waarneemt, maar veeleer als klankkleur.

 

Analogie

De geschiedenis van het onderzoek naar geluidsverschijnselen en akoestiek is bijzonder lang en begint misschien wel met Pythagoras' ontdekking van de samenhang tussen elementaire muzikale intervallen (octaaf, kwint, terts) en eenvoudige getalsverhoudingen. Eeuwenlang was muziek de belangrijkste en zo goed als enige inspiratiebron voor akoestisch onderzoek. Daar komt in het begin van de 19de eeuw verandering in als gevolg van de vele gebiedsuitbreidingen in de natuurkunde, zoals de themodynamica en het electromagnetisme. Dat betekende ook voor de akoestiek een nieuw élan en een aanzienlijke verruiming van het blikveld. Dat laatste zelfs zozeer dat er in de eerste decennia van de 20ste eeuw in dat akoestisch onderzoek een nogal merkwaardige dip valt te bespeuren: het aantal publicaties, nieuwe ontdekkingen en uitvindingen neemt eerder af dan toe. De verklaring daarvoor blijkt niettemin eenvoudig: de razendsnelle ontwikkelingen in de electrotechniek. Maar die trend bestond al enkele generaties langer: Alexander Bell, die we hierboven al tegenkwamen, klaagde tijdens een ontmoeting met Joseph Henry (naar wie de eenheid van zelfinductie is genoemd) eens over z'n gebrek aan kennis van de electrotechniek. De reactie van Henry was kernachtig: "Get it!"

Kenmerkend voor de ontwikkeling in die tijd is dat men in de verschillende toepassingsgebieden van de electrotechniek ontdekt dat niet alleen in signalen die zich in verschillende media voordoen, maar ook in de beschrijving van systemen die die signalen bewerken, sterke analogieën bestaan. De bovengenoemde voorbeelden van akoestische, mechanische en electrische systemen vertonen in principe allemaal hetzelfde trillingsgedrag en hebben dan ook dezelfde wiskundige beschrijving. De gedempte trilling van een RLC-kring en de wegstervende toon van een stemvork zijn beide te beschrijven als een exponentiëel dempende sinus. Het zijn, kort gezegd, analoge systemen, waarin analoge signalen worden bewerkt. Het woord analoog raakte zo ingeburgerd dat het in het dagelijks taalgebruik langzamerhand de betekenis kreeg van "electrisch apparaat" en sinds de intrede van de computer zelfs die van onderscheid tot het digitale. Dat laatste wordt geïllustreerd in de naamstelling van een electronisch onderdeel dat in elke CD-speler en op elke computergeluidskaart is terug te vinden, nl. de zg. Digitaal/Analoog Converter, waarmee eigenlijk precies een conversie van een discreet naar een continu signaal wordt bedoeld.

Juist door deze analogie van akoestische en electrische systemen konden allerlei ingewikkelde akoestische processen worden gesimuleerd door veel beter hanteerbare electrische systemen en daardoor beter worden begrepen. Deze ontwikkeling leidde uiteindelijk tot de analoge computer die vanaf de jaren 50 van de vorige eeuw meer en meer door de digitale werd verdrongen.

Een van de gebieden waarin de koppeling van analoge systemen heel uitdrukkelijk naar voren komt is de elektroakoestiek. Het strekt zich uit van opnametechniek (microfoon, luidspreker, bandrecorder, CD), telecommunicatie (telefoon, radio, TV, GSM) tot nieuwe muziekinstrumenten, waarvan met name de electrische gitaar inmiddels grote furore heeft gemaakt. In de elektroakoestiek gaat het in essentie om apparaten waarbij zowel electrische als mechanische signalen betrokken zijn. Het analoge karakter ervan is eigenlijk al voor de hand liggend door het feit dat vele electrische grootheden zijn gedefiniëerd in temen van mechanische. Verder is de scheidslijn tussen het mechanische en akoestische niet altijd even relevant, denk bijv. aan de stemvork, die weliswaar een signaal voortbrengt dat een puur akoestisch doel dient, maar dat je toch vooral als een mechanische trilling beschrijft. Electroakoestische apparaten zijn dan ook in essentie electromechanische.

In Fig. 2 zijn drie analoge, resonerende systemen afgebeeld; een mechanisch, een elektrisch en een zuiver akoestisch, de zg. Helmholtzresonator, ook wel Toonbol genoemd, waarover in een later hoofdstuk meer. Ze hebben met elkaar gemeen dat hun impulsresponsie bestaat uit een exponentiëel gedempt, sinusvormig signaal.

 

 

Toch zijn systemen zoals deze, met enkelvoudige resonanties, bijzondere gevallen. De in de natuur voorkomende systemen zijn meestal veel ingewikkelder. Dat blijkt al direct als we sommige van de voorbeelden van hierboven nader bekijken.

Allereerst spraken we in voorbeeld 5 gemakshalve van het veersysteem van de auto; maar in feite gaat het om een koppeling van meerdere, onafhankelijke veersystemen: het rubber van de banden, de bandspanning, de (viervoudige) combinatie van veren en schokbrekers, en tenslotte de stoel zijn op zichzelf allemaal onafhankelijke veersystemen die hun eigen trillingskarakter hebben en daarmee een eigen aandeel in het outputsignaal. Er is dus sprake van meerdere, gelijktijdig optredende resonanties.

Dan de stemvork. Als je die in plaats van met een zachte stok aanslaat tegen een hard voorwerp, bv. een tafelrand, dan krijg je niet één, maar meerdere tonen te horen. Naast de verwachte stemtoon valt met name een veel hogere, "metalige" tonen op, die bij nadere beschouwing eveneens een gedempte sinustoon blijkt te zijn, en wel met een aanzienlijk kortere dempingstijd dan de stemtoon zelf en dus van weinig invloed op de eigenlijke functie van de stemvork. Een stemvork is dus eveneens te bestempelen als een gekoppeld systeem dat uit meerdere gelijktijdig optredende resonanties bestaat (zie ook Fig. 4).

Tot slot is ook elke spraakklank te beschrijven als een compositum van verschillende resonanties, elk met een eigen resonantiefrequentie en dempingstijd.

Nu is het een van de belangrijkste resultaten van trillingsonderzoek dat zo'n complex systeem beschreven kan worden als een som van meerdere exponentiëel gedempte, sinusvormige signalen. Dat wordt in Fig. 3 geïllustreerd door een electrisch analogon van het spraakkanaal.

Hier zijn de verschillende resonanties die in mond- en keelholten bij een bepaalde spraakklank ontstaan, gerepresenteerd door een serie gekoppelde RLC-kringen, die elk afzonderlijk één resonantie representeren en één sinusvormig signaal met een zekere frequentie en een zekere dempingstijd als impulsresponsie hebben. Op dezelfde manier zou je een spraakklank ook kunnen modelleren door een koppeling van een aantal verschillende massa's, veren en schokbrekers. Maar het zal duidelijk zijn dat je met een electrische versie, met regelbare (zie pijltjes in de figuur) spoeltjes en condensators, veel preciezer en gemakkelijker kunt manipuleren dan met reeks starre veren en schokbrekers of met het mechanisch-akoestische model uit Fig.1.

 

Fouriertransformatie

De ontdekking van analogieën in signalen en systemen is zeker niet de eerste stap geweest in de ontstaansgeschiedenis van wat inmiddels bekend staat als de signaaltheorie. Een van de centrale problemen in het wis- en natuurkundig onderzoek in de 18de en begin 19de eeuw was de vraag of het mogelijk is om aan de hand van fysische grootheden van een systeem het trillingsgedrag ervan te beschrijven, d.w.z. de momentane uitwijking te formuleren als functie van de tijd. De analyse van dit soort problemen resulteert in een differentiaalvergelijking, waarin een of meerdere afgeleiden van de gevraagde tijdfunctie voorkomen. Uit een dergelijke vergelijking is het, ook met de computer, slechts bij benadering mogelijk de tijdfunctie zelf rechtstreeks numeriek te evalueren; die benadering wordt bovendien snel slechter naarmate de differentiaalvergelijking ingewikkelder wordt. Daarom is een integratieproces vereist waarin de differentiaalvergelijking wordt omgewerkt naar een vergelijking waarin geen afgeleiden meer voorkomen. Dit proces wordt het oplossen van een differentiaalvergelijking genoemd.

In elementaire gevallen is zo'n oplossing mogelijk met behulp van even elementaire wiskundige technieken, zoals die van scheiding der variabelen. Voor meer complexe gevallen, zoals de lineaire differentiaalvergelijkingen waarmee gekoppelde systemen, zoals spraak, kunnen worden beschreven, bestaat sinds het begin van de 19de eeuw een zeer listige oplossingstechniek. Daarbij wordt gebruik gemaakt van de zg. Fouriertransformatie: eerst wordt de variabele tijd getransformeerd naar de variabele frequentie. De differentiaalvergelijking gaat dan over in een veel gemakkelijker oplosbare algebraïsche vergelijking. Die oplossing kan ten slotte worden teruggetransformeerd naar de gezochte tijdfunctie.

Nu blijkt bovendien dat bij deze transformatie ook het "tussenstadium" van de variabele frequentie buitengewoon vruchtbaar is voor het begrijpen en beschrijven van het gedrag van trillingssystemen. Dat is niet zo verwonderlijk als je je realiseert dat, zoals we hierboven al zagen, ook in het oor, in de cochlea, een dergelijke transformatie van tijd naar frequentie plaats vindt. Als je nog even terugkijkt naar de voorbeelden van signalen en systemen die we hierboven tegenkwamen, dan zie je dat we in de beschrijvingen ervan nu eens spraken in termen van tijdeffecten, dan weer in termen van frequentie-effecten. Bij echo denk je aan een tijdverschijnsel; bij het uittrillen van een stemvork eveneens, immers die lange uitdempingstijd is een eigenschap van alle stemvorken. Maar het voorbeeld van lucht als "goedmoedig" filter dat hoge tonen meer dempt dan lage is juist een beschrijving in termen van frequenties. Datzelfde geldt voor de gecompliceerde resonantiepatronen van spraakklanken. De kracht van de Fouriertransformatie zit 'm hierin dat je er een systeem mee kunt beschrijven zowel in termen van tijd als in termen van frequentie. Elk signaalverwerkend systeem vertoont altijd tegelijkertijd zowel een karakteristiek tijdgedrag als een karakteristiek frequentiegedrag. Als een systeem een duidelijk tijdeffect heeft, zoals een echo, dan heeft het noodzakelijkerwijs ook een zeker frequentie-effect en gedraagt zich dus altijd tevens als iets dat de klankkleur van een geluid wijzigt. Ook het omgekeerde blijkt waar: elke klankverkleurende bewerking heeft noodzakelijkerwijs een eigen tijdseffect. Kortom: het trillingsgedrag van een systeem heeft twee verschillende beschrijvingen, één in termen van tijd, één in termen van frequentie. Daarom noemen ze tijd en frequentie in de signaalverwerking een Fourierpaar.

In Fig. 4 is de trilling weergegeven van een stemvork van 440 Hz die met een hard, metalen voorwerp is aangeslagen, zodat er naast de stemtoon een metaalachtige klank hoorbaar is.

In de bovenste grafiek (A) is een tijdsbestek van ongeveer vier sekonde te zien. Als je goed kijkt naar de snel aflopende amplitude direct na het moment van aanslag, dan zie je dat de demping een zeer lichte knik vertoont en dus niet zuiver exponentiëel verloopt. Dat is een eerste aanwijzing dat er meerdere resonanties in 't spel zijn. Die indruk wordt bevestigd als je naar een detail van de trilling kijkt in de middelste grafiek (B). De trilling blijkt hier grilliger te verlopen dan je misschien verwachten zou; toch is heel duidelijk de stemtoon te horen en om aannemelijk te maken dat die ook echt in het signaal aanwezig is, is op de achtergrond ook een sinustoon van 440 Hz afgebeeld, waarvan de periodes mooi met de grillige grafiek in de pas lopen. Van dit stemvorkfragment is de Fouriertransformatie berekend, waarvan in C het resultaat te zien is. Hier is niet de tijd, maar de frequentie de onafhankelijke variabele. Een dergelijk frequentiediagram heet een spectrum. Net als bij het tijdsignaal is ook bij het spectrum de amplitude de afhankelijke variabele. Er zijn drie duidelijk gescheiden, scherpe pieken te zien, corresponderend met drie verschillende tonen. De eerste is, geheel volgens verwachting, de stemtoon van 440 Hz, vervolgens, nogal verrassend, een piek bij 880 Hz, het octaaf van de stemtoon - verrassend omdat je deze toon nauwelijks bewust hoort; pas wanneer je 'm door 'n filter verwijdert, blijkt de 440 Hz-stemtoon veel minder helder te klinken. De 880 Hz-toon "ondersteunt" dus de stemtoon door er helderheid aan toe te voegen. Tenslotte is er nog een resonantie bij 2774 Hz. Die is ondanks de geringere sterkte veel beter hoorbaar dan de 880 Hz-toon, en verantwoordelijk voor de metalige klank. Deze hoge toon sterft beduidend sneller uit dan de eerste twee.

Wat Fig. 4 vooral duidelijk maakt is dat je door het spectrum, dus de Fouriergetransformeerde van het tijdsignaal, een veel beter idee krijgt van de meervoudige resonanties van de stemvork dan door het tijdsignaal zelf. Ook sluit het spectrum als representatie van het geluid veel beter aan bij wat je hoort dan het tijdsignaal: wat je oor eigenlijk zegt is niet: Ik hoor een complexe trilling, maar veeleer: Ik hoor verschillende tonen (= pieken in spectrum).

 

Digitale Signaalverwerking (DSP)

De meest dramatische stap voorwaarts in de signaalverwerking is zonder enige twijfel de komst van de computer geweest. Dit is de stap naar de digitale signaalverwerking, meestal kort aangeduid als DSP (Digital Signal Processing).

Dramatisch, allereerst omdat het meest kenmerkende van systemen, nl. hun materiële, fysiche aard, in het digitale domein elke relevantie heeft verloren: systemen zijn stukjes hardware of software geworden, waarin alleen de werking van het systeem wordt gerepresenteerd. In de software-versie nemen systemen de gestalte aan van tekst. Een softwarefilter bijvoorbeeld, dat de werking van een hoge-tonenregelaar heeft, beslaat niet meer dan enkele regels; als je een beetje de weg weet in het operating systeem van je PC, kun je dat filter door middel van triviale ontwikkelingssoftware binnen 'n half uurtje operationeel hebben en gebruiken om willekeurig geluidsbestand doffer of scherper te laten klinken.

Dramatisch bovendien omdat deze nieuwe vorm van signaalverwerking toepassing vindt op een veel breder, abstracter en formeler terrein dan het oorspronkelijk puur fysische waarvan we hierboven een paar voorbeelden noemden. Kunstmatige intelligentie, in de vorm van neurale netwerkmodellen, is zo'n nieuw terrein. Maar ook beeldverwerking, robotica, data-reductie (MP3, jpeg), patroonherkenning, toepassingen in medische apparatuur (cardiogram, MRI) , defensiesystemen, navigatie, geofysica, trillingsanalyse van motoren, startbanen van vliegtuigen etc. Door deze schaalvergroting raken ook veel meer vormen van wetenschap en techniek - en takken van wiskunde - betrokken bij de signaalverwerking. Een gebied van de signaalverwerking dat door de computer enorm succesvol is geworden is dat van de adaptieve filters (waarbij systemen op basis van het inputsignaal hun eigenschappen aanpassen); het wordt geformuleerd in statistisch jargon; kernpunt daarbij is dat er voor stochastische signalen (en dat zijn dus zo'n beetje alle "real world"-signalen) een model wordt opgesteld in termen van een systeem!

In de digitale signaalverwerking heb je uitsluitend te maken met discrete signalen en discrete signaalverwerkende systemen. In de wiskundige beschrijving daarvan gaat het niet meer om differentiaal- maar om differentievergelijkingen. Die differentievergelijkingen hebben wel weer dezelfde structuur als de differentiaalvergelijkingen die voor continue systemen gelden. Ook de oplossingsmethoden vertonen sterke overeenkomsten. Er bestaat een discrete versie van de Fouriertransformatie die bij de oplossing van differentievergelijkingen dezelfde rol speelt als de continue Fouriertransformatie voor continue signalen en systemen. (Een toepassing van de discrete Fouriertransformatie zagen we stiekem al in Fig. 4, het spectrum van het gediscretiseerde (gesampelde) signaal van de stemvork.)

Een heel opmerkelijk verschil met de continue signaalverwerking is dat de differentievergelijking niet alleen de beschrijving van een discreet systeem vormt, maar tevens de implementatie ervan! Je mag gerust zeggen: de differentievergelijking is het systeem! Als je bijvoorbeeld op de specificatie van je geluidskaart leest dat er een digitaal filter op zit, dan is dat een chipje dat niets anders doet dan razendsnel en onafhankelijk van de processor van je PC een differentievergelijking evalueren voor een aantal achtereenvolgende (discrete) tijdstippen. In die differentievergelijking zijn zowel een discreet inputsignaal (onbewerkte geluidssamples) als een discreet outputsignaal (bewerkte geluidssamples) gerepresenteerd. De software-versie van zo'n systeem behelst in principe dus niet veel meer dan het neerschrijven van een differentievergelijking.

In de computer gaat signaalverwerking volledig over in getalbewerking. Het discrete systeem is een operator die wordt uitgedrukt in de handelingen die een rekenmachine, een computer, op puur numerieke wijze kan verrichten. Dit in tegenstelling tot de voor continue systemen geldende differentiaalvergelijkingen waarvan de numerieke evaluatie slechts een benadering kan zijn.

Deze directe relatie tussen getalbewerking en discreet systeem kun je ook omkeren. We merkten op dat er een discrete versie van de Fouriertransformatie bestaat. Daarbij wordt een (discreet) tijdsignaal uitgedrukt in termen van frequenties. Bovendien zagen we dat het oor iets soortgelijks doet, en het oor is een signaalverwerkend systeem. Daarom is de discrete Fouriertransformatie niet alleen op te vatten als een methode om de differentievergelijking van een systeem op te lossen; de Fouriertransformatie is, net als het oor, zelf een signaalverwerker, een filtersysteem, dat als een (complexe) differentievergelijking wordt beschreven! Als je de discrete Fouriertransformatie toepast op audiosignalen ("geluidssamples"), dan is de werking ervan hoorbaar te maken net zoals een brommermotor het eigengeluid van de knalpot hoorbaar maakt of de stembanden de karakteristieke klanken van het spraakkanaal. Met een heel klein beetje dichterlijke vrijheid zou je dus kunnen spreken van de klank van de Fouriertransformatie. In volgende hoofdstuken zullen we de Fouriertransformatie daarom stapsgewijs introduceren als een steeds uitgebreider en doelgerichter werkend (akoestisch) filter.

In de onderstaande tabel wordt een aantal voorbeelden gegeven van de getalbewerkingen waarmee discrete geluidsverwerkende systemen worden geïmplementeerd, als voorproefje voor de volgende hoofdstukken.

Twee dingen springen direct in 't oog: er zijn slechts drie basisbewerkingen: vermenigvuldigen, optellen en de "geheugen"-operator, waardoor ook vermenigvuldigd en opgeteld kan worden met samples "uit het verleden". Die drie samen vormen de enige ingrediënten van het type lineaire differentievergelijkingen dat in de digitale signaalverwerking centraal staat (met de combinatie van optelling en vermenigvuldiging van samples uit zowel heden als verleden wordt het concept van de differentie volledig geïmplementeerd).

Verder zie je in de tabel een relatie tussen het signaalverwerkingsbegrip IIR en het wiskundige begrip recursie. In de signaalverwerking speelt het type lineaire, recursieve differentievergelijkingen waarmee je bij Discrete, Dynamische Modellen hebt kennis gemaakt, een centrale rol. Maar ook de minder bekende lineaire, niet-recursieve differentievergelijking komt in de signaalverwerking voor, even vaak als het recursieve type. Het niet-recursieve type treedt op in de beschrijving en implementatie van FIR-systemen. Wat de relatie is tussen recursieve en niet-recursieve differentievergelijkingen, en tussen IIR- en FIR-systemen, blijkt door toepassing van de Fouriertransformatie helder en eenvoudig te kunnen worden geformuleerd!

De grote kracht en de flexibiliteit van de digitale signaalverwerking ligt vooral in de "eenheid van bewerking". In tegenstelling tot analoge systemen, waarin altijd omzettingen van medium plaats vinden, met alle verliezen en (vaak niet-lineaire) vervormingen van dien, beschik je met DSP over een ongekende nauwkeurigheid, flexibiliteit en complexiteit: alle systemen uit de bovenstaande tabel kun je in willekeurige volgorden aan elkaar koppelen.

Neem bijvoorbeeld de simulatie van een getokkelde snaar die (onder anderen) kan worden gerealiseerd met een aantal gekoppelde resonatoren. Om de klank van een echte akoestische gitaar te benaderen zou je deze snaarsimulator kunnen koppelen aan een klankkastsimulator die ook weer uit gekoppelde resonatoren bestaat. Die klankkastsimulator heeft dezelfde architectuur en wiskundige beschrijving als de spraaksimulator, dus je kunt een snaargeluid evenzo gemakkelijk aan een spraakachtige klankkast koppelen, een soort "spraakkast" dus. Maak je die laatste bovendien tijdvariant, dan beschik je over een snaar die kan praten, dat wil zeggen een generator waarin alle kenmerken zijn verenigd zowel van een uitklinkende snaar als van het (bewegende) spraakkanaal. Een willekeurig aantal van zulke "snaarpraters" kan een instrument vormen dat een mengsel is van een soort piano en een koor. Dit merkwaardige, maar op een wonderlijke manier toch natuurlijk klinkende instrument kan op zijn beurt weer gekoppeld worden aan een systeem dat de ruimte-akoestiek van een willekeurige concertzaal, garage of rioolpijp simuleert. Alle bewerkingen die in dit proces plaats vinden bestaan uit de evaluatie van recursieve en niet-recursieve lineaire differentievergelijkingen.