Dr.Godfried-Willem RAES

Kursus Experimentele Muziek: Boekdeel 2: Live Electronics

Hogeschool Gent : Departement Muziek & Drama


<Terug naar inhoudstafel kursus>    

2094:

De Vocoder

De vocoder (het woord is afkomstig van 'vocal en coder') is een toestel dat aanvankelijk werd gebruikt in het kader van de telefonie en het daaraan gekoppelde foneemonderzoek De ontwikkeling ervan hebben we te danken aan de menselijke streving om ook machines en automaten te laten spreken.

Analyze van het gesproken woord wijst uit dat de menselijke spreekstem tijdens het spreken de toonhoogte over hooguit een terts varieert, waarbij deze toonhoogtevariatie voor de betekenis van het gesprokene niet echt wezenlijk is. Ook de dynamiek van het stemgeluid is tijdens het normale spreken erg beperkt. Met een dynamisch bereik van 12 dB komen we ruimschoots toe. Het wezenlijke van het spreken ligt vervat in onze mogelijkheid fonemen te vormen. In akoestische termen uitgedrukt: in de mogelijkheid op flexibele wijze aan klankkleurmodulatie of spektrum-modulatie te doen. Elke door een luisteraar herkenbare foneem wordt daarbij gekenmerkt door een eigen typische formant. Een formant is een los van de grondfrekwentie bestaande vaste 'filterinstelling' van het geluid. Een formant verschuift dus niet mee met de basistoonhoogte van een geluid. Naast deze formanten spelen ook de overgangen van de ene formant naar de andere -iets wat we in gewone taal 'artikulatie' noemen- een uiterst belangrijke rol voor de verstaanbaarheid van het gesproken woord.

Formanten van geluiden kunnen we achterhalen en analyseren via spektraalanalyze toegepast op elektrische representaties van akoestische signalen. Een spektraalanalyze kan op heel wat verschillende wijzen technisch worden gerealiseerd. De oudste en meest voor de hand liggende -maar daarom niet de eenvoudigste- manier bestaat erin het akoestisch signaal aan een zo groot mogelijke reeks fijn en precies gestemde bandfilters toe te voeren. De momentane waarde van de amplitudes van deze afzonderlijke bandfilters geeft ons dan een beeld van de spektrale samenstrelling van het geluid op dat ogenblik. Blokschematisch gezien (met ekskuus voor het lelijke tekenwerk te wijten aan mijn onhandigheid met muizen...) komt zo'n -parallel werkende spektrum-analyzer er dan uit te zien alsvolgt:

 

De uitgang van elk bandfilter (kan worden opgebouwd met spoelen en kondensatoren ofwel met ‘state-variable’ filterchips zoals de UAF42 van Burr Brown) wordt in dit schema gelijkgericht (hier getekend als een eenvoudige diode) en afgevlakt of -wiskundig uitgedrukt- geintegreerd. (In een praktische realisatie kan bvb. de true rms-konvertor AD736 van Analog Devices gebruikt worden voor dit doel). De aldus ontstane gelijkspanning over de bufferkondensator is een maat voor de sterkte van de overeenkomstige spektraalkomponent in het ingangssignaal.

De precizie van dergelijk opzet staat of valt uiteraard met het aantal bandfilters waaruit de analyzer wordt opgebouwd. Voor praktische toepassingen worden vaak terts-fillters gebruikt (3 per oktaaf, wat ons bij een te dekken audiobereik van 8 oktaven doet uitkomen op 24 bandfilters). Voor professionele toepassingen worden ook vaak filterbanken opgebouwd uit 48 en zelfs 92 bandfilters toegepast. Merk op dat dit opzet in wezen dat van een zuiver parallel werkende analoge komputer is. Het grootste voordeel ervan is de bijzonder hoge omzettingssnelheid die ermee kan worden gehaald. Het nadeel, de prijs en de komplexiteit van de te bouwen filterschakelingen. Het dient hierbij te worden vermeld dat ook een andere -seriele- aanpak toepassing vindt en dat daaraan zelfs op een bepaald gebied voordelen verbonden zijn. Bij een analoge seriele aanpak gaat men uit van een nauwkeurige spanningsgestuurde bandfilter. Dit bandfilter wordt -bij konstant blijvend ingangssignaal- middels een nauwkeurige zaagtandspanning over de gehele te onderzoeken frekwentieband afgestemd. De amplitude van de uitgangspanning van dit bandfilter op elk moment t is dan een korrekte weergave van de sterkte van de spektraalkomponent waarop het bandfilter is afgestemd bij een stuurspanning Ut op zijn kontroleingang. Wanneer we dit signaal op een X-Y oscilloskoopscherm afbeelden dan krijgen we rechtstreeks een spektrumanalyze van het ingangssignaal in beeld. Deze metode is merkelijk goedkoper dar eerstgenoemde maar heeft het nadeel dan ze geen simultane representatie geeft van het spektrum en dat ze mankloopt wanneer het ingangssignaal erg veel (of erg snel in vergelijking met de frekwentie van de zaagtandspanning) in spektrale samenstelling varieert.

Een laatste metode voor spektrumanalyze -maar dit wordt elders in deze kursus uitvoeriger behandeld- bestaat erin uit te gaan van de gesampelde representatie van het ingangssignaal en daarop langs algoritmische weg een Fourieranalyze uit te voeren. Dit heeft echter niets meer te maken met analoge elektronika, het onderwerp van dit hoofdstuk en ik vermeld het dan ook alleen maar 'pro memorie'.

Stellen we ons nu even voor dat we het spektraal verloop van het ene geluid (denk bvb. aan een spreekstem) zouden willen overbrengen op een andere geluid , dan zouden we erin slagen bvb. een tuba een gedicht te laten voorlezen en artikuleren. Precies dit nu is wat een vocoder kan realiseren. De techniek kan echter alleen dan slagen wanneer het geluid waarop we het spektrum van de modulant (in ons voorbeeld de stem) willen toepassen zelf gekenmerkt wordt door een voldoende breed spektrum. Immers stel dat we de spektrale variatie van een stem zouden toepassen op een sinustoon, dat zal het resultaat in het beste geval beperkt blijven tot een kleine amplitudemodulatie van die sinustoon. Dit omdat onze sinustoon zelf helemaal geen spektrum heeft! Hij bestaat immers slechts uit een enkele frekwentie.

Een vocoder -om in te gaan op de praktische opbouw- verkrijgen we wanneer we de eerder behandelde spektrumanalyzer gaan kombineren met een tweede gelijksoortig exemplaar gevoed met een tweede audiosignaal (de 'carrier' of drager) waarbij echter de uitgangen van de filters nu niet naar gelijkrichters en integrators worden gevoerd, maar wel naar de ingangen van evenveel spanningsgestuurde versterkers. De stuurspanning van deze spanningsgestuurde versterkers (VCA's) worden dan afgeleid van de gelijkspanningen geproduceerd door de bandfilters van de modulant.

Een prachtig opzet, niet?

De allerbeste vocoders uit de analoge elektronika bestaan niet alleen uit een erg groot aantal bandfilters, maar laten bovendien ook nog toe om spektraalkomponenten op een willekeurige manier te mappen op de reeks VCA's. Hiervoor is dan een een met snoertjes uitgerust patchboard of schakelmatrix nodig. Hierdoor worden de meest ondenkbare spektrale transformaties mogelijk en kan bij oordeelkundig gebruik een weelde aan nieuw en origineel klankmateriaal ontstaan.

Goedkope analoge vocoders worden tegenwoordig weer -ook als bouwkit- op de markt gebracht door het amerikaanse merk PAIA. (Zo'n 8.000fr). De beste (bvb. Sennheiser) kosten vele honderdduizenden franken...Digitale imitaties -eerder dan implementaties in dit geval- treffen we aan in menige midi effectprocessor zoals bvb. in de goedkope Boss SE50. De instelbaarheid en de real-time mogelijkheden zijn hier echter steeds erg beperkt.

Een volledig blokschema van een vocoder is hierboven weergegeven.Om te schets eenvoudig en overzichtelijk te houden tekenden we zowel voor de modulant als voor de carrier slechts 5 bandfilters. Het zal duidelijk zijn dat bij een praktisch ontwerp, heel wat meer filters nodig zullen zijn. De gelijkrichters -hier slechts als diodes getekend, moeten worden gedacht als aktieve gelijkrichters met integrator opgebouwd uit telkens een enkele op-amp met diode in de feedback-lus. Voor het ontwerpen van de filters kan met profijt gebruik gemaakt worden van de vele ontwerpen voor smalbandige grafische equalisers. Ook uitgaande van kommercieel bestaande equalizers kan vaak relatief goedkoop een vocoder gebouwd worden.

Merk op dat in principe het opzet van een vocoder ook geschikt kan worden gemaakt om akkoorden uit een polyfoon signaal te herkennen. Daartoe zijn dan wel twaalf bandfilters nodig per oktaaf. Willen we zo het hele audiobereik dekken (20Hz-20kHz) dan hebben we tien oktaven x 12 filters = 120 bandfilters nodig! Bovendien mogen we niet zo naief zijn te veronderstellen dat we op deze wijze zomaar een toestel zouden kunnen bouwen dat ons op een display zomaar zou toelaten ook het meest ingewikkelde meerstemmige muzikaal diktee op te lossen. Het toestel kan immers niet wat wij klankkleur noemen onderscheiden van wat wij een samenklank noemen. Dit onderscheid berust immers op een relatief lang leerproces (gehoorvorming) en staat niet los van bekendheid bij de luisteraar met timbrale konstanten (de ons oor bekende klankkleuren van onze muziekinstrumenten). Zelfs heel goed getrainde westerse oren slagen er niet in akkoordische samenstellingen juist te herkennen wanneer zij worden voortgebracht door instrumenten met een spektrale samenstelling die grondig verschilt van het arsenaal klanken waarin zij zijn opgevoed. (Probeer het maar eens wanneer je luistert naar beiaardmuziek of naar gamelans). Dit neemt niet weg dat dergelijk toestel wel degelijk korrekte informatie oplevert, het betekent alleen dat we teveel informatie zullen krijgen omdat de essentiele stap van de datareduktie die fundamenteel is voor het herkennen, hier ontbreekt. Om ook deze stap technisch te implementeren is komputerverwerking aangewezen. Daarbij kan dan gebruik gemaakt worden van vage logika of van neurale netwerken. Op dit gebied en in dit specifieke muzikale toepassingsgebied zijn de resultaten evewel nog steeds niet echt spektakulair te noemen.


Cylonix VocoderSedert ongeveer 1997 zijn voor het PC/MMX/Pentium platform ook vocoders beschikbaar gekomen die geheel in software werden gebouwd. Hierbij gaat het dan om kode die gebruik maakt van de DSP processor op de sound-card in de PC, of in een aantal gevallen zelf om kode voor de pentium processor zelf.

Een voorbeeld daarvan is de vocoder van Cylonix (scherm afgebeeld hiernaast) die via internet verkregen kan worden. We geven hierbij meteen een beeld van de websitepagina via dewelke deze software kan worden verkregen.

THE CYLONIX 18 CHANNEL VOCODER FOR Win95

Now, you too can sound like the Cylons from Battlestar Galactica, and make music as cool as Kraftwerk (well, that part's up to you...) with the new 18 Channel Vocoder program from CYLONIX. This Windows 95 program is a digital emulation of the great analog filter bank vocoders of days gone by. It uses the computational power of Intel Pentium CPUs along with the audio interface capabilities of Creative Labs SoundBlaster boards to bring the joy of vocoding to the masses.

Features of the CYLONIX 18 Channel Vocoder Program

( * indicates feature is available only in the registered version)

IMPORTANT NOTICE: Program Requirements

In order to run the CYLONIX vocoder program you need:

You should have the most recent sound card drivers. These can be obtained from Creative Labs via ftp at ftp://www.creaf.com/pub/creative/drivers/sb16awe/sbw95up.exe Older drivers are likely to cause the program to lock up on occasion.


Click Here to Download Demo! (V1.04) (via internet!)

PROGRAM REGISTRATION

The cost for obtaining the registration code, via email, for the program is currently $30 US.

The cost for obtaining the registered program on floppy disk is currently $35 US.

REGISTRATION PROCEDURE:


Filedate: 950511 - Last Update:98-09-07
Terug naar inhoudstafel kursus: <Index Kursus> Naar homepage dr.Godfried-Willem RAES