8. Psychoakustik

8-26

Der unterste (periphere) Verarbeitungsschritt dieser Hierarchie ähnelt einer Kurzzeit-Fourier-

analyse (mit gleichwohl sehr speziellen Parametern). Bereits auf dieser Verarbeitungsebene

werden Teiltöne ausgesondert, deren Energie so gering ist, "dass man ihr Fehlen nicht bemer-

ken würde". Denn nicht jeder Teilton trägt zum Höreindruck bei: Ist sein Schallpegel im Ver-

gleich zu dem seiner spektralen Nachbarn zu gering, wird er unterdrückt, was die Psycho-

akustik

Verdeckung

oder Maskierung nennt. Den nicht- bzw. teilverdeckten Teiltönen wer-

den Spektraltonhöhen zugeordnet, die in höheren Hierarchieebenen gewichtet und zu einer

virtuellen Tonhöhe zusammengefasst werden. Hierbei stört es nicht, wenn der Grundton eines

harmonisch komplexen Klanges im Schallsignal völlig fehlt: So können beim Telefon mit

seiner Bandbegrenzung auf 300 – 3400 Hz die ersten beiden Teiltöne einer Männerstimme

(

= 120 Hz) gar nicht übertragen werden – trotzdem ist die Grundtonhöhe bei Anhören

rekonstruierbar, und es entsteht keinesfalls der Höreindruck eines sprechenden Kindes.

0.5

1.5

0.2

0.4

0.6

0.8

kHz

0.5

1.5

0.2

0.4

0.6

0.8

1.2

kHz

0.5

1.5

0.2

0.4

0.6

0.8

1.2

kHz

Abb. 8.15:

Spektrogramme zweier Tonfolgen; im rechten Bild ist die absteigende Folge frequenzmoduliert.

Eine (von mehreren) Gruppierungsregeln besagt, dass

gleichzeitig

beginnende sinusförmige

Töne, deren Frequenzrelation

ganzzahlig

ist, wahrscheinlich von derselben Schallquelle stam-

men und deshalb zu einem Objekt zu gruppieren sind. Natürliche Schallquellen, und nur mit

diesen konnte das Gehör während seiner Evolution trainieren, erzeugen so gut wie nie reine

Töne. Und sollte es doch einmal vorkommen, es wäre äußerst unwahrscheinlich, wenn im sel-

ben Augenblick noch weitere derartige Schallquellen zu tönen begännen, und überdies noch

in ganzzahliger Frequenzrelation. Wenn folglich ein derartiger

harmonisch-komplexer Klang

ertönt, kann er nur von

einer

Quelle stammen, und deshalb ist es im Sinne der Informations-

reduktion zweckmäßig, die zugehörigen Spektrallinien zusammenzufassen, wie eben auch die

beiden Linien der Buchstaben

oder

als zusammengehörig erachtet werden. Und wie die

visuelle Signalverarbeitung die Überlagerung zweier Buchstaben trennen kann, folgt auch das

Gehör

einem

Sprecher – selbst wenn gleichzeitig noch ein zweiter spricht. Das funktioniert

nicht perfekt, aber erstaunlich gut: Chucks "Long distance information" ist klar zu verstehen,

trotz konkurrierender Begleitinstrumente, und ähnlich ist's bei "O sole mio" und "im fernen

Land". Mehr oder weniger, je nach Orchester und Sänger. Der sich bei "der Gral" schon

mächtig ins Zeug legen sollte, damit das Publikum nicht erstaunt zur Kenntnis nehmen muss,

es sei "der Karl", der dort in der Monsalvat bewacht würde. Denn die Gruppierung der Har-

monischen und somit deren Dekodierung gelingt nicht immer fehlerfrei.

Abb. 8.15

vermittelt

einen Eindruck, welche Schwierigkeiten entstehen können: Im linken Bild ist das Spektro-

gramm einer kleinen zweistimmigen Melodie dargestellt. Schwer zu sagen, welche Linien zu-

sammengehören. Im mittleren Bild mit seinem größeren Frequenzumfang beginnt das Bil-

dungsgesetz sichtbar zu werden, aber erst im rechten Bild herrscht Klarheit: Mit unterschied-

licher Linienstärke und frequenzmodulierter Oberstimme fällt die Trennung leicht. Das Ge-

hör, insbesondere das musikalisch ausgebildete, trennt schon ohne

Vibrato

die beiden Stim-

men in eine auf- und eine absteigende, mit Vibrato geht's noch leichter. Das ist ein Grund,

warum Sänger und Instrumentalsolisten ihre Töne häufig mit Vibrato erzeugen: Sie können

damit leichter aus der Vielfalt der Begleittöne herausgehört werden. Da die Modulation aller

(Solisten-) Teiltöne gleichartig verläuft, erhält das Gehör eine Gruppierungshilfe.