8. Psychoakustik
© M. Zollner 2004 - 2009
8-26
Der unterste (periphere) Verarbeitungsschritt dieser Hierarchie ähnelt einer Kurzzeit-Fourier-
analyse (mit gleichwohl sehr speziellen Parametern). Bereits auf dieser Verarbeitungsebene
werden Teiltöne ausgesondert, deren Energie so gering ist, "dass man ihr Fehlen nicht bemer-
ken würde". Denn nicht jeder Teilton trägt zum Höreindruck bei: Ist sein Schallpegel im Ver-
gleich zu dem seiner spektralen Nachbarn zu gering, wird er unterdrückt, was die Psycho-
akustik
Verdeckung
oder Maskierung nennt. Den nicht- bzw. teilverdeckten Teiltönen wer-
den Spektraltonhöhen zugeordnet, die in höheren Hierarchieebenen gewichtet und zu einer
virtuellen Tonhöhe zusammengefasst werden. Hierbei stört es nicht, wenn der Grundton eines
harmonisch komplexen Klanges im Schallsignal völlig fehlt: So können beim Telefon mit
seiner Bandbegrenzung auf 300 – 3400 Hz die ersten beiden Teiltöne einer Männerstimme
(
f
G
= 120 Hz) gar nicht übertragen werden – trotzdem ist die Grundtonhöhe bei Anhören
rekonstruierbar, und es entsteht keinesfalls der Höreindruck eines sprechenden Kindes.
0
0.5
1
1.5
0
0.2
0.4
0.6
0.8
1
kHz
s
0
0.5
1
1.5
0
0.2
0.4
0.6
0.8
1
1.2
kHz
s
0
0.5
1
1.5
0
0.2
0.4
0.6
0.8
1
1.2
kHz
s
Abb. 8.15:
Spektrogramme zweier Tonfolgen; im rechten Bild ist die absteigende Folge frequenzmoduliert.
Eine (von mehreren) Gruppierungsregeln besagt, dass
gleichzeitig
beginnende sinusförmige
Töne, deren Frequenzrelation
ganzzahlig
ist, wahrscheinlich von derselben Schallquelle stam-
men und deshalb zu einem Objekt zu gruppieren sind. Natürliche Schallquellen, und nur mit
diesen konnte das Gehör während seiner Evolution trainieren, erzeugen so gut wie nie reine
Töne. Und sollte es doch einmal vorkommen, es wäre äußerst unwahrscheinlich, wenn im sel-
ben Augenblick noch weitere derartige Schallquellen zu tönen begännen, und überdies noch
in ganzzahliger Frequenzrelation. Wenn folglich ein derartiger
harmonisch-komplexer Klang
ertönt, kann er nur von
einer
Quelle stammen, und deshalb ist es im Sinne der Informations-
reduktion zweckmäßig, die zugehörigen Spektrallinien zusammenzufassen, wie eben auch die
beiden Linien der Buchstaben
L
,
V
oder
T
als zusammengehörig erachtet werden. Und wie die
visuelle Signalverarbeitung die Überlagerung zweier Buchstaben trennen kann, folgt auch das
Gehör
einem
Sprecher – selbst wenn gleichzeitig noch ein zweiter spricht. Das funktioniert
nicht perfekt, aber erstaunlich gut: Chucks "Long distance information" ist klar zu verstehen,
trotz konkurrierender Begleitinstrumente, und ähnlich ist's bei "O sole mio" und "im fernen
Land". Mehr oder weniger, je nach Orchester und Sänger. Der sich bei "der Gral" schon
mächtig ins Zeug legen sollte, damit das Publikum nicht erstaunt zur Kenntnis nehmen muss,
es sei "der Karl", der dort in der Monsalvat bewacht würde. Denn die Gruppierung der Har-
monischen und somit deren Dekodierung gelingt nicht immer fehlerfrei.
Abb. 8.15
vermittelt
einen Eindruck, welche Schwierigkeiten entstehen können: Im linken Bild ist das Spektro-
gramm einer kleinen zweistimmigen Melodie dargestellt. Schwer zu sagen, welche Linien zu-
sammengehören. Im mittleren Bild mit seinem größeren Frequenzumfang beginnt das Bil-
dungsgesetz sichtbar zu werden, aber erst im rechten Bild herrscht Klarheit: Mit unterschied-
licher Linienstärke und frequenzmodulierter Oberstimme fällt die Trennung leicht. Das Ge-
hör, insbesondere das musikalisch ausgebildete, trennt schon ohne
Vibrato
die beiden Stim-
men in eine auf- und eine absteigende, mit Vibrato geht's noch leichter. Das ist ein Grund,
warum Sänger und Instrumentalsolisten ihre Töne häufig mit Vibrato erzeugen: Sie können
damit leichter aus der Vielfalt der Begleittöne herausgehört werden. Da die Modulation aller
(Solisten-) Teiltöne gleichartig verläuft, erhält das Gehör eine Gruppierungshilfe.