Als Formant (von lateinisch formare = formen) bezeichnet man in der Akustik und Phonetik die Konzentration akustischer Energie in einem bestimmten Frequenzbereich. Formanten entstehen beispielsweise in den Resonanzspektren von Musikinstrumenten oder der menschlichen Stimme. Aufgrund der Resonanzeigenschaften eines Instruments (oder des Artikulationsraums) werden bestimmte Frequenzbereiche im Verhältnis zu anderen Frequenzbereichen verstärkt. Formanten sind dabei diejenigen Frequenzbereiche, bei denen die relative Verstärkung am höchsten ist.
Im Kehlkopf oder z. B. im Mundstück eines Blasinstrumentes wird zunächst ein Grundton mit zahlreichen Obertönen produziert. Erst im Klangkörper eines Musikinstrumentes bzw. auf dem Weg zwischen Kehlkopf und Mundöffnung wird aus diesem Spektrum ein Teil der Harmonischen, also Partial- bzw. Teiltöne oder Obertöne und Rauschanteile, gedämpft, ein anderer Teil durch Resonanz relativ gegenüber der Grundfrequenz und gegenüber anderen Obertönen verstärkt. Die Bereiche, bei denen eine maximale relative Verstärkung stattfindet, sind die Formanten. Stimmen und Instrumente besitzen oft mehrere Formantregionen, die nicht direkt aneinander anschließen.
Die Lage und Ausprägung der Formanten prägen maßgeblich die Klangfarbe (Timbre) eines Musikinstruments oder einer Stimme. Durch sie lassen sich Stimmen und auch Musikinstrumente voneinander unterscheiden – etwa die Stimmen zweier Frauen oder eine Geige von einer anderen.
Die Lage der Formanten hängt ab:
Bei der menschlichen Sprache charakterisiert die Lage der Formanten die Bedeutung bestimmter Laute. Anhand der ersten beiden Formanten im Vokaldreieck beziehungsweise im Vokaltrapez lassen sich alle Vokale eines Lautsystems voneinander unterscheiden. Die Vokal-Formantlagen unterscheiden sich von Mensch zu Mensch, besonders zwischen Männern, Frauen und Kindern. Hier folgt eine Tabelle der gemittelten Formantlagen aus dem genannten Vokaldreieck.
Tabelle 1: Gemittelte Formantlagen aus dem Vokaldreieck
Vokal-Formant-Zentren | |||
---|---|---|---|
deutscher Vokal | IPA | Formant f1 | Formant f2 |
U | u | 320 Hz | 800 Hz |
O | o | 500 Hz | 1000 Hz |
å | ɑ | 700 Hz | 1150 Hz |
A | a | 1000 Hz | 1400 Hz |
ö | ø | 500 Hz | 1500 Hz |
ü | y | 320 Hz | 1650 Hz |
ä | ɛ | 700 Hz | 1800 Hz |
E | e | 500 Hz | 2300 Hz |
I | i | 320 Hz | 3200 Hz |
Die ersten beiden Formanten f1 und f2 sind für die Verständlichkeit der Vokale wichtig. Ihre Lage charakterisiert den gesprochenen Vokal, der dritte und der vierte Formant f3 und f4 sind für das Sprachverständnis nicht mehr wesentlich. Sie charakterisieren eher die Anatomie des Sprechers und dessen Artikulations-Eigenarten sowie das Timbre seiner Sprache und variieren je nach Sprecher.[1] Darüber hinaus wird der Charakter einer Stimme noch durch die Grundfrequenz 100 bis 250 Hz und Artikulationseigenarten bestimmt. Die mittlere Sprechstimmlage liegt beim Mann etwa bei 130 Hz und bei der Frau etwa bei 240 Hz [2].
Formanten, die zwischen 1500 und 2000 Hz liegen, bringen die Wirkung des Näseleffekts hervor, was darum Näselformant genannt wird. Wird das Velum geöffnet, treten ein, oft auch zwei Nasalformanten hinzu. Hierzu liegen diverse Untersuchungen vor, die unterschiedliche Nasalformanten ergeben haben. Der erste Nasalformant wird mit Werten zwischen 200 und 250 Hz angegeben, der zweite Nasalformant sehr unterschiedlich mit Werten zwischen 1000, 1200, 2000 und 2200 Hz.
Tabelle 2: Typische spektrale Anhebung (Quint- bis Oktavbreite),
die bei der Tonaufnahme von Gesang und Instrumenten gezielt eingesetzt wird.
Praktische Pegelanhebungen | |||
---|---|---|---|
Hohe Amplitude bei | Klangempfindung | Bemerkung | |
200 bis 400 Hz | sonor | 1. Formant u | |
400 bis 600 Hz | voll | 1. Formant o | |
800 bis 1200 Hz | markant | 1. Formant a | |
1200 bis 1800 Hz | näselnd | 2. Formant ü | |
1800 bis 2600 Hz | hell | 2. Formant e | |
2600 bis 4000 Hz | brillant | 2. Formant i | |
8000 Hz | spitz | diffuse „Höhen“ | |
über 10000 Hz | scharf | Oberton-„Glanz“ |
Grundsätzlich gilt für den Gesang das gleiche wie für die Sprache. Die o. g. Formanten lassen sich besonders gut für tiefe Töne, z. B. gesungen im Schnarrregister zeigen. Aber bereits im höheren Bereich einer Sopranstimme liegt die Grundfrequenz oberhalb der in Tabelle 1 genannten 1. Formantfrequenzen. Bei Frequenzen von z. B. 700 Hz müssten demnach die Vokale u, e und i unverständlich sein und wegen der starken Dämpfung zwischen den Formanten nur schwache, nicht tragfähige Töne bilden. Allerdings sind nach Sundberg die Formanten nicht unabhängig vom Grundton. Diese unabhängige Variation der Formanten wird beispielsweise beim Obertongesang praktiziert. Wenn der Grundton in den Bereich des 1. Formanten fällt oder darüber liegt, dann steigt mit steigendem Grundton auch der 1. Formant. Dieses erzielt die Sängerin, indem sie den Mund weiter öffnet. Diese Anpassung des ersten Formanten bezeichnet man als Formanttuning. Es führt beim i, u, e zu einem Anstieg des 1. Formanten, er liegt bei einer Grundfrequenz von 700 Hz ebenfalls bei etwa 700 Hz. Beim a bleibt er weitgehend konstant. Der 2. Formant sinkt dagegen beim e und i und steigt beim u. Der Anstieg des 1. Formanten geht aber nicht „unendlich“ weiter, im Bereich um h2 und darüber kann man mit weiterem Öffnen des Mundes nichts mehr bewirken. Die Vokale sind bei sehr hohen Tönen nicht mehr unterscheidbar, weil nunmehr die Grundfrequenz immer oberhalb des ersten Formanten liegt und somit der Klangeindruck dieses Formanten verschwindet.
Frequenzen um 3 kHz spielen eine entscheidende Rolle für die Tragfähigkeit einer Stimme. Deshalb nennt man diesen Frequenzbereich Sängerformant. Der Sängerformant ist gut ausgeprägt, wenn in einem gesungenen Ton die Frequenzen in einem breiten Band zwischen 2800 und 3400 eine „relative Stärke“ haben, unabhängig vom Grundton.
Der Begriff Formant wurde 1890 erstmals von Ludimar Hermann in seiner Akustischen Phonetik verwendet, aber erst 1929 von Erich Schumann in seiner Habilitationsschrift in Berlin technisch beschrieben und bildet heute ein breites Forschungsfeld sowohl in analytischen, nachrichtentechnischen wie klangsynthetischen Domänen.