Beschallungs-Tipps.de

Beschallungs-Tipps	Diverse Themen	Links
Raumresonanzen	Allgemeines	Pitch-Tool
Kompressor	*Anfänger*	Kompressor-Tool
Brummprobleme	Workshop Weinsberg	MP3-Play-Tool
Monitoring	FAQ	Impressum Kontakt

Anfänger Home	Dezibel	Leistungsbedarf
Welches Mikrofon	Welches Mischpult	Siderack / Outboard
Verstärker / Boxen	Monitorboxen	*Digital Audio*

Digitale Audiotechnik Grundlagen

In der digitalen Audiotechnik wird der Ton in Computersignale (Zahlenreihe) gewandelt.
Das schafft Vorteile und Nachteile.

Anhand einfachster Erklärungen will ich dir das Thema näherbringen.

Analoge Audiotechnik:

Schall bedeutet, dass die Luft vibriert. Im Mikrofon erzeugt diese Vibration eine elektrische Wechselspannung. Mittels Transistoren werden die Signale verstärkt. Der Klang kann mit elektrischen Bauteilen wie Spulen und Kondensatoren beeinflusst werden.

Digitale Audiotechnik:

Auch hier muss zuerst die Vibration der Luft mittels Mikrofon in eine elektrische Wechselspannung versetzt werden. Es folgt danach nur noch eine einzelne, einfache Transistorschaltung zur Vorverstärkung.
Die so erzeugte Wechselspannung wird danach digitalisiert. Und das Ergebnis ist ganz simpel eine einfache Zahlenreihe. Lautstärke- und Klangveränderungen macht man da mit Rechenleistung. Plus, Minus, Mal und Geteilt - mehr nicht !

Wie muss man sich diese Zahlenreihe vorstellen ?

Angenommen, du erzeugst mit einer Pfeife das folgende Tonsignal:

Rechts Klick = Hören und Download Bild 1: (Audio)

Als digitales Audiosignal würde das so aussehen:

Digitale Audiotechnik gesampelter Sinus Bild 2: (nur Bild)

Die blaue Welle wird nicht komplett übernommen, sondern nur an einigen Stellen, die in diesem Beispiel rot markiert sind.
Es entsteht eine Zahlenreihe, die in diesem Beispiel etwa so aussehen würde:
0 +90 +97 +20 -75 -99 -70 +97 +90 -5 -80 -18 und so weiter.

Im üblichen 16-Bit-Format sind die Zahlenwerte im Bereich von ca. +32700 bis -32700.
(Siehe gleich weiter unten)

In der digitalen Tontechnik entstehen nun zwei wichtige Parameter:

Wie oft wird so ein Zahlenwert pro Sekunde erzeugt:
Samplerate (sprich “Sämplrate”) oder Abtastrate. Anzeige in Kilohertz (kHz).
Für volle Klangqualität brauchst du mindestens 32 kHz, besser 44 oder 48 kHz. Also: in jeder Sekunde werden zum Beispiel 48000 Abtastwerte (Zahlen) erzeugt.
In das Bild oben übertragen bedeutet eine höhere Abtastrate mehr rote Punkte, also mehr Zahlenwerte.
Wie genau ist der Zahlenwert ?
In deiner digitalen Audiodatei findest du diesen Wert als 16 Bit oder 24 Bit.
Audio CDs haben 16 Bit. Das entspricht einer Zahlenreihe, die von etwa +32700 bis -32700 geht. Das ist sehr genau. (“Quantisierung”)

Der bekannteste Parameter ist kBit/s (Kilobit pro Sekunde)

die so genannte Datenrate.
Sie ergibt sich rechnerisch aus den beiden obigen Parametern:
Samplerate mal Quantisierung.
Eine CD liefert etwa 1,4 MegaBit pro Sekunde.
Das ist gleichbedeutend mit etwa 176 KiloByte pro Sekunde (1 Byte = 8 Bit).

In einer MP3-Audiodatei werden nun die Megabit pro Sekunde reduziert, um weniger Speicherplatz zu belegen.
Der Standard, den du aus dem Internet kennst, ist bei MP3 128 kbit/s für Stereo.
Eigentlich ist das keine gute Audioqualität. Besser sind 196 kbit/s oder mehr.

Hauptfehlerquelle 1:

wenn eine Aufnahme nur mit 22 kHz Abtastrate gemacht wird, dann ist der Ton ruiniert. Da hörst du nämlich nur 11 kHz Audio. Das Gehör geht aber bis etwa 15 kHz. Es fehlen also die Höhen. Der Ton wird dumpf.
Außerdem wird die Qualität noch um eine Stufe schlechter, wenn die überflüssigen Höhen bei der (analogen) Vorverstärkung nicht weggefiltert werden.

Hauptfehlerquelle 2:

die Aufnahme wird nur mit 8 Bit anstatt mit 16 Bit quantisiert.
Das führt zu Rauschen und roboterähnlichem Sound.

Hauptfehlerquelle 3:

die 16 Bit werden übersteuert. Digitale Audiosignale dürfen nicht übersteuert werden.
Immer eine ausreichende Reserve lassen.

In einem digitalen Audiomischpult ist oft die digitale Pegelanzeige so, dass die Oberkante auch gleich die absolute Pegelgrenze zeigt. “Vollaussteuerung” eines Kanals ist hier weit unterhalb der Obergrenze.

Vergleich Analoger Pegel - digitaler Pegel:

Pegelanzeige analog Pegelanzeige digital

Bemerkung:

Die digitale Pegelanzeige könnte generell genauso gestaltet werden wie die analoge. Oft trifft man aber diese Variante an, dass 0 dB als Maximalwert dient.

In fertig gemixten Musikstücken ist die Reserve im Pegel (Headroom) meistens sehr klein.

Samplerate (Abtastrate):

So viele einzelne Abtastwerte beinhaltet das digitale Signal pro Sekunde.
Siehe oben, rote Punkte in Bild 2.

Wie hoch sollte die Samplerate sein ?

Mindestens doppelt so hoch wie der höchste Ton, der enthalten sein soll.
Beispiel: Wenn du 16 kHz als Ton noch darstellen willst, dann muss deine WAV- oder MP3-Datei (oder andere) mindestens 32 kHz Samplerate haben.

Und wenn die Samplerate zu klein ist ?

Wenn du deiner Soundkarte einen zu hohen Ton aus dem Mikrofon anbietest, dann wird dein digitales Tondokument eventuell Fehler in den Höhen haben.

Fehler-Beispiel: die Soundkarte soll mit 22 kHz Abtastrate aufnehmen. Das Mikrofon liefert einen Tonanteil bei 15 kHz. Dieser hohe Ton taucht später in deiner Aufnahme bei 7 kHz wieder auf. Grund: alles was über der halben Samplerate liegt, wird gespiegelt.
Abhilfe: die Soundkarte muss die Höhen ab 11 kHz wegfiltern.

Die übliche Bandbreite eines HiFi-Audiosignals geht etwa bis 16 kHz. Das entspricht auch dem höchsten Ton, den ein durchschnittlicher Mensch wahrnehmen kann - wenn er nicht “diskogeschädigt” ist.
Aha, denkt der Anfänger, dann brauche ich mindestens 32000 Abtastwerte pro Sekunde, also eine Samplerate von 32 kHz. RICHTIG, aber auch FALSCH. Die Tonquelle (Mischpult oder Mikrofon) darf hier oberhalb von 16 kHz NICHTS mehr anbieten. Es muss also ein Filter her, das knallhart die Höhen abschneidet. Und das ist keine gute Idee, denn so ein Filter könnte den Sound ganz schön verderben.

Also: vernünftiger ist eine wesentlich höhere Samplerate als rechnerisch nötig.

Audio-CD:

Da ist die Samplerate 44,1 kHz. Es werden also Töne bis etwa 22 kHz noch sauber dargestellt.
Töne mit 28 kHz (aus der analogen Quelle: Mischpult, Mikrofon,...) ergeben zwar einen Fehler, aber dieser Fehler liegt noch oberhalb der hörbaren 16 kHz.

Das Thema Samplerate ist somit im Grundsatz abgehandelt. Es gibt noch wesentlich mehr dazu zu sagen, aber nicht auf dieser Seite für Laien.

0 dBFS (Erklärung):

Diese Angabe taucht sehr oft in digitalen Audiosystemen auf, auch im nächsten Kapitel.
dBFS beschreibt den Pegel des Signals zu einem bestimmten Zeitpunkt, und zwar wird meistens die Spitze des Signals (Peak) angegeben.

0 dBFS hat man bei grösstmöglicher Aussteuerung des Signals.
Das bedeutet: mit der Lautheit des Signals hat dieser Wert nicht viel zu tun.

Bei einer Audio-CD (16 Bit) kann der Ton mit einer Zahlenkette mit Werten von etwa -32760 bis +32760 dargestellt werden. Wenn ein Ton genau an diese Grenze anklopft, dann hat diese Stelle 0 dBFS.
Ein Zahlenwerte von +33000 bis -33000 können mit 16 Bit nicht dargestellt werden.

Bei -6 dBFS ist der Pegel die Hälfte des Maximalwertes. Da gehen die Zahlen von etwa -16380 bis +16380.

RMS in Bezug auf das momentane Thema “dBFS”

In einem nicht-digitalen (analogen) System wird Lautstärke fast nur mit dem RMS-Wert angegeben. Das entspricht dem Effektivwert, auch Durchschnittswert während einer kompletten Welle.

Vereinfacht: drücke eine einzelne Welle platt und schau, wie hoch das entstandene Rechteck ist.

Eine andre Definition (RMS) lautet in etwa: die Leistung, die ein Verstärker in einer bestimmten Zeit (10 Minuten) abgeben kann. Allerdings ist im allgemeinen Gebrauch eher obige Erklärung üblich.

Selbstverständlich kann diese Angabe, RMS, auch in der digitalen Audiowelt benutzt werden. Da muss natürlich auch dieser Wert in dBFS angegeben werden.
Die wichtigere Angabe ist jedoch Peak, weil die Spitzen niemals über die Ränder gehen darf.

An jeder Stelle besteht ein andrer Unterschied zwischen Peak und RMS.
Peak geteilt durch RMS ist der Scheitelfaktor (Crest).

Beachte:
sobald du die Datei abspielst, bekommst du den Pegel (Lautstärke) an einem Messgerät angezeigt.
Nun hat jedes Messgerät, egal ob Mischpult oder Audiosoftware, Reaktionszeiten: wie schnell reagiert die Anzeige auf Pegelsprünge, steigend und fallend. Bei langsamen Anzeigen hast du möglicherweise Verzerrungen, obwohl der “Zeiger” noch nichts ahnen lässt.
Nur die Peak-Anzeige reagiert SOFORT auf steigende Pegel.

16-Bit gegen 24-Bit Quantisierung:

Wie genau wird die momentane Lautstärke eines einzelnen Samplewertes dargestellt?

Mit 16-Bit geht eine Genauigkeit von etwa einem 32760stel des Maximalwertes.
Wie oben beschrieben: Zahlenwerte von etwa plus 32760 bis minus 32760.

Mit 24-Bit wird es noch 256 mal genauer, allerdings nur rein rechnerisch. Grund: so genau kann kein Wandler arbeiten, und auch die Vorverstärker (Transistor) haben wesentlich mehr Eigenrauschen als dass 24 Bit wirklich Sinn machen würde. Trotzdem: 24 Bit entsprechen 3 Byte, und das lässt sich im PC einfacher bearbeiten.

Ein Ton mit -80 dBFS (sehr leise) bekommt bei 16-Bit eine Zahlenreihe mit Werten um plusminus 3.
Ein Ton mit -80 dBFS (sehr leise) bekommt bei 24-Bit eine Zahlenreihe mit Werten um plusminus 840.

Ein AD-Wandler mit 24-Bit macht nur Sinn, wenn er extrem genau arbeitet. Ansonsten liegt die Genauigkeit noch im 16-Bit-Bereich.
Beispiel: Bei meinem Handy-Rekorder kann man zwischen 16 und 24 wählen. Die Genauigkeit (Eigenrauschen) ist bei 24-Bit so hoch, dass 16-Bit noch genau so gut wären. Es wird also Speicherkapazität verschwendet. Dieser Handy-Rekorder (Z) liefert mit 16-Bit übrigens noch stärkeres Eigenrauschen ab.

Wieso muss man so leise Töne noch so genau darstellen können?

Der Fachmann lässt beim Aufnehmen eine sehr grosse Aussteuerungsreserve (Headroom), damit er einzelne, sehr laute Töne original aufnehmen kann. Somit liegt ein sehr leiser Ton dann immerhin noch bei sehr wenigen dBFS.

Und: bei einer Mehrkanal-Aufnahme ist es wichtig, die einzelnen Kanäle so gut wie möglich zu haben, da Fehler sich addieren. Manche sind der Meinung, bis 8 Kanäle reicht 16-Bit.