Ein Digital-Analog-Wandler:

Wie funktioniert ein DA-Wandler: Ein Wandler kann man sich als eine elektronische Schaltung vorstellen, die eine Zahl bekommt, und die diese Zahl in eine Spannung umsetzt. Wenn z.B. die Zahl 32000 in 1 Volt umgewandelt wird, und die Zahl 32001 in 1,0001 Volt, dann macht das Signal an dieser Stelle einen Sprung von 1 Volt auf 1,0001 Volt. Wenn nun viele Zahlen kommen (bei CD kommen 44100 Zahlen je Sekunde), dann hat man eine treppenförmige Ausgangsspannung. Wenn man diese Treppenkurve unscharf auf Papier malen würde, so daß man die einzelnen Treppenstufen nicht mehr sehen kann, dann sieht man das Musiksignal. Im Bild unten ist das Signal ein Sinus, der durch viele kleine Treppenstufen dargestellt wird.
 
 

In der Elektrotechnik kann man zeigen:
Die treppenförmigen Sprünge sind aber nichts anderes als eine Summe von unendlich vielen Sinus-Schwingungen mit einem mehrfachen der Grundfrequenz, also das gleiche wie ein unerwünschter Klirrfaktor Bei 44100 Treppen/ Sekunde (für 22050 Herz) haben diese „Klirrschwingungen“ eine Frequenz von 44100 Herz/88200 Herz/120300 Herz..., wobei sie immer schwächer werden. Durch einen Filter der in der elektrischen Schaltung nach dem DA-Wandler ist, versucht man, diese Schwingungen mit Frequenzen größer als 22050 Herz wegzufiltern.
Hören kann man diese Schwingungen mit Frequenzen größer als 22050 Herz sowieso nicht mehr, aber man könnte damit einen Hochtöner zerstören.
Weiterhin kommt erschwerend hinzu, daß diese Treppenstufen nicht exakt Sprünge sind, sondern immer leicht schräg sind.
 

Dieses Foto wurde in der Nähe der höchsten Frequenz, die der Wandler noch bearbeiten kann, aufgenommen. Deutlich sieht man die Schrägen. Diese Schrägen sind im Prinzip ein weiterer "Klirr", der aber durch einen Filter wegefiltert werden kann. Der Filter müßte aber exakt bei 22050 Herz alle Frequenzen die höher sind, abschneiden, und alles durchlassen, was darunter liegt. Das ist technisch aber schwierig.

In der Praxis arbeitet man mit Oversampling. Beispiel 8-fach Oversampling. Da wird jede Treppenstufe in 8 kleine Treppenstufen aufgeteilt. Durch die Verkleinerung der Treppen-Sprünge sind die wegzufilternden Klirr-Anzeile wesentlich geringer. Außerdem sind die Frequenzen, die weggefiltert werden müssen, höher, beim 8-fach Oversampling 8 mal so hoch. Die Frequenz, ab der der Wandler wefiltern muß, liegt bei 8-fach Oversampling bei 160800 Herz. So ein Wandler ist einfacher zu bauen. (Beim Oversampling werden Zwischenwerte "erfunden" (interpoliert), die Qualität hängt also von der Art der Interpolation ab).
 
 

16-Bit/24-Bit/ 1-Bit-Wandler:
Alle Wandler wandeln Zahlenwerte in Spannungen um. bei 16 Bit gibt es 2 hoch 16 Zahlenwerte, entsprechend den Zahlen -32768 bis +32767, bei 24 Bit gibt es 2 hoch 24 Zahlenwerte, also von -8388608 bis +8388607. Auch ein 1-Bit Wandler wandelt solche Zahlen um. Die Wandler unterscheiden sich jedoch in der Art und Weise, wie sie die Zahlen bekommen.
Ein 16-Bit-Wandler bekommt jedesmal, wenn er Daten bekommt, eine Zahl in seinem Zahlenbereich. Bei der CD bekommt er 44100 mal in der Sekunde eine Zahl zwischen  -32768 bis +32767. Bei einem 1-Bit-Wandler muß man auch wissen, mit welcher Bitanzahl das Signal aufgezeichnet ist, z.B. 24 Bit. Da bekommt der Wandler dann einmal eine Startzahl, und danach nur noch, ob die nächste Zahl um eins größer, kleiner oder gleich ist.

Die folgenden Tabelle zeigt wie die Wandler mit verschiedenen Zahlenwerte gefüttert (versorgt) werden:
 
 
Zahlenwerte 16-Bit mit 16-Bit "Versorgung" 16-Bit mit 1-Bit "Versorgung"
1000 1000 1000 (= Startwert)
1001 1001 +1
1002 1002 +1
1003 1003 +1
1003 1003 0
1002 1002 -1
1001 1001 -1
1000 1000 -1
... ... ...

Problematisch ist es aber beim 1-Bit-Wandler, wenn ein  Zahlenwert mehr als 1 vom Vorgängerwert abweicht. Um das zu umgehen, müssen die 1-Bit Wandler viel schneller arbeiten. Es müssen je Zahlenwert viele 1-Bit Sprünge gemacht werden können, um mitzuhalten.
 
Zahlenwerte 16-Bit mit 16-Bit "Versorgung" 16-Bit mit 1-Bit "Versorgung"
1000 1000 1000 (= Startwert)
    +1 
    +1 
    +1
1004 1004 +1
    0
    1
    0
1005 1005 0
... ... ...

Bei der CD mit 16 Bit ist es möglich, einen Sprung von der Zahl -32768 auf +32767 zu machen. Ein 1-Bit-Wandler benötigt hierfür 65535 Sprünge. Wenn man ein Musiksignal hätte, das pausenlos folgende Zahlenwerte hätte:
-32768
+32767
-32768
+32767
-32768
+32767
-32768
+32767
-32768
+32767
-32768
+32767
-32768
+32767
-32768
+32767
Dann würde dieses einen Sinus von 22050 Herz mit voller Aussteuerung entsprechen. Das kommt in der Prasis nicht vor. Mit Computer-Programmen kann man das selbst machen: z.B. mit dem Programm Dart kann man die Zahlenwerte eingeben, die dann in einer WAV-Datei gespeichert werden. Wenn man sich davon eine CD brennt, hat man das. Ob der Hochtöner das noch verkraftet, ist zu bezweifeln.

Wieviel ist ein Bit?
Bei 16 Bit und bei 1 Volt bei Vollaussteuerung entspricht ein Bit einem Pegel von  ca. 0,000.030.518 Volt,        ca.30,51 Mikrovolt
Bei 24 Bit und bei 1 Volt bei Vollaussteuerung entspricht ein Bit einem Pegel von  ca. 0,000.000.059.605,Volt, ca. 0,059 Mikrovolt
 
 
 

Was ist praxisgerecht:
Um ein 16-Bit CD-Signal mit einem 1-Bit-Wandler mit 16 Bit wiederzugeben, das Sprünge wie eben geschildert verkraftet, müßte man einen 1-Bit-Wandler haben, der 65536 mal so schnell abtastet wie der 16-Bit-CD-Wandler. Dann könnte man jeden beliebigen Sprung der CD nachbilden. Aber das will man ja gar nicht. Die CD ist ja nicht das Maß aller Dinge. Gemessen werden muß an der Anforderung, was wiederzugeben ist: Musik, Sprache, Geräusche usw. Da gibt es eine typische Frequenzaufteilung: tiefe Freqenzen sind laut, hohe Frequenzen sind leise, und das gilt es aufzuzeichnen und wiederzugeben.
Wenn man jetzt einen 1-bit-Wandler für eine 16-Bit-Speicherung baut, der z.B. 60 mal so schnell wie bei der CD arbeitet, dann kann man zwar keine Frequenz von 22050 Herz mit voller Aussteuerung wiedergeben, aber das gibt es ja doch nicht und das braucht man nicht. Die Sprünge, die man in den oben beschriebenen Treppenkurven hat, sind jedoch dann nur noch ein sechszigstel so groß wie bei der CD, Das Oversampling ist dann nicht mehr auf das Wiedergabegerät angewiesen, sondern es wird sozusagen schon bei der Aufnahme gemacht.

Warum 24-Bit statt 16-Bit?
Musiksignale sind analog. Wenn man sie analog aufzeichnet, und man bräuchte z.B. eine Spannung zwischen -1 Volt und +1 Volt, um ein Signal darzustellen, dann könnte da jeder Wert dazwischen vorkommen, mit beliebig vielen Nachkommastellen, also z.B. auch 0,436.234.734.654.452.666.123.456.789.543.655... Volt.. Da die Nachkommastellen sozusagen unendlich weitergehen, kann man das nur mit unendlich vielen Bits digital speichern. Bei einer digitalen Speicherung muß man abwägen, was technisch machbar und sinnvoll ist. Im Jahre 1982 war das: 16 Bit mit 44100 Abtastungen/Sekunde. Als Vergleich hatte man die Schallplatte. Dort ist das Rauschen und die anderen Störgeräusche im Bereich von einigen Millivolt, da war die CD mit einer Auflösung von 30 Mikrovolt schon ein riesiger Fortschritt.
Die Technik hat sich aber weiterentwickelt. Mittlerweile haben Verstärker einen Rauschabstand (ca. 120 db), der etwa 20 Bit entspricht. Die Industrie verwendet bei SACD 24 Bit Speicherung. Damit wären Aufnahmen möglich, die man mit den heutigen Verstärkern gar nicht korrekt wiedergeben kann, weil die Signale im Rauschen des Verstärkers untergehen.
24 Bit sind 3 mal 8 Bit, und die 8 Bit sind so eine magische Zahl in der Computertechnik, 8 Bit sind ein Byte.
Mit 24 Bit hat man 256-fache Genauigkeit gegenüber 16 Bit.

Grenzfrequenz:
Wenn man ein Sinus-Signal von 20 Herz bis 20000 Herz digital abtasten will, dann muß man es mit dem doppelten der höchsten Frequenz abtasten, also man muß es 40000 je Sekunde "messen" und in einen digitalen Zahlenwert umwandeln.
Bei der CD wird mit 44100 Zahlenwerten je Sekunde gearbeitet. Wenn man diese Zahlenwerte zurück in ein elektrisches Signal wandelt, dann ist die höchste Frequenz (Grenzfrequenz), die man erzeugen kann, 22050 Herz.
Bei der SACD wird mit 2,8 Millionen Werten je Sekunde gearbeitet. Die Grenzfrequenz liegt demnach theroretisch bei 1,4 MHz. Es gibt keine Musik, die das braucht.Der Grund, warum man eine so hohe Abtastrate gewählt hat, ist ein anderer und aus den oben angeführten Erklärungen ersichtlich und noch der folgende: Die Datenmenge!

Die Datenmenge: Auf einer CD ist nicht unbegrenzt Platz, um Daten zu speichern, vereinfacht gesagt ist Platz für ca. 800.000.000 Millionen Bytes. Das entspricht ca. 74 Minuten Musik im CD Format (16 Bit, 42100 Herz). Das errechnet sich ungefähr so: 44100 16-Bit Zahlen/Sekunde sind 88200 Bytes/Sekunde. Das ganze ist für Stereo mit 2 zu multiplizieren: 176400 Bytes/Sekunde. Bei 74 Minuten = 4470 Sekunden. Für 4470 Sekunden braucht man 4470 mal 176400 Bytes = 788.508.000 Bytes.
Oops, warum steht auf den CD-Rohlingen aber 650 Meg-Bytes, oder 700 Meg-Bytes, aber nicht 800 Meg-Bytes?: ganz einfach: Wenn die CD als Daten-CD für den Computer beschrieben wird, dann muß sie 100%-ig gelesen werden können, es wird ein Aufzeichnungsformat verwendet, das eine Fehlerkorrektur für Fehler (auf der Oberfläche der CD) bis zu einer bestimmten Größe korrigieren kann. Bei Musik-CDs ist es nicht ganz so wichtig, wenn man mal eine Zahl nicht genau lesen kann, dann nimmt man einfach den Mittelwert des letzten Wertes und des nächsten Wertes. Diese Fehler merkt man oft nicht. Diese "Fehlerkorrektur" ist auch von CD-Player zu Player verschieden und ist ein Grund, warum manche CDs auf verschiedenen Playern unterschiedlich klingen, und sind auch der Grund, warum man keinen billigen Player mit einem teuren Decoder verwenden soll, denn wenn der Player die Fehler schlecht korrigiert, dann kann der Decoder nichts dafür, wenns schlecht klingt, er hat es halt nicht besser bekommen. Eine Nebenwirkung der Fehlerkorrektur: Hat man eine CD, die im CD-Player nur mit vielen Fehlern gelesen werden kann, dann kann man evtl. die Fehleranzahl durch eine Kopie dieser CD auf einem PC verbessern: PC-CD-Laufwerke lesen die CD-Audio so wie eine Daten-CD, und können versuchen, defekte Teile der CD so oft zu lesen, bis sie evtl. doch noch das Richtige gelesen haben. Eine davon gebrannte CD kann daher besser sein als die Original-CD. Der CD-Player, der die CD abspielt, kann einen nicht lesbaren Teil nicht bis zum Sankt Nimmerleinstag lesen, weil man die Musik ja anhören will, und die Musik geht ja weiter. Irgendwann ist Schluß und dann hört man die typischen CD-Aussetzer. Es gibt Programme für den PC (CD-Diag), mit denen kann man eine CD lesen, mit abgeschalteter Fehlerkorrektur des PC-CD-Laufwerks, zum Analysieren der Qualität von CDs. Damit kann man die Fehleranzahl feststellen.
Zurück zur Datenmenge:
Wenn man statt 16 Bit mit 24 Bit aufzeichnen würde, dann könnte man nur noch 74:1,5 = 49 Minuten auf eine CD. Wenn man die obere Grenzfrequenz von 22050 Herz auf z.B. 192000 Herz erweitern möchte, also ungefähr auf das 9-fache, dann würden nur noch 5 Minuten auf eine CD gehen. Neue Aufzeichnungstechniken ermöglichen es, mehrere Giga-Bytes auf eine Scheibe zu pressen, bei der DVD sind es ca 10 Giga-Byte je Seite, also 10.000.000.000 Bytes je Seite. Bei Aufzeichnung mit 16-Bit-CD-Technik und 44100 Zahlen/Sekunde würden auf eine CD somit ca. 5668 Sekunden d.h. 15 Stunden auf eine DVD. Das klingt nach viel, ist es aber nicht. Auf einer DVD ist üblicherweise auch noch ein Film drauf, und der Ton mit 5 Kanälen und noch in mehreren Sprachen. Deshalb wird dort gespart: Der Ton wird komprimiert (Zeitschrift c't hat das gut beschrieben, ich glaubte es war im Heft 10/2002). Bei der SACD will man nicht komprimieren, aber trotzdem aufzeichnen mit 24 Bit und 192000 Herz und in 6 Kanälen. Bei der SACD weiß ich nicht, wie hoch die Kapazität ist, aber ich nehme mal an, es ist ähnlich der DVD.  Wieviel Musik kann man bei 24 Bit 192000 Herz und 6 Kanälen auf 10 Gigabyte bringen:
10.000.000.000 / (192000 * 3 Bytes für 24 Bit) * 6 (für die 6 Kanäle) = 10.000.000.000 / 3.456.000 = 2800 Sekunden, also ca. 48 Minuten. Das reicht nicht mal für die 9 Sinfonie vom großen Ludwig Van. Man hat sich dann das folgende einfallen lassen: Wenn man das analoge Musiksignal mit sehr hoher Frequenz abtastst, dann sind die Sprünge zwischen den einzelnen Zahlen relativ klein. Man speichert dann nur noch einen Startwert, und dann nur noch die Veränderungen einer Zahl zur nächsten. Wenn man z.B. den Startwert jede Sekunde neu speichert, und jeweils eine Sekunde lang nur die Veränderungen, die jeweils nur 1 Bit lang sind, dann bräuchte man bei der CD (44100 Zahlen/Sekunde mit je 2 Bytes mal 2 für Stereo) statt 176400 Bytes / Sekunde nur 2 Bytes für den Startwert und (44099 * 1 Bit , wobei 8 Bit = 1 Byte, das ganze für Stereo noch mal 2) = 44099 Bits mal 2 = 88198 Bits = 11924 Bytes, zusammen  mit dem Startwert von 2 Bytes wären das 11926 Bytes im Vergleich zu 176000 Bytes. Kein Wunder, daß die Industrie das sofort verwendet hat: Hörere Abtastraten (192000 Herz), einfacher zu bauende Filter, wesentlich höhere Genauigkeit (24 Bit), und weniger Platz auf dem Datenträger, ohne irgendwelche Komprimierverfahren, es wird Platz frei für noch mehr Kanäle, Texte, Videos.
 

Kommentare/Fehler bitte melden an:  Hifi@jodoin.de