Kompakt Audio Kassetten digitalisieren

Über die Weihnachtstage habe ich endlich meine liebsten alten Tonkassetten vor dem Verfall gerettet. Wer sich die Bewahrung seiner analogen Kindheits- oder Jugendschätze ebenfalls jahrelang schon vorgenommen, aber noch nie in Angriff genommen hat, findet im Beitrag hoffentlich eine Hilfestellung. So schwer ist es nicht, was Hörbares herauszubekommen.

Das Schöne an einer Kompaktkassette ist, dass es nur einen Standard gab. Alle Kassetten waren gleich groß, wurden immer mit derselben Geschwindigkeit aufgenommen und können somit heute auf einem beliebigen Kassettenrekorder wieder abgespielt werden.

Verwenden Sie bitte keinen sog. „USB-Kassettenspieler“ für 29,95 Euro, sondern ein klassisches, hochwertiges Analogerät. Die besseren Kassettenspieler sind als sog. Tapedecks Teil einer Hifi-Stereo-Anlage. Sie haben auf der Rückseite meist weiß-rote, runde Chinch-Buchsen, die zum Verstärker gehen. Im besten Falle finden Sie über den Buchsen die Bezeichnung „LINE“. Das bedeutet, dass hierüber ein standardisiertes Audiosignal mit genügend Power für die Aufnahme ausgegeben wird. Es ist dem eher schwachen Ausgangssignal der Kopfhörerbuchse in jedem Fall vorzuziehen.

Wenn es nicht anders geht, verbindet man zum Überspielen die beiden Chinch-Ausgänge via Y-Kabel mit dem 3,5mm-Eingang der Soundkarte im PC oder Laptop, was nicht nur wegen der heutzutage kombinierten Headset-Buchse keine besonders gute Wahl ist. Außerdem sind die Soundchips im Computer meist nicht besonders hochwertig und verrauschen/verknistern das Eingangssignal deutlich.

Deshalb empfiehlt sich ein spezialisiertes Audio-Interface. Das kann leise Signale nämlich sehr rauscharm verstärken. Ich habe meinen mobilen Tascam-Recorder verwendet, der allerdings recht teuer ist. Wenn Sie so etwas nicht besitzen, empfiehlt sich ein Besuch im örtlichen Medienzentrum. Nach der Digitalisierung werden verbliebene Artefakte später vorsichtig per Schnittsoftware soweit rausgenommen, dass der Charakter des Originals nicht verändert wird: Niemand will sich schließlich anhören, wie Marlene Dietrich im Blauen Engel plötzlich in „CD-Qualität“ singt…

Bild: DPA

In meinem Beispiel wird deshalb die im kollektiven deutschen Ohr verhaftete Reportage des Sportreporters Herbert Zimmermann vom Weltmeisterschafts-Endspiel 1954 in Bern von Kassette auf Computer überspielt. Meine Aufnahme ist dabei gar nicht so alt: Es handelt sich um einen Mitschnitt der Wiederholung des Spiels im Deutschlandfunk von 2004. Der DLF-Sendeturm ist hier in der Kölner Südstadt quasi in Sichtweite und die UKW-Ausspielung klang wahrscheinlich um einiges besser als die 50 Jahre ältere Originalübertragung auf Mittelwelle. (Zum Glück hatte man beim NWDR die Reportage damals auf Schallplatte aufgenommen, so dass sie heute noch gesendet werden kann.)
Ich habe zur Aufnahme am 4. Juli 2004 eine Standard-Ferrit („Ferro“, Typ-I, richtiger Schalter!) Kassette in einem recht billigen Küchenradio-Kombigerät verwendet. Ich denke mal, über 9-10 kHz kam der nicht hinaus. Aber meine Ohren werden ja auch älter. Und da das Original sowieso in Mono und vom Frequenzspektrum auch eher überschaubar ist, konnte auf „Tapedeck-Features“ wie bsp. Dolby B/C verzichtet werden. Das hätte die Reportage nur dumpf und muffig gemacht. Außerdem geht die Brillanz verloren und eine Kassette hat nun einmal ein Grundrauschen.

Ans Werk: Vor dem Einlegen der Kassette wird der Tonkopf des Kassettendecks mit Alkohol gereinigt. Dazu eignen sich die kleinen Wattestäbchen aus dem Badezimmer. Spezialwerkzeuge wie eine „Entmagnetisierdrossel“ habe ich nicht. Zur Sicherheit lege ich erst einmal eine andere Kassette ein, deren Verlust ich leichter verschmerzen kann.

Die Endspiel-Kassette hat recht lange in meinem Zimmer gelegen, so dass ich sie erst einmal mit einem Bleistift gegen Bandsalat straffe. Anschließend wird sie im Kassettendeck einmal komplett vor- und zurückgespult, um durch ein Aneinanderkleben des Magnetbandes Gleichlaufschwankungen zu verhindern.

Das Tapedeck wird dann über besagten LINE-Ausgang zunächst mit dem LINE-IN des Aufnahmegeräts verbunden und über einen am Aufnahmegerät (nicht Abspielgerät! Quasi Hinterbandkontrolle) mit einem Studiokopfhörer probegehört. Dasselbe wird alternativ mit den beiden XLR-Eingängen für die Mikros wiederholt, die „auf Stimme“ optimiert sind und das Eingangssignal hörbar besser hochziehen können. Ich entscheide mich für die XLR-Variante. Das sieht dann so aus:

Ganz gleich, ob Sie in den PC oder einen (mobilen) Rekorder aufnehmen: Das Eingangssignal (PCM) muss vom Soundchip vor der Wandlung abgetastet werden. Dabei muss dieser Chip min. 44100 mal pro Sekunde (CD, PC/MAC), alternativ 48000 mal (Video) nachschauen, wie laut/stark das Signal denn zum Abtastzeitpunkt gerade ist. Diese Hertz-Zahl steht als Parameter in den Einstellungen der Soundkarte.
Der Kanalwert „Stereo“ kann bleiben, obwohl es sich im konkreten Fall um eine Mono-Aufnahme handelt. Wir erhalten also durch die beiden Kanäle später auch die doppelte Dateigröße.
Vergrößern würde ich die Bit-Anzahl von 16 auf 24. (Mehr bringt m.E. nichts außer Datenbergen). Hier wird festgelegt, mit wie viel Daten (in wie viel Bits) das Audiosignal bei der Digitalisierung abgespeichert wird. Mit mehr Daten können die Algorithmen der Schnittsoftware später auch mehr anfangen.
Im Endeffekt wird für unsere Aufnahme also eine Datei zwischen 1,5 und 2 GB rauskommen.

Da mein Rekorder das digitalisierte Signal auch gleich als handliche Audiodatei abspeichert, muss ich ihm vorher verbieten, diese Datei in komprimierter Form (mp3, m4a …) abzulegen: Audio ist vor seiner Bearbeitung stets unbehandelt als wav (Mac: aiff) zu speichern.
Ein Vorteil von spezialisierten Audio-Interfaces gegenüber PC-Soundkarten sind neben den viel besseren Vorverstärkern die integrierten Features wie bsp. Limiter und Expander, die sich das Signal vor der Wandlung näher anschauen. Gerade bei der vorliegenden Aufnahme wird der Reporter im Eifer des Gefechts („Tor! Tor! Tor! Tor! Tor für Deutschland“) sehr abrupt lauter, was dann zu einer Verzerrung führen würde. Im Gegensatz zu einem analogen Band, das in solchen Fällen „in die Sättigung fährt“ ist eine digitale Aufnahme an dieser Stelle schlichtweg kaputt.

Die Kassette wird angespielt und das Signal im Rekorder auf mittlerer Stufe bei -6dB eingepegelt. (Später setzte ich davon ausgehend den Auto-Limiter). Im 5-Minuten-Test leiert die Kassette zum Glück nicht, das Band wird also sauber transportiert. Die Aufnahme beginnt mit der Ansage vom damaligen Sportchef Robert Lemke an die Westdeutschland angeschlossenen Sender. Lemke macht dann in der Kabine (?) Platz für Zimmermann, der die Hörer sehr zurückhaltend auf den historischen Tag einstimmt (die Deutschen hatten gegen den Finalgegner in der Vorrunde noch haushoch verloren und nichts anderes wurde für diesen regnerischen Sonntag erwartet).
Nach 45 Minuten ist die erste Seite der 90min-Kompaktkassette passenderweise mit dem Halbzeitpfiff zu Ende (Damals gab es weniger Unterbrechungen, weil bsp. nicht ausgewechselt wurde. Wer verletzt wurde, musste direkt runter oder weiter humpeln). Die zweite Seite endet einige Minuten nach dem Schlusspfiff. Es ist noch die Nationalhymne zu hören, bei der sich das Schweizer Fernsehen damals ausblendete: Die Zuschauer sangen seit Kriegsende verbotene erste Strophe. Anekdote am Rande: Ich habe im HDG Bonn einmal Rudi Michel getroffen, einen der damaligen vier Reporter in Bern. Dessen einfache Erklärung: Die dritte Strophe war erst Ende 1953 verbindlich festgelegt worden. Wußten im Juli 1954 die wenigsten (im Stadion). Klammer zu.

Nachbearbeitung am PC:
Ich benutze die Gratis-Software Audacity. Die kommt mit dem Schnitt (bsp. die Pause beim Umdrehen der Kassette) gut klar. Wichtig: Schnittstellen markieren und dann Z drücken, um genau die Null-Linie zu treffen. „c“ gibt eine akustische Vorschau auf den Schnitt. Den Rauschanteil könnte man über das Rauschprofil im Effekte-Menü zwar etwas verringern, aber das würde der Aufnahme, die sich ja nur im Frequenzbereich der menschlichen Stimme (Zimmermanns) bewegt, ihren Charakter nehmen. Der Punkt „Ansicht–>Übersteuerungen anzeigen“ sollte ausgewählt und keine rote „Ausreißer“ in der Aufnahme zu sehen sein. Danach sind mit dem Hüllkurven-Werkzeug die signifikanten Spitzen etwas nach unten zu ziehen, denn an ihnen würde sich die abschließende Normalisierung orientieren und damit nutzlos sein. Im Equalizer ziehe erhöhe ich den Frequenzbereich der Stimme etwas und nehme ein leichte Dynamikanpassung vor. Den Schluss bildet der Export bsp. ins mp3-Format, wobei sie die Metadaten wie Titel usw. angeben.

ToDo:
Ggf. Denoiser beschreiben, der das Rauschsignal einigermaßen verträglich rausnimmt.