Digitalisierung von Zeitungsarchiven


Digitalisierung

Archiv

Vermarktung

Zeitung

Zeitungsarchiv: Zukunftssicherung und Vermarktung dank Digitalisierung

 

Der Kunde:
Die Archive von Zeitungen stellen wahre Schatzkammern für die Zeitgeschichte dar. Sie bestehen entweder schier unendlich langen Reihen mit dicken Folianten, in denen die einzelnen Zeitungen gebunden sind. Hinzu kommen Zeitungen auf Mikrofilm, lange Zeit das Sicherungsmedium Nummer eins. Vorteil: Sie sind unabhängig von Software und damit können sie jederzeit gelesen werden. Der Nachteil: Zum einen haben die Aufnahmen oft eine sehr schlechte Qualität, zum zweiten sind sie nicht durchsuchbar. Wer also einen bestimmten Artikel sucht oder gar ganze Themen recherchieren möchte, braucht viel Zeit und Geduld.

Die Zeitungsverlage selbst haben nicht nur ein Interesse daran, diese Schätze in ihren Archiven zu erhalten, sondern auch für Recherche und Vermarktung zugänglich zu machen. So auch in diesem Fall: Der Kunde, ein großer Regionalverlag, möchte sein komplettes Archiv aus über 100 Jahren digitalisieren lassen.

Die Problemstellung:
Die Digitalisierung bedeutet in erster Linie einen sehr hohen Aufwand. Denn es liegen beim Kunden mehr als eine halbe Million Zeitungsseiten vor, die digitalisiert werden sollen. Zum zweiten weisen nicht alle vorhandenen Zeitungen die gleichen Ausgangsbedingungen vor. Den einfachsten Fall stellen die Zeitungen dar, die beim Kunden selbst im Archiv lagern. Sie sind monatsweise in großen Büchern gebunden, dürfen von dort entfernt werden und durch einen Buchbinder mit einem Stapelschneider getrennt werden. Selbstverständlich werden sie hinterher wieder gebunden. Den zweiten Bereich stellen die Zeitungen dar, die vom Verlag in ein Archiv bei einem Museum ausgelagert wurden. Diese Zeitung sind ebenfalls in Buchform gebunden, dürfen jedoch weder entfernt noch zerschnitten werden. Der dritte Fall schließlich sind die Zeitungsseiten, die als Mikrofilm vorliegen. Viertens und letztens schließlich gibt es Zeitungsausgaben, die bereits als Druck-PDF vorliegen.

Eine letzte Besonderheit lag in der Tatsache, dass die Geschichte des Zeitungsverlages weit über 100 Jahre zurückreicht. Deshalb waren etwa die Hälfte der Seiten in der Frakturschrift gedruckt, die lange Zeit als die Standardschrift im Zeitungsdruck galt.

Das Ziel des Verlages ist es, mit diesen unterschiedlichen Ausgangsvoraussetzungen die Digitalisierung umzusetzen und eine möglichst hohe Qualität zu erzielen. Dabei geht es um die Durchsuchbarkeit und eine spätere Vermarktung der einzelnen Artikel.
 

Die Lösung:
Für die unterschiedlichen Ausgangsvarianten werden verschiedene Scanmethoden gewählt. Die Zeitungen, die aus dem Archiv entfernt und geschnitten werden dürfen, werden mithilfe eines Hochleistungsscanners in einer Auflösung von 600 dpi gescannt. Die übrigen Seiten in Buchform, die nicht entfernt und geschnitten werden konnten, wurden mit einem Buchscanner gescannt. Das Ergebnis ist hier nicht ganz so gut wie beim ersten Fall. Vor allem kann es passieren, dass der Text am Rand nicht gut zu lesen ist. Für die dritte Variante schließlich, die Mikrofilme, standen ebenfalls Spezialscanner zur Verfügung.

Das Ergebnis aller Scanprozesse waren tiff-Dateien, je nach Farbvariante zwischen acht und 30 Mbyte groß . Da die Seiten teilweise vergilbt waren oder Flecken aufwiesen, wurden alle Dateien mit Photoshop nachbearbeitet. Im nächsten Schritt wurden die Dateien mittels OCR eingelesen und in Text verwandelt. Für wichtige Texte und Überschriften wurden Double OCR and Compare sowie eine manuelle Korrektur ergänzt. Das galt vor allem auch für die Seiten in Frakturschrift.

Nach der Texterstellung und Korrektur wurden für den Kunden zwei Varianten von PDFs erstellt: Ein hochauflösendes PDF mit 300 dpi, mit dem der Nachdruck von Seiten möglich ist und ein PDF mit geringer Auflösung für die Darstellung im Web. Beide Varianten sind suchfähig und können deshalb zu Recherchezwecken dienen.

Aus diesen PDF-Dateien wurden außerdem Artikel XML-Dateien mit Metadaten erstellt. Das versetzte den Kunden in die Lage, die Artikel in seine internen Datenbanken einzugeben und eine Verschlagwortung für eine Volltextsuche zu ergänzen.

Die Vorteile:
Für den Kunden hat die Digitalisierung mit tool-e-byte mehrere Vorteile: Zum einen sind solche Projekte aufgrund ihrer Größe intern nicht in einem überschaubaren Zeitrahmen umzusetzen. Auch hat kaum ein Verlag Zugriff auf entsprechendes Personal. Die externe Lösung bietet hier einen erheblichen Zeit- und Kostenvorteil.

Zum zweiten sichert der Verlag damit die Inhalte gegen Zerstörung und Alterung und macht sein Archiv zukunftssicher. Er eröffnet sich auch die Chance auf die Vermarktung der einzelnen Artikel. Wer beispielsweise zu einem Geburtstag oder Jubiläum eine bestimmte Zeitungsseite verschenken möchte, kann diese individuell in Originalqualität nachdrucken lassen. Die Digitalisierung der Artikel macht sie außerdem schnell und einfach für Forschung und Recherche zugänglich und bietet auch so einen zusätzlichen Vermarktungskanal.

PDF Herunterladen