Erst moderne Digitalisierungs-Software macht intuitives Arbeiten möglich

Erst moderne Digitalisierungs-Software macht intuitives Arbeiten möglich

In den vergangenen Jahren haben sich die Hersteller von Buchscannern meist darum bemüht, allen Wünschen und individuellen Anforderungen ihrer Kunden gerecht zu werden. Das Ergebnis sind teils nutzerunfreundliche Scanclients der jeweiligen Digitalisierungs-Software – mit einer unübersichtlichen Vielzahl an Funktionen, die in der Praxis de facto selten zum Einsatz kommen. Zahlreiche Menüs, Untermenüs und Eingabefelder erlauben zwar zahlreiche Konfigurationsmöglichkeiten, bringen beim eigentlichen Scanprozess aber Nachteile in der praktischen Handhabung mit sich.

Die von verschiedenen Scanner-Herstellern angebotenen Lösungen im Hard- und Softwarebereich reichen tatsächlich den Anwendern und Verantwortlichen großer und kleiner Digitalisierungsprojekte oftmals nicht aus. Für sie wichtige Funktionalitäten für eine wirtschaftliche und effizienten Projektabwicklung stehen nicht zur Verfügung. Die Bielefelder Spezialisten Walter Nagel GmbH & Co. KG hat Software, Zubehör und Materialien entwickelt, die die Arbeit mit Scannern schneller, einfacher, bestandsschonender und ergonomischer gestalten sollen. PictureSafe hat sich daher entschieden „multidotscan“ (MDS) der Bielefelder Entwickler als Software zu nutzen.

Sie steuert unterschiedliche Buchscanner und ersetzt damit die individuelle Steuerungs- und Capturing-Software des jeweiligen Herstellers. Die Steuerung findet nicht durch zusätzliche Devices wie Maus oder Tastatur  und umfangreiche Menüstrukturen statt,  sondern wird via Touchscreen erledigt. Die Oberflächen und workflowspezifischen Funktionalitäten können individuell gestaltet und konfiguriert werden.

Integration als oberster Gesichtspunkt

Die Benutzeroberflächen können unter ergonomischen Gesichtspunkten und für den Operator optimiert auf dem Bildschirm angeordnet werden. So kann jeder neue Mitarbeiter nach einer kurzen Einweisung unmittelbar mit der Digitalisierung beginnen. Das Scanpersonal muss sich also nicht mehr mit den verschiedenen Scanoberflächen beschäftigen. Die Bezeichnung, optische Gestaltung, Größe, Anzahl und Anordnung der Funktionselemente auf der Oberfläche des Touchscreen können eigenständig vom Administrator des Kunden angepasst werden.

Die Voreinstellungen werden automatisch geladen und der Operator kann Projektvorgaben umsetzen . So kann beispielsweise die Auflösung oder Farbeinstellung nur mit administrativer Berechtigung verändert werden. Die in Workflow-Definitionen hinterlegten Scanprofile garantieren ein ergebnissicheres aber auch effektives Arbeiten. Fehlerquellen werden so entweder komplett vermieden oder minimiert, wodurch sich der Aufwand für Nachscans und Reklamationen erheblich reduziert.

Scans von kameragesteuerten Digitalisierungs-Systemen ziehen oft aufwändige Nachbearbeitungsprozesse nach sich. Multidotscan ermöglicht die Einbindung von Fachkameras und sorgt für einen effizienten Scanprozess, bei dem alle Scans direkt konvertiert, geschnitten, ausgerichtet und mit einem Farbmanagement ausgestattet werden, so dass die manuelle Nachbearbeitung reduziert werden.

Die Software der Bielefelder Spezialisten ist hervorragend in die technische Infrastruktur von Digitalisierungs-Unternehmen integrierbar. Scansysteme unterschiedlicher Hersteller können mit einer einheitlichen Applikation bedient und gesteuert werden.
 Zusätzliche Module erlauben darüber hinaus die Anbindung an DWork, Subito oder Visual Library. Bereits vorhandene Digitalisate aus früheren Projekten können in multidotscan importiert, aufbereitet und an die gerade eingesetzten Systeme übergeben werden. So wird jeder Scanner zu einem „multifunktionalen Arbeitsplatz“, an dem alle Anwendungsszenarien und Digitalisierungsdienste zentral gesteuert werden können.

OCR – Mustervergleiche und Texterkennung. Wie aus Dokumenten durchsuchbare Datenbanken werden

OCR – Mustervergleiche und Texterkennung. Wie aus Dokumenten durchsuchbare Datenbanken werden

Damit Informationen aus alten Dokumenten aller Art in IT-Systemen verarbeitet werden können, reicht es nicht, Dokumente einfach nur einzuscannen. Denn der Scan, beziehungsweise das Resultat wie ein TIF oder PDF, sie sind immer nur eine Bildkopie – ob als Rastergrafik oder im Postscript beschrieben. Nicht mehr und nicht weniger … letztlich eine Ansammlung schwarzer, weißer oder farbiger Bildpunkte. Die OCR (die „Optical Character Recognition“) steht für den nächsten wichtigen Schritt: Einzelne Buchstaben erkennen und diese zu Wörtern und anschließend zu logischen Sätzen zusammen zu setzen – das Bild wird in einen Text übersetzt.

Auch wenn automatische Texterkennung und OCR oft synonym verwendet werden, handelt es sich bei OCR eigentlich nur um den Mustervergleich. Dabei werden Textblöcke von graphischen Elementen unterschieden, anschließend werden die Zeilen und Wörter, am Ende die Buchstaben separiert. Die Entwicklung ist mittlerweile weit fortgeschritten, denn OCR kann nicht nur Standardschriften, sondern teilweise sogar Handschriften erkennen.

Hochentwickelte, leistungsstarke OCR-Software erspart viel Zeit und Aufwand bei der Erstellung, Verarbeitung und Wiederverwendung vieler unterschiedlicher Dokumente. Besonders bei der digitalen Bestandserhaltung, beziehungsweise der immer wichtiger werdenden Zugriffsmöglichkeiten auf digitale Archive, ist ein Verzicht auf OCR schlicht nicht mehr denkbar.

Wie die digitale Schrifterkennung funktioniert

Einmal abgesehen von speziellen Dokumenten mit Frakturschrift oder gar Handschrift, folgt die Texterkennung im allgemeinen einen festen Ablauf: Als allererstes macht die Software eine Layout-Analyse und guckt sich den Seitenaufbau an, trennt dabei Bilder von Text. Sie merkt sich auch deren Position auf der Seite und einzelne Elemente wie Seitennummern werden punktgenau gespeichert.

Als Nächstes werden die einzelnen Textblöcke angegangen und diese wiederum in Sätze zerlegt. Die Sätze werden dann in einzelne Wörter runtergebrochen und die Wörter dann in Buchstaben. Nun kommt die Datenbank der OCR-Software ins Spiel, die Muster von Buchstaben und Zeichen enthält. Das Programm vergleicht die eingescannten Buchstaben mit diesen Mustern und sobald sie sich zu 99 Prozent ähneln, entscheidet der Algorithmus, dass es wahrscheinlich dieser Buchstabe oder jene Zahl sein muss.

Diese Vorgehensweise ist so präzise, da die Software viele Muster in kurzer Zeit vergleichen kann. Eine Trainingsphase mit manuellen Korrekturen durch die Operatoren verbessert noch die interne Musterdatenbank und damit das Ergebnis. So gelingt auch zum Beispiel problemlos die Unterscheidung zwischen der Zahl „8“ und dem großen „B“. Was erkennbar ein durchaus schwerer Fall ist.

Anschließend werden die erkannten Buchstaben wieder zu Wörtern kombiniert und zurück in ihre Stelle im Satz eingeordnet. Aber Vorsicht, damit ist keinerlei Inhaltlichkeit verbunden – heißt, die OCR-Software kann nicht entscheiden, ob das, was sie „herausbekommen“ hat, auch wirklich Sinn ergibt. Was nicht bedeutet, dass zukünftige Generationen in ein paar Jahren mit Hilfe der künstlichen Schritt diese Schwelle auch noch überwinden werden.

Können ganze Museen und Kunstschätze durch Digitalisierung gerettet werden?

Können ganze Museen und Kunstschätze durch Digitalisierung gerettet werden?

2003 gab es eines der größten Desaster in der Kunstgeschichte: Nach der Invasion durch die amerikanischen Truppen wurde unter anderem das irakische Nationalmuseum sehenden Auges von Räubern geplündert. Und damit ein Weltkulturerbe in Teilen unwiederbringlich zerstört. An der Stelle darf man dann sicher fragen, ob nicht eine Digitalisierung zumindest viele Dinge gerettet hätte – auch wenn natürlich insgesamt das Original zweifellos unersetzlich bleibt.

Auch in Deutschland hatte wir ja die Situation, dass mit der „Herzogin Anna Amalia Bibliothek“ in Weimar ein Weltkulturerbe zum Teil endgültig zerstört wurde. Geschätzt 30.000 Bücher sind verbrannt und der gerettete Teil musste jahrelang und mit großen Kosten restauriert werden. Das eingestürzte Stadtarchiv in Köln wollen wir hier gar nicht thematisieren. Egal ob 3D wie Bagdad oder Manuskriptseiten wie in Weimar, könnte man von einer Rettung der Bestände sprechen, wenn man solche einmaligen Exponate digitalisiert?

Klar ist, das neben diesem Aspekt der Sicherung von Beständen, vor allem auch Kunst, Literatur, ganze Archive einem breiten Publikum und nicht nur wenigen Forschern zur Verfügung gestellt werden sollen. Daher kommt es darauf an, in jedem Fall ein Problembewusstsein hinsichtlich der Langzeitverfügbarkeit und Langzeitbewahrung digitaler Daten zu schaffen. Was vielleicht gestern noch als gerettet galt, kann heute schon durch eine eher mittelprächtige Planung in seiner Nutzung und Verfügbarkeit obsolet sein.

anna_amalia_bibliothek nach wiederaufbau

Zukunftssicher digitalisieren und archivieren

Wie schnell sich die Technik entwickelt und verändert und wie rasch dadurch Fehlentscheidungen getroffen werden können, zeigt das „The Virtual Museum Of Iraq“, das vom Besucher der Webseite verlangt, nicht nur die aktuelle Adobe Flash herunter zu laden, sondern auch noch ein Quicktime-Plugin für den Browser. Aus Nutzer-Sicht ein No-No, denn es gilt möglichst offene Schnittstellen zu schaffen. Nur die haben die Chance bei der exponentiellen Entwicklung der Netz-Technologie (aber auch bei der Archivierung selbst) möglichst lange Zeit verfügbar zu sein. Und sind damit einigermaßen zukunftssicher.

„Das digitale Museum der Zukunft wird eines sein, wo uns alle Informationen zu unseren Objekten und Gegenständen tatsächlich digital in globalen Datenbanken zur Verfügung gestellt werden, dass ich tatsächlich an meinem Computer sitzen kann und habe ein Objekt in meiner Sammlung und bekomme online Informationen zu anderen Sammlungsstücken in anderen Museen der Welt, die ich dann digital zusammenführen kann, Sekundärliteratur dazu, so dass ich wirklich, an meinem Bildschirm, am Schreibtisch alle Informationen, die es dazu gibt, abrufen kann und was ganz wichtig ist, ich kann mich austauschen mit anderen Menschen in anderen Ländern und das ist grade wichtig im Zusammenhang mit außereuropäischen Sammlungen.“, fasst die Direktorin des Übersee-Museum Bremen, Wiebke Ahrndt, die Anforderungen zusammen.

E geht darum, nutzerorientierte, gemeinsame Standards und fachübergreifende, einheitliche Begriffe zu entwickeln. Dass man Gegenstände (wie im Irak), Texte oder Bilder nicht mehr nur scannt, sondern gleichzeitig dokumentiert, wie und mit welcher Methode man das getan hat, wie hoch beispielsweise die Auflösung eines 3D-Fotos ist, sollte zukünftig selbstverständlich sein.

Fotos:
David Stanley from Nanaimo, Canada [CC BY 2.0 (https://creativecommons.org/licenses/by/2.0)]
Rudolf Klein [CC BY-SA 3.0 de (https://creativecommons.org/licenses/by-sa/3.0/de/deed.en)]

 

 

Anforderungen an Arbeitsplätze in der Digitalisierungs-Branche

Anforderungen an Arbeitsplätze in der Digitalisierungs-Branche

Die Autoren des Grundlagenpapiers zur Digitalisierung für Archive und Bibliotheken sind sich einig, dass umfangreiche Anforderungen an den Digitalisierungs-Arbeitsplatz zu stellen sind, damit die erforderlichen Wiedergabequalitäten auch zukunftssicher gestaltet werden können. Im ersten Teil unserer Stellungnahme zum Grundlagenpapier hieß es unmissverständlich „Jeder Bestand ist anders“ – und um damit sicher (und schonend) umzugehen, steht eben der Arbeitsplatz im Mittelpunkt.

Vor dem Aufsetzen von Digitalisierungsprojekten ist es zunächst unerlässlich, die Art und den Erhaltungszustand der zu digitalisierenden Objekte zu erfassen. Ob und inwieweit es gilt, einen Bestand in Gänze zu erfassen oder ob eine abschnittsweise, stichprobenbasierte Erfassung genügt, muss man letztlich auf Grundlage des Vorwissens über den Grundzustand und die Geschichte der Lagerung des Bestands sowie auf Basis bereits vorhandener Schadensangaben zusammen mit den Auftraggebern entscheiden.

Der eigentliche Digitalisierungsvorgang – Inhouse oder beim Dienstleister – mit dem Ziel einer möglichst verlustfreien Text- und Bildwiedergabe und dabei dennoch hohem Durchsatz, ist die Hauptquelle für eine Belastung der Originale bis hin zu ihrer komplexen Schädigung. Der Arbeitsplatz muss daher ergonomisch und sicher gestaltet sein – viele Ablageflächen vorhanden und ergänzende Arbeitsmaterialien schnell zu Hand sein. Geeignete Hilfsmittel wie Buchkeile (Schaumstoffzuschnitte), Gewichte, Magnete, Münchner Finger usw. müssen in ausreichender Auswahl, Menge und Qualität vorhanden sein. Und die Scan-Fachkräfte in ihre fachgerechte Verwendung, einschließlich aller Fallstricke, eingewiesen werden.

Bei großformatigen Objekten (Plänen, Urkunden oder Karten) ist es aus konservatorischen Gründen unter Umständen nötig, dass zwei Digitalisierungskräfte (etwa ein Team aus Digitalisierungskraft und Restaurator) am Scanner arbeiten müssen. Damit vergrößert sich der Platz- und Personalbedarf nochmal deutlich.

Darüber hinaus sollten für einen perfekten Arbeitsplatz Tücher und Staubsauger mit Hepafiltern eine effektive Staubreduktion gewährleisten – zudem ist für angemessene klimatische Bedingungen sowie eine ausreichende Raumbelüftung, nach Möglichkeit mit relativ hohem Frischluftanteil, zu sorgen.

 

Richtig gestaltete Arbeitsplätze sind nicht trivial

Alle bis hier genannten Anforderungen, zeigen, dass es um einen komplexen Arbeitsablauf mit vielen durchaus elementaren Bedingungen geht. Digitalisierungs-Experte Simon Schwinge zieht daraus einen eindeutigen Schluss: „Genau diese Erkenntnis unterstützt meine klare Haltung: Wir empfehlen, Digitalisierungsprojekte abseits der großen Archive und Bibliotheken besser direkt beim Dienstleister zu realisieren. Hilfsmittel sind teuer, vor allem in der ausreichenden Qualität. Diese alle permanent vorzuhalten, kann kleine Archive leicht überfordern. Wir mussten zudem in der Vergangenheit erkennen, dass hohe Erfahrungswerte im Umgang mit der Digitalisierung historischer Bestände direkte Auswirkungen auf das Ergebnis haben.“

Letztlich gilt, dass die Technik und die damit verbundenen Abläufe sich den zu digitalisierenden Vorlagen und nicht die Objekte den technischen Möglichkeiten anpassen müssen. Darüber hinaus kann ein Dienstleister bei drohenden Problemen oder Schäden Alternativen anbieten, beziehungsweise schonendere Verfahren vorschlagen.

Arbeitsplätze bei PictureSafe werden daher konsequent gestaltet. Unser Arbeitsplatz mit dem CopiBook Open-System A2-Scanner bietet den Scan-Kräften ideale Voraussetzungen zum Bearbeiten der Vorlagen. Der Scanner steht auf einem elektrisch höhenverstellbaren Tisch, der zentimetergenau nach ihren Wünschen angepasst werden kann. Auf dem Schreibtisch gibt es zudem eine große Ablagefläche für Vorlagen, Barcode-Pistole oder zum Beispiel Farb-Targets. Daneben finden sie  dort in einem Sichttafel-Ständer aktuelle Infos, Vorgaben zu Scan-Aufträgen oder Anweisungen. Und der Touchscreen zur Bedienung der Scan-Software kann durch die Fixierung an einem Monitorarm individuell nach den Wünschen der Scankräfte positioniert werden. Gleiches gilt für die Anpassung des ergonomischen Bürostuhls.

Jeder Bestand ist anders. Das Grundlagenpapier zur Digitalisierung für Archiv- und Bibliotheksgut

Jeder Bestand ist anders. Das Grundlagenpapier zur Digitalisierung für Archiv- und Bibliotheksgut

„Die Schaffung digitaler Nutzungs- und Zugangsformen ist kein Ersatz für den Erhalt und die Benutzbarkeit von Schriftgut in seiner Originalsubstanz, insbesondere wenn es sich um unikales Kulturgut handelt“ – so schön behördendeutsch klingt es im Grundlagenpapier „Archiv- und Bibliotheksgut schonend digitalisieren“. Verfasst wurde es von dem Bestandserhaltungsausschuss der Konferenz der Leiterinnen und Leiter der Archivverwaltungen des Bundes und der Länder, der Bundeskonferenz der Kommunalarchive beim Deutschen Städtetag und last but not least der Kommission Bestandserhaltung des Deutschen Bibliotheksverbandes. Ein Papier, an dem man als Digitalisierungs-Dienstleister natürlich nicht vorbei kann.

Wie schon in unserem Bericht zum 7. Bibliothekskongress in Leipzig  angesprochen, nimmt die mengenhafte Digitalisierung von Schriftgut als Fachaufgabe eine immer wichtigere Stellung ein. Dem fachlich angemessenen und schonenden Umgang mit den Originalen gilt dabei der besondere Fokus  des Prozesses. Digitalisierungs-Experte Simon Schwinge kommentiert das so: „Jeder Bestand ist anders. Einen gängigen, universell einsetzbaren Arbeitsablauf gibt es einfach nicht. Daher stellen wir in enger Absprache mit jedem Kunden (dem dortigen Ansprechpartner, Restaurator oder Leiter der Werkstätten) einen individuell angepassten Workflow auf. Auch während des Digitalisierungsprozesses ist eine permanente Abstimmung von Nöten. Jeder zu öffnende Archivkarton, jede Transportkiste oder jedes in Folierung und Schuber verpackte Buch kann Stolpersteine in Form potentieller Schadquellen beinhalten.“

Besondere Anforderungen für den Umgang mit den Originalen ist Teil des Digitalisierungsprozess

Technik und Ergebnis müssen korrespondieren

Die Fachleute, die das Grundlagenpapier zur Digitalisierung erstellt haben, sind sich der angesprochenen Probleme sehr wohl bewusst – schreiben aber auch richtigerweise, dass Digitalisierungsprojekte nicht nur ein Risiko und eine Herausforderung für die Erhaltung von Beständen darstellen, sondern auch eine bedeutende Chance bedeuten. Hochwertige Digitalisate können vor allem auch als Schutzmedien eingesetzt werden, so dass die Benutzung gefährdeten Schriftguts im Original ausschließlich auf einen besonderen Bedarf eingeschränkt werden kann. Dies setze voraus, so die Autoren, dass zur Gewährleistung der hierfür unbedingt erforderlichen Bildwiedergabequalitäten (Auflösung, Farbmanagement etc.) konsequent entsprechende Anforderungen an die technischen Rahmenbedingungen bei der Digitalisierung gestellt werden.

Um zu vermeiden, dass Schriftgut in Archiven und Bibliotheken mehrfach digitalisiert werden muss, ist vor allem die langfristige Erhaltung und Zugänglichkeit der Digitalisate eine elementare Maßnahme zum Schutz der Originale. Und noch entscheidender: Sie bieten neue, komfortable und insbesondere ortsunabhängige Benutzungsmöglichkeiten. Allerdings gilt ebenso, dass sie Workflows beinhalten müssen, die für konservatorische Maßnahmen wie Verpackung oder Reinigung gleich mitgenutzt werden können.

Die Planung von Digitalisierungsvorhaben erfordert daher in der Regel lange Vorlaufzeiten. Die jeweils für die Bestandserhaltung zuständigen Fachabteilungen, Referate oder Personen sowie – wenn vorhanden – die hauseigenen Restaurierungswerkstätten sollten von Anfang an eingebunden werden und beim Gespräch mit einem externen Dienstleister mit am Tisch sitzen.

Was bei diesen Rahmenbedingungen für Anforderungen an die Arbeitsplätze herrschen und wie man diese erfolgreich einsetzen kann, werden wir im zweiten Teil unseres Beitrags zum Grundlagenpapier zu lesen sein.