Thomas M. Ruthemann

Benutzung und Vermittlung bei öffentlichen Archiven – was gilt es zu beachten?

von Thomas M. Ruthemann | Mai 4, 2020

Immer mehr Archive, mit unendlichen Mengen von Digitalisaten von 2-D bis 3-D, werden zunehmend kostenfrei zur Verfügung gestellt und damit nicht nur einem Fachpublikum sondern einer breiten Öffentlichkeit zur Verfügung gestellt. Die entscheidende Frage dabei ist, wie gut und einfach sind diese zu benutzen? Wissenschaftler begnügen sich oft mit nicht besonders aufwändig aufgemachten Benutzeroberflächen, während andere Menschen aber den Umgang mit solchen Archiven gar nicht gewohnt sind. Es geht hierbei um die sogenannte Usability, darum wie etwas am besten zugänglich und nutzbar aufbereitet wird.

Online-Recherche in digitalen Archiven muss tatsächlich einer Vielzahl von Nutzungsmöglichkeiten genügen. Mit den Möglichkeiten wachsen eben auch die Herausforderungen an das Machbare. Es gibt einen klar erkennbaren Wandel von der elitären kleinen Benutzergruppe von Archivgut von einst, hin zum heutigen heterogenen und anspruchsvollen Archivpublikum. Die meisten Institutionen (staatlich/öffentlich wie privat) bemühen sich heutzutage darum ihre digitalen Sammlungen so weit wie möglich zu verbreiten, indem sie Online-Ausstellungen und -Archive erstellen, die es Benutzern aus der ganzen Welt ermöglichen, diese bisher unzugänglichen Objekte zu erforschen, zu studieren oder eben auch „nur“ zu bewundern.

Von vorrangiger Bedeutung ist dabei die Landing-Page der Sammlungen – der Ort an dem Suchende zuallerst auf das digitale Archiv treffen. Da stellt sich sehr schnell die bereits angedeutete Frage, sollen die Landing-Pages ein Online-Surrogat für das Museums- oder Bibliothekserlebnis sein? Richten sie sich an interessierte, aber gelegentliche Benutzer, oder sind sie speziell für den ernsthaften Forscher konzipiert?

Wie müssen moderne Archive
und deren Benutzeroberflächen gestaltet sein?

Die Landing-Page präsentiert idealerweise eine Sammlung der Digitalisate, die für alle Nutzer attraktiv und einfach zu navigieren ist. Im besten Fall würde es diese Seite den Benutzern ermöglichen, entweder kuratierte Sammlungen in einem digitalen Raum zu durchsuchen (ähnlich der Art und Weise, wie Menschen ein Museum in der physischen Welt genießen könnten) oder eben als Variation Forschern die Suche und Untersuchung eines bestimmten Sammlungsstücks durch robuste Suchfunktionen zu ermöglichen. Letztlich bedeutet dies, dass beim Aufbau und der Präsentation eines digitalen Archivs ein ganz klares Konzept und damit eine umfangreiche Zielgruppenanalyse vorhanden sein muss.

Es gilt generell ein benutzerzentriertes Design (UCD) zur systematischen Verbesserung der Benutzer-Erfahrung für alle Arten von Archiv-Benutzern zu kreieren, das klare Anleihen beim Service-Design, User-Experience-Design und der allgemeinen Benutzerfreundlichkeit macht – so wie es idealerweise eben auch beim Web-Design, und dabei ganz speziell beim E-Commerce (Webshops) zum Einsatz kommt. Das schließt übrigens nicht etwa professionelle Forscher aus, auch denen hilft ein solches Design und den damit verbundenen Strukturen.

Für die Zukunft dürfte die Funktionalität zudem mit Virtual-Reality erweitert werden – was Science-Fiction-Filme seit Jahren zeigen, ist nicht mehr so weit von der Realität entfernt. Eine Nutzung etwa mit 3-D-Brillen ist heutzutage bereits sehr gut denkbar, womit die Archive dann in einer Art Rückführung wieder „anfassbar“ werden.

Foto: Have a nice day

2,8 Millionen freie Bilder aus 19 Museen und neun Forschungszentren: Das Smithsonian Institute macht sein Archiv auf!

von Thomas M. Ruthemann | März 25, 2020

Aus der Not eine Tugend machen, heißt es angesichts der Museums-Schließungen während der Corona-Krise. Jetzt ist genug Gelegenheit in Ruhe die vielen digitalen Archive zu durchstöbern, die Ausstellungshäuser und Forschungsinstitute bereits seit Jahrzehnten im Hintergrund aufbauen. Ganz vorne an steht seit Februar 2020 das Smithsonian Institute in Washington, das 2,8 Millionen Bilder in hochauflösenden Scans und zur kostenlosen Verwendung zur Verfügung stellt.

Allein die Masse an 2D- und 3D-Scans ist atemberaubend, aber das Washingtoner Institut ist damit tatsächlich nicht alleine. Auch das Art Institute of Chicago, das Rijksmuseum in Amsterdam, das Metropolitan Museum of Art in New York und die New York Public Library haben in den letzten Jahren Tausende von Bildern öffentlich zugänglich gemacht. Und selbst bei Getty Images ist mittlerweile der Großteil der Fotosammlung kostenlos zu erhalten – eröffnet dem Unternehmen damit aber gleichzeitig auch eine potenzielle neue Einnahmequelle durch seine weiteren angebotenen Bilder.

Der Schritt der amerikanischen Bildungseinrichtung ist in der Tat beispiellos, aber dennoch nicht ohne Grund: Das Smithsonian hofft, dass dies die Museen und Bibliotheken für ein neues Publikum öffnet, indem es seine Bilder besser zugänglich macht. Die Sammlung wird unter der Creative-Commons-Zero-Lizenz geführt, wodurch die Abbildungen frei von jeglichen Beschränkungen für eine Wiederveröffentlichung werden.

Alto saxophone owned and played by Charlie Parker

Unter einer eigenen Webadresse erreichen Nutzer „Smithsonian Open Access“, wo diese Millionen von Bildern herunterladen, mit anderen teilen und wiederverwenden können – und zwar sofort, ohne zu fragen. Mit dort angebotenen, neuen Plattformen und Werkzeugen haben alle Leute einen leichten Zugang zu fast drei Millionen digitalen Objekten aus allen Sammlungen. Zudem kann man dort lesen, dass diese Angebot sogar noch erweitert werden soll, es dort heißt „… und es werden noch viele weitere folgen.“

Eine weitere Option für Macher und Kreative ist neben den vielen digitalisierten Fotos, Zeichnungen und Grafiken das 3D-Digitalisierungsportal des Smithsonian, das interaktive Modelle aus einer großen Anzahl von Feldern anbietet. Dort kann man sich nicht nur Neil Armstrongs Apollo 11-Raumanzug, sondern auch etwa Fossilien, die auf dem Gelände des National Park Service gefunden wurden, genauer ansehen. Das Besondere dabei: Mit Hilfe eines 3-D-Druckers lassen sich so etwa maßstabsgetreue Modelle eines T. Rex-Schädels, eines Korallenskeletts oder der „Cosmic Buddha“-Skulptur ausdrucken. Alles umsonst und als digitaler Service.

Titelbild: Smithsonian Institute, Id:NMAI-005-000002 (CCO – Creative Commons (CC0 1.0))
Inset: Smithsonian Institute, Id:NMAAHC-2019_10_1a-g_002 (CCO – Creative Commons (CC0 1.0))

Digitale Bildnachbearbeitung von Archiv-Fotos? So sind unsere gemeinsamen Standards in Gefahr!

von Thomas M. Ruthemann | Feb. 20, 2020

Ein Kommentar von Simon Schwinge

Das Tempo, in welchem Donald Trump, seines Zeichens Präsident der US of A, Nachrichtenmeldungen produziert, ist beeindruckend hoch. So hoch, dass eine für uns als professionelles Digitalisierungs-Unternehmen sehr wesentliche Meldung allzu schnell unterzugehen drohte: Die „National Archives and Records Administration“, sozusagen das Nationalarchiv der Vereinigten Staaten, veränderte ein digitales Foto des Frauenmarsches in der amerikanischen Hauptstadt aus dem Jahr 2017.

Tatsächlich wird immer deutlicher, dass Manipulationen drohen heutzutage ein „legitimes“ Mittel der politischen Dokumentation zu werden, in denen es vor allem darum geht, die Nützlichkeit einer Information ins Zentrum zu stellen. Oder wie in diesem Fall Unerwünschtes unkenntlich zu machen.

Als Dienstleister sind wir nicht nur strikt gegen jede Manipulation, sondern sehen darin eine echte Gefahr für die Branche und das Berufsbild. Denn Digitalisate und digitale Archive stehen für eine barrierefreie und niederschwellige Teilhabe an Informationen – eine unverfälschte, eine unveränderte an allererster Stelle! Leider zeigt sich aber auch genau an dieser Stelle (ein echte Sollbruchstelle!) die Möglichkeit, implizierte Informationen zu manipulieren oder negieren. Und das wird heutzutage, wie sich im konkreten Fall zeigt – mehr oder weniger plump – angewandt, um Bildinformationen die eine Deutung oder gewünschte Interpretation des Dokuments bewusst herbeiführen sollen, auch tatsächlich regelmäßig und wiederkehrend zu nutzen.

So wurden, wie Anfang Januar 2020 bekannt wurde, augenscheinlich unter dem Eindruck, die Erinnerung an das komplizierte Verhältnis zwischen Donald Trump und der amerikanischen Bevölkerung müsse irgendwie beschönigt werden, Slogans, Schimpfworte und Beleidigungen in einer Aufnahme des Washingtoner Frauenmarsch verpixelt.

Natürlich stapeln sich die wissenschaftlichen Ausführungen in den Regalen über die gängige Praxis, Fotografien zur Kommunikation bestimmter Botschaften zu verändern. Das ist beileibe nichts Neues in der Geschichte der Fotografie. Doch egal, ob Galerie, ob Unternehmen oder Museum, sollte ein Archiv – gerade wenn es als das Nationalarchiv angesehen und staatlich finanziert wird– hier mehr als nur Vorsicht walten lassen, nein Vorbild sein!

Um mal einen Vergleich zu wagen: Digitalisierungsprojekte basieren in Deutschland meistens auf den Praxisregeln „Digitalisierung“ der DFG. Dort ist ganz eindeutig festgelegt, dass eine digitale Bildnachbearbeitung unerwünscht ist und nur im aller aller äußersten Notfall in homöopathischen Dosen angewandt werden darf: „Auf jeden Fall zu vermeiden sind Objektdeformationen, das Hinzufügen oder Löschen von Objektteilen, sowie Spezialeffekte, wie z. B. der Einsatz von Verfremdungsfiltern.“, so die klare Aussage.

Um es noch klarer zu sagen: Ein Dienstleister, der gegen diese Regeln verstößt, verliert seinen Auftrag. Ein Archiv würde seinen guten Ruf verlieren. Denn die Relevanz verlässlicher und eindeutig nachvollziehbarer, barrierefrei und niederschwellig zugänglicher Informationen ist heutzutage nicht mehr wegzudiskutieren.

Erst moderne Digitalisierungs-Software macht intuitives Arbeiten möglich

von Thomas M. Ruthemann | Dez. 18, 2019

In den vergangenen Jahren haben sich die Hersteller von Buchscannern meist darum bemüht, allen Wünschen und individuellen Anforderungen ihrer Kunden gerecht zu werden. Das Ergebnis sind teils nutzerunfreundliche Scanclients der jeweiligen Digitalisierungs-Software – mit einer unübersichtlichen Vielzahl an Funktionen, die in der Praxis de facto selten zum Einsatz kommen. Zahlreiche Menüs, Untermenüs und Eingabefelder erlauben zwar zahlreiche Konfigurationsmöglichkeiten, bringen beim eigentlichen Scanprozess aber Nachteile in der praktischen Handhabung mit sich.

Die von verschiedenen Scanner-Herstellern angebotenen Lösungen im Hard- und Softwarebereich reichen tatsächlich den Anwendern und Verantwortlichen großer und kleiner Digitalisierungsprojekte oftmals nicht aus. Für sie wichtige Funktionalitäten für eine wirtschaftliche und effizienten Projektabwicklung stehen nicht zur Verfügung. Die Bielefelder Spezialisten Walter Nagel GmbH & Co. KG hat Software, Zubehör und Materialien entwickelt, die die Arbeit mit Scannern schneller, einfacher, bestandsschonender und ergonomischer gestalten sollen. PictureSafe hat sich daher entschieden „multidotscan“ (MDS) der Bielefelder Entwickler als Software zu nutzen.

Sie steuert unterschiedliche Buchscanner und ersetzt damit die individuelle Steuerungs- und Capturing-Software des jeweiligen Herstellers. Die Steuerung findet nicht durch zusätzliche Devices wie Maus oder Tastatur und umfangreiche Menüstrukturen statt, sondern wird via Touchscreen erledigt. Die Oberflächen und workflowspezifischen Funktionalitäten können individuell gestaltet und konfiguriert werden.

Integration als oberster Gesichtspunkt

Die Benutzeroberflächen können unter ergonomischen Gesichtspunkten und für den Operator optimiert auf dem Bildschirm angeordnet werden. So kann jeder neue Mitarbeiter nach einer kurzen Einweisung unmittelbar mit der Digitalisierung beginnen. Das Scanpersonal muss sich also nicht mehr mit den verschiedenen Scanoberflächen beschäftigen. Die Bezeichnung, optische Gestaltung, Größe, Anzahl und Anordnung der Funktionselemente auf der Oberfläche des Touchscreen können eigenständig vom Administrator des Kunden angepasst werden.

Die Voreinstellungen werden automatisch geladen und der Operator kann Projektvorgaben umsetzen . So kann beispielsweise die Auflösung oder Farbeinstellung nur mit administrativer Berechtigung verändert werden. Die in Workflow-Definitionen hinterlegten Scanprofile garantieren ein ergebnissicheres aber auch effektives Arbeiten. Fehlerquellen werden so entweder komplett vermieden oder minimiert, wodurch sich der Aufwand für Nachscans und Reklamationen erheblich reduziert.

Scans von kameragesteuerten Digitalisierungs-Systemen ziehen oft aufwändige Nachbearbeitungsprozesse nach sich. Multidotscan ermöglicht die Einbindung von Fachkameras und sorgt für einen effizienten Scanprozess, bei dem alle Scans direkt konvertiert, geschnitten, ausgerichtet und mit einem Farbmanagement ausgestattet werden, so dass die manuelle Nachbearbeitung reduziert werden.

Die Software der Bielefelder Spezialisten ist hervorragend in die technische Infrastruktur von Digitalisierungs-Unternehmen integrierbar. Scansysteme unterschiedlicher Hersteller können mit einer einheitlichen Applikation bedient und gesteuert werden.  Zusätzliche Module erlauben darüber hinaus die Anbindung an DWork, Subito oder Visual Library. Bereits vorhandene Digitalisate aus früheren Projekten können in multidotscan importiert, aufbereitet und an die gerade eingesetzten Systeme übergeben werden. So wird jeder Scanner zu einem „multifunktionalen Arbeitsplatz“, an dem alle Anwendungsszenarien und Digitalisierungsdienste zentral gesteuert werden können.

OCR – Mustervergleiche und Texterkennung. Wie aus Dokumenten durchsuchbare Datenbanken werden

von Thomas M. Ruthemann | Nov. 6, 2019

Damit Informationen aus alten Dokumenten aller Art in IT-Systemen verarbeitet werden können, reicht es nicht, Dokumente einfach nur einzuscannen. Denn der Scan, beziehungsweise das Resultat wie ein TIF oder PDF, sie sind immer nur eine Bildkopie – ob als Rastergrafik oder im Postscript beschrieben. Nicht mehr und nicht weniger … letztlich eine Ansammlung schwarzer, weißer oder farbiger Bildpunkte. Die OCR (die „Optical Character Recognition“) steht für den nächsten wichtigen Schritt: Einzelne Buchstaben erkennen und diese zu Wörtern und anschließend zu logischen Sätzen zusammen zu setzen – das Bild wird in einen Text übersetzt.

Auch wenn automatische Texterkennung und OCR oft synonym verwendet werden, handelt es sich bei OCR eigentlich nur um den Mustervergleich. Dabei werden Textblöcke von graphischen Elementen unterschieden, anschließend werden die Zeilen und Wörter, am Ende die Buchstaben separiert. Die Entwicklung ist mittlerweile weit fortgeschritten, denn OCR kann nicht nur Standardschriften, sondern teilweise sogar Handschriften erkennen.

Hochentwickelte, leistungsstarke OCR-Software erspart viel Zeit und Aufwand bei der Erstellung, Verarbeitung und Wiederverwendung vieler unterschiedlicher Dokumente. Besonders bei der digitalen Bestandserhaltung, beziehungsweise der immer wichtiger werdenden Zugriffsmöglichkeiten auf digitale Archive, ist ein Verzicht auf OCR schlicht nicht mehr denkbar.

Wie die digitale Schrifterkennung funktioniert

Einmal abgesehen von speziellen Dokumenten mit Frakturschrift oder gar Handschrift, folgt die Texterkennung im allgemeinen einen festen Ablauf: Als allererstes macht die Software eine Layout-Analyse und guckt sich den Seitenaufbau an, trennt dabei Bilder von Text. Sie merkt sich auch deren Position auf der Seite und einzelne Elemente wie Seitennummern werden punktgenau gespeichert.

Als Nächstes werden die einzelnen Textblöcke angegangen und diese wiederum in Sätze zerlegt. Die Sätze werden dann in einzelne Wörter runtergebrochen und die Wörter dann in Buchstaben. Nun kommt die Datenbank der OCR-Software ins Spiel, die Muster von Buchstaben und Zeichen enthält. Das Programm vergleicht die eingescannten Buchstaben mit diesen Mustern und sobald sie sich zu 99 Prozent ähneln, entscheidet der Algorithmus, dass es wahrscheinlich dieser Buchstabe oder jene Zahl sein muss.

Diese Vorgehensweise ist so präzise, da die Software viele Muster in kurzer Zeit vergleichen kann. Eine Trainingsphase mit manuellen Korrekturen durch die Operatoren verbessert noch die interne Musterdatenbank und damit das Ergebnis. So gelingt auch zum Beispiel problemlos die Unterscheidung zwischen der Zahl „8“ und dem großen „B“. Was erkennbar ein durchaus schwerer Fall ist.

Anschließend werden die erkannten Buchstaben wieder zu Wörtern kombiniert und zurück in ihre Stelle im Satz eingeordnet. Aber Vorsicht, damit ist keinerlei Inhaltlichkeit verbunden – heißt, die OCR-Software kann nicht entscheiden, ob das, was sie „herausbekommen“ hat, auch wirklich Sinn ergibt. Was nicht bedeutet, dass zukünftige Generationen in ein paar Jahren mit Hilfe der künstlichen Schritt diese Schwelle auch noch überwinden werden.