Capture

Komponenten von ECM: CaptureDie Kategorie „Capture“ beinhaltet Funktionalität und Komponenten zur Erstellung, Erfassung, Aufbereitung und Verarbeitung von analogen und elektronischen Informationen. Dabei kann man mehrere Stufen und Technologien unterscheiden, von der einfachen Erfassung der Information bis zur komplexen Aufbereitung durch eine automatische Klassifikation. Die Capture-Komponenten werden auch häufig als „Input“-Komponenten zusammengefasst.

Manuell erzeugte und erfasste Informationen

Bei der manuellen Erfassung können alle Formen von Informationen vorkommen, von Papier-dokumenten, elektronischen Office-Dokumenten, E-Mails, Vordrucken, MultiMedia-Objekten, digitalisierter Sprache und Video bis zum Mikrofilm.
Bei der teilautomatischen oder automatischen Erfassung können EDI- oder XML-Dokumente, kauf-männische und ERP-Anwendungen oder bestehende Fachanwendungssysteme die Quelle für die Erfassung sein.

Technologien zur Be- und Verarbeitung erfasster Informationen

Zur Verarbeitung von gescannten Faksimiles werden verschiedene Erkennungstechnologien (Recognition) eingesetzt. Zu Ihnen gehören:

  • OCR (Optical Charakter Recognition)
    Hierbei werden die Bildinformationen in maschinenlesbare Zeichen umgesetzt. OCR wird für Maschinenschrift eingesetzt.
  • HCR (Handprint Charakter Recognition)
    Die Erkennung von Handschriften ist eine Weiterentwicklung von OCR, die jedoch bei Fließtexten immer noch nicht zufriedenstellende Ergebnisse liefert. Beim Auslesen von definierten Feldinhalten ist die Methode doch bereits sehr sicher.
  • ICR (Intelligent Charakter Recognition)
    ICR ist eine Weiterentwicklung von OCR und HCR, die die Qualität der ausgelesenen Ergebnisse durch Vergleiche, logische Zusammenhänge, Abgleich mit Referenzlisten oder Prüfung gegen vor-handene Stammdaten verbessert.
  • OMR (Optical Mark Recognition)
    OMR, zum Beispiel für Strichcode, liest mit hoher Sicherheit spezielle Markierungen in vordefinierten Feldern aus und hat sich bei Fragenbogenaktionen und anderen Vordrucken bewährt.
  • Barcode
    Aufgebrachte Barcodes beim Versenden von Vordrucken können beim Einlesen der Rückläufer automatisiert erkannt und zugeordnet werden.

Bildbearbeitungstechniken von Document Imaging dienen nicht nur zur Anzeige von gescannten Bildern sondern ermöglichen auch die Verbesserung der Lesbarkeit für die Erfassung. Funktionen wie „Despeckling“, das Entfernen von isolierten Bildpunkten oder das „Adjustment“, das Geraderücken von schief eingezogenen Vorlagen verbessern die Ergebnisse der Erkennungs-technologien. Document-Imaging-Funktionen werden beim Erfassungsprozess bei der Qualitäts-kontrolle eingesetzt.

Zunehmend haben elektronische Abbildungen von Dokumenten denselben rechtlichen Status wie Papierdokumente.

Formularverarbeitung

Bei der Erfassung von Formularen werden heute noch zwei Gruppen von Technologien unterschieden, obwohl der Informationsinhalt und der Charakter der Dokumente gleich sein können.

  • Paper Forms Processing (Vordruckverarbeitung)
    Das „Forms Processing“ bezeichnet die Erfassung von industriell oder individuell gedruckten Vordrucken mittels Scannen. Hierbei kommen anschließend häufig Erkennungstechnologien zum Einsatz, da gut gestaltete Vordrucke eine weitgehend automatische Verarbeitung ermöglichen. Viele der heutigen industriellen Vordrucke sind strukturiert, aber auch die Bearbeitung von unstrukturierten Vordrucken entwickelt sich immer weiter.
  • E-Forms / Web-Forms (Verarbeitung elektronischer Formulare)
    Bei der Erfassung elektronischer Formulare ist eine automatische Verarbeitung möglich, wenn Layout, Struktur, Logik und Inhalte dem Erfassungssystem bekannt sind.

COLD / Enterprise Report Management

COLD/ERM sind Verfahren zur automatisierten Verarbeitung von strukturierten Eingangsdateien. Der Begriff COLD steht für Computer Output on LaserDisk und hat sich gehalten, obwohl das Medium LaserDisk seit Jahren nicht mehr am Markt ist. Das Akronym ERM steht für Enterprise Report Management. In beiden Fällen geht es darum, angelieferte Ausgabedateien auf Basis vorhandener Strukturinformationen so aufzubereiten, dass sie unabhängig vom erzeugenden System indiziert und an eine Speicherkomponente wie  eine dynamische Ablage (Store) oder ein Archiv (Preserve) übergeben werden können.

Zusammenführung von Erfassungsdaten

Die „Aggregation“ stellt einen Kombinationsprozess von Dateneingaben verschiedener Erstellungs-, Erfassungs- und zuliefernden Anwendungen dar. Zweck ist die Zusammenführung und Vereinheitlichung von Informationen aus unterschiedlichen Quellen, um sie strukturiert und einheitlich formatiert an die Speicher- und Bearbeitungssysteme zu übergeben.

Komponenten zur inhaltlichen Erschließung  erfasster Informationen

Für die Weiterleitung und inhaltliche Erschließung kommen in den Systemen weitere Komponenten hinzu, die die erfassten und digital vorliegenden Informationen aufbereiten und um beschreibende Merkmale ergänzen. Hierzu gehören:

  • Indexierung (manuelle Indizierung)
    Anders als im Deutschen beschränkt sich im Angloamerikansichen der Begriff Indexing auf die manuelle Vergabe von Indexattributen, die in der Datenbank einer „Manage“-Komponente für Verwaltung und Zugriff auf die Informationen benutzt wird. Im Deutschen werden hier auch Begriffe wie „Indizieren“, „Attributieren“ oder „Verschlagworten“ benutzt.
  • Input Designs (Profile, Klassen)
    Sowohl die automatische als auch die manuelle Attributierung kann durch hinterlegte Profile erleichtert und verbessert werden. Solche Profile können zum Beispiel Dokumentenklassen beschreiben, die die Anzahl der möglichen Indexwerte beschränken oder bestimmte Kriterien automatisch vergeben. Input Designs schließt auch die Eingabemasken und deren Logik bei der manuellen Indizierung ein.
  • Taxonomie
    Die taxonomische Verarbeitung ermöglicht eine formale Anordnung von Informationen nach den jeweiligen Bedürfnissen eines Unternehmens.  Hier spielen Nomenklaturen, Thesaurus und Ablagesystematiken eine Rolle.
  • Categorization (automatische Klassifikation oder Kategorisierung)
    Auf Basis der in den elektronischen Informationsobjekten, seien es per OCR-gewandelte Faksimiles, Office-Dateien oder Ausgabedateien, enthaltenen Informationen können Programme zur automatischen Klassifikation selbstständig Index-, Zuordnungs- und Weiterleitungsdaten extrahieren. Solche Systeme können auf Basis vordefinierter Kriterien oder selbstlernend Informationen auswerten.

Ziel aller „Capture“-Komponenten ist, die erfassten Informationen zur Weiterbearbeitung oder Archivierung den „Manage“-Komponenten bereitzustellen.

Zuletzt aktualisiert am 20.04.2011. Autorenrechte.
Persistente URL: http://www.pc.qumram-demo.ch/ecm/content/capture