Download-Bereich

Projekt: Kernsoftware für ICR/OCR-Systeme

Kurzbeschreibung:
Entwicklung einer Softwarebasis für die Dokumentenverarbeitung und Schriftenlesung

Bereich:Softwareprodukte / Dokumentenverarbeitung

Firma:Docutec und Parsytec

Einsatz:für ICR/OCR-Projekte und Produkte der Firma Docutec

Laufzeit:10.1995 - 04.1999

Highlights:
Trotz Zeitdruck und Projektumfang wurde die SW sehr stabil realisiert.
Die Kernsoftware wurde wesentlicher Bestandteil eines wartungsfreien Projektes.
Die Mitarbeiter des Projektes haben den qualitätsbewussten Programmierstil übernommen.

Bei der automatischen Dokumentenverarbeitung und Schriftenlesung wird das Schriftstück (Papier mit Maschinen- oder Handschrift) gescannt, das dabei entstehende digitale Bild wird in Einzelobjekte segmentiert und diese als Buchstaben erkannt. Das Ergebnis ist ein ASCII Text mit Lageinformationen der Lesefelder, die vorher über eine Maske bestimmt wurden. Die Maske muss nicht starr vorgegeben sein, sondern sie kann in Abhängigkeit von den segmentierten Objekten online berechnet werden.

Die Kernsoftware umfasst das Laden von Bilddateien (Scanner-Output), die Erkennung des Dokuments oder des Formulars, Bildvorverarbeitung (z.B. Umwandlung in ein Schwarzweißbild), Suchen der relevanten Schriftdaten, Erkennung der geschriebenen Texte und die Darstellung in einer Textdatei.

Eingesetzte Werkzeuge:
Microsoft Windows NT Visual C++, MFC, Active Template Library, OCX, Visual Basic, Visual Source Safe, Accusoft ImageGear, Parsytec ParsyFrame (Systemsoftware zur Betreibung eines PC-Netzwerks als Parallelrechner)

Fremdsoftware/Kooperationen:
Schrifterkennungssoftware von fünf verschiedenen Herstellern, Segmentierungssoftware

Meine Tätigkeiten:
Gesamtkonzeption und Weiterentwicklung, teilweise Realisierung, Projektleitung, Betreuung von Kooperationspartnern, Qualitätssicherung

Automatisches Lesen von Flugtickets 
Automatische Erfassung von Bankbelegen 
Paralleles Betriebssystem: Universitäten Paderborn, Köln, Amsterdam, Athen, Heidelberg 
Nach oben zum Seitenanfang top