Ergebnis 1 bis 4 von 4

Thema: Struktur in OCR bringen

  1. #1
    TP-Junior
    Registriert seit
    May 2006
    Beiträge
    24

    Question Struktur in OCR bringen

    Hi,

    ich versuche gerade Adressen einzuscannen und sie mittels OCR erkennen zu lassen.
    Die sehen halt aus wie Adressen so aussehen:

    Max Mustermann
    Musterstr. 17
    12345 Musterstadt

    Gibt es eine Möglichkeit der Software beizubringen davon 50 Stück zu lesen und vernünftig in eine Excel Tabelle zu exportieren?
    Ich habe es mit Abby versucht, aber das Programm kann das wohl nicht.

    Danke schon mal
    Bye, Chris

  2. #2
    TP-Supporter
    Registriert seit
    May 2007
    Ort
    Berlin
    Beiträge
    372
    Hallo Chris,
    wenn die Adressen tabellenförmig angeordnet sind, dann kann Abby das erkennen und das auch als Exceltabelle abspeichern.

    Zählen wirst du Abby auch kaum beibringen können, Du kannst aber Deine Erkennungskästchen so aufziehen, dass genau 50 Adressen enthalten sind.

    Speichere das Erkennungsergebnis im einfachen Textformat ab und öffne die Datei in einem Texteditor (notfalls in Notepad, wenn der das Zeilenende ersetzen kann - ohne Formatierung kannst Du auch Word verwenden - ein ordentlicher Texteditor ist aber besser).

    Wenn alle Zeilenumbrüche ordentlich enthalten sind und jede Adresse durch eine Leerzeile von der nächsten getrennt ist, dann benutze die Suchen/Ersetzen-Funktion und ersetze alle Zeilenumbrüche durch einen Tabulator (oder ein anderes Trennzeichen (Semikolon oder Komma)).
    Danach ersetzt Du in einem 2. Schritt 2 Tabulatoren durch einen Zeilenumbruch.

    Ein bisschen problematisch ist, wenn die Adressen unterschiedlich viele Zeilen haben, in der Adresse darf keine Leerzeile sein, oder Du musst die Adressen durch mehr Leerzeilen trennen und den 2. Ersetzvorgang anpassen.

    Tabulatorgetrennte Daten kann Excel problemlos einlesen.

    SchneewittchenX

  3. #3
    TP-Junior
    Registriert seit
    May 2006
    Beiträge
    24
    Ja, das hatte ich schon probiert.

    Hatte nur gehofft, es geht einfacher, automatischer, benutzerfreundlich usw.

  4. #4
    TP-Supporter
    Registriert seit
    May 2007
    Ort
    Berlin
    Beiträge
    372
    Hallo Chris,
    woher soll abby denn wissen, das Du untereinander stehende Adressen als Tabelle angeordnet haben möchtest.

    Es macht doch "weiter" nichts, als zu versuchen, Pixelansammlungen bestimmten Buchstaben oder Zeichen zuzuordnen. Es kann zwar Trennstriche vom Text unterscheiden und hat auch eine Rechtschreibprüfung, aber mehr geht doch wirklich nicht.

    Sicher könnte man auch ein Skript schreiben, das die Textdatei automatisch konvertiert, aber sowie die Zahl der Adresszeilen und Leerzeilen nicht stimmt, kommt das Script ins Rudern oder Du musst eine so aufwändige Fehlerbehandlung einbauen, dass sich der Aufwand nur für sehr viele Adressen lohnt.
    Einfacher wäre es, wenn es ein eindeutiges Trennzeichen zwischen den Adressen gibt (Vielleicht ein dicker Strich mit Stift und Lineal?, der in der Textdatei als ------- abgespeichert wird.)
    Dann wird alles zwischen 2 Strichen als eine Adresse gespeichert.
    Wenn aber die Zahl der Adresszeilen unterschiedlich ist, dann kann es in Excel immer noch zu Verschiebungen kommen.

    SchneewittchenX

Aktive Benutzer

Aktive Benutzer

Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)

Aktive Benutzer

Aktive Benutzer

Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)

     

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •  

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51