Jugend mosht
-


Hinweise


Antwort
 
LinkBack Themen-Optionen Thema durchsuchen Thema bewerten
Alt 08.10.2007, 11:27   #1
TP-Newbie
 
Registriert seit: May 2006
ChrisH macht alles soweit korrekt
Question

Struktur in OCR bringen


Hi,

ich versuche gerade Adressen einzuscannen und sie mittels OCR erkennen zu lassen.
Die sehen halt aus wie Adressen so aussehen:

Max Mustermann
Musterstr. 17
12345 Musterstadt

Gibt es eine Möglichkeit der Software beizubringen davon 50 Stück zu lesen und vernünftig in eine Excel Tabelle zu exportieren?
Ich habe es mit Abby versucht, aber das Programm kann das wohl nicht.

Danke schon mal
Bye, Chris
ChrisH ist offline   Mit Zitat antworten


Alt 08.10.2007, 17:17   #2
TP-Senior
 
Registriert seit: May 2007
Ort: Berlin
SchneewittchenX hilft, wo's gehtSchneewittchenX hilft, wo's gehtSchneewittchenX hilft, wo's geht
Hallo Chris,
wenn die Adressen tabellenförmig angeordnet sind, dann kann Abby das erkennen und das auch als Exceltabelle abspeichern.

Zählen wirst du Abby auch kaum beibringen können, Du kannst aber Deine Erkennungskästchen so aufziehen, dass genau 50 Adressen enthalten sind.

Speichere das Erkennungsergebnis im einfachen Textformat ab und öffne die Datei in einem Texteditor (notfalls in Notepad, wenn der das Zeilenende ersetzen kann - ohne Formatierung kannst Du auch Word verwenden - ein ordentlicher Texteditor ist aber besser).

Wenn alle Zeilenumbrüche ordentlich enthalten sind und jede Adresse durch eine Leerzeile von der nächsten getrennt ist, dann benutze die Suchen/Ersetzen-Funktion und ersetze alle Zeilenumbrüche durch einen Tabulator (oder ein anderes Trennzeichen (Semikolon oder Komma)).
Danach ersetzt Du in einem 2. Schritt 2 Tabulatoren durch einen Zeilenumbruch.

Ein bisschen problematisch ist, wenn die Adressen unterschiedlich viele Zeilen haben, in der Adresse darf keine Leerzeile sein, oder Du musst die Adressen durch mehr Leerzeilen trennen und den 2. Ersetzvorgang anpassen.

Tabulatorgetrennte Daten kann Excel problemlos einlesen.

SchneewittchenX
SchneewittchenX ist offline   Mit Zitat antworten
Alt 08.10.2007, 17:44   #3
TP-Newbie
 
Registriert seit: May 2006
ChrisH macht alles soweit korrekt
Ja, das hatte ich schon probiert.

Hatte nur gehofft, es geht einfacher, automatischer, benutzerfreundlich usw.
ChrisH ist offline   Mit Zitat antworten
Alt 08.10.2007, 18:36   #4
TP-Senior
 
Registriert seit: May 2007
Ort: Berlin
SchneewittchenX hilft, wo's gehtSchneewittchenX hilft, wo's gehtSchneewittchenX hilft, wo's geht
Hallo Chris,
woher soll abby denn wissen, das Du untereinander stehende Adressen als Tabelle angeordnet haben möchtest.

Es macht doch "weiter" nichts, als zu versuchen, Pixelansammlungen bestimmten Buchstaben oder Zeichen zuzuordnen. Es kann zwar Trennstriche vom Text unterscheiden und hat auch eine Rechtschreibprüfung, aber mehr geht doch wirklich nicht.

Sicher könnte man auch ein Skript schreiben, das die Textdatei automatisch konvertiert, aber sowie die Zahl der Adresszeilen und Leerzeilen nicht stimmt, kommt das Script ins Rudern oder Du musst eine so aufwändige Fehlerbehandlung einbauen, dass sich der Aufwand nur für sehr viele Adressen lohnt.
Einfacher wäre es, wenn es ein eindeutiges Trennzeichen zwischen den Adressen gibt (Vielleicht ein dicker Strich mit Stift und Lineal?, der in der Textdatei als ------- abgespeichert wird.)
Dann wird alles zwischen 2 Strichen als eine Adresse gespeichert.
Wenn aber die Zahl der Adresszeilen unterschiedlich ist, dann kann es in Excel immer noch zu Verschiebungen kommen.

SchneewittchenX
SchneewittchenX ist offline   Mit Zitat antworten
Antwort

  Aktuelles Thema
  TP Hilfe Forum > Grafik & Multimedia > Sonstige Programme
Struktur in OCR bringen Struktur in OCR bringen
« Brennprogramm für Light Scribe | Turbo Pascal grafik »

Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 
Themen-Optionen Thema durchsuchen
Thema durchsuchen:

Erweiterte Suche
Thema bewerten
Thema bewerten:

Forumregeln
Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an
Gehe zu


Alle Zeitangaben in WEZ +2. Es ist jetzt 04:10 Uhr.

Powered by: vBulletin Version 3.7 (Deutsch)
Copyright ©2000 - 2008, Jelsoft Enterprises Ltd. / Search Engine Friendly URLs by vBSEO 3.2.0 ©2008, Crawlability, Inc.
Traum-Projekt.com | Suchen | Archiv | Impressum | Kontakt | | | Nach oben |



1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67