Autor Téma: OCR  (Přečteno 230 krát)

Offline xnukes

  • Mladík
  • **
  • Příspěvků: 65
  • Karma: 1
    • Verze Delphi: XE7
    • Bludspeed s.r.o.
OCR
« kdy: 29-11-2017, 11:26:08 »
Zdravíčko pánové,

nedělál jste někdo někdy s OCR ? Mám dokumenty pdf (faktury) a chci z těch dokumentů vždy vyčíst číslo objednávky.

Nasměruje mě někdo ? :))

Děkuji vám :)

Offline Jirka Ondricek

  • Mladík
  • **
  • Příspěvků: 57
  • Karma: 4
    • Verze Delphi: 10.1 Berlin
Re:OCR
« Odpověď #1 kdy: 29-11-2017, 11:41:47 »
Excellent
Rated 1 time
Dlouhodobě používám toto https://github.com/tesseract-ocr/tesseract. Práce s tím zpracovaná pro Delphi např. zde https://www.winsoft.sk/ocr.htm, ale to už je placené.

Používám to nejen na dokumenty, ale mnohem více na práci s obrazem z kamery a jsem spokojen.

Offline Radek Červinka

  • Administrátoři
  • Padawan
  • *****
  • Příspěvků: 1780
  • Karma: 72
    • Verze Delphi: D5,D2007, DXE, DXE2 + 2 poslední (Tokyo)
    • O Delphi v češtině
Re:OCR
« Odpověď #2 kdy: 29-11-2017, 13:36:10 »
Embarcadero MVP - Czech republic

Offline xnukes

  • Mladík
  • **
  • Příspěvků: 65
  • Karma: 1
    • Verze Delphi: XE7
    • Bludspeed s.r.o.
Re:OCR
« Odpověď #3 kdy: 29-11-2017, 14:11:59 »
Děkuju pánové :) jdu tvořit :)

Offline Ján Masaryk

  • Mladík
  • **
  • Příspěvků: 53
  • Karma: 5
    • Verze Delphi: 2010
Re:OCR
« Odpověď #4 kdy: 09-12-2017, 20:45:35 »
Zdravím všetkých :)

Skúšal som TTesseractOCR4 podľa linku od Radka a skončil som na hlásení o neexistujúcom UITypes a následne na PUTF8Char,
čo sú nové veci v Delphi XE  :'(

Existuje niečo aj pre staršie Delphi (D2010) ? Zatiaľ som nič nenašiel.

Alebo to skúsim inak.

Existuje nejaká knižnica pre Delphi na "rozbitie" PDF dokumentu na elementy a následné vyčítanie údajov?

Vopred ďakujem za odpovede  :)


Offline Radek Červinka

  • Administrátoři
  • Padawan
  • *****
  • Příspěvků: 1780
  • Karma: 72
    • Verze Delphi: D5,D2007, DXE, DXE2 + 2 poslední (Tokyo)
    • O Delphi v češtině
Re:OCR
« Odpověď #5 kdy: 10-12-2017, 09:12:25 »
Excellent
Rated 2 times
PUTF8Char = PAnsiChar;

UITypes je jen slouceni ruznych typu do jedne nizsi jednotky. Zkus to vymazat a uvidis co ti bude chybet

Rozbiti PDF je slozite, zalezi na tom jakym způsobem je to PDF vytvořené. PDF formát je velmi univerzální a ne vše co vypadá jako text, je v PDF uložen jako text.
Embarcadero MVP - Czech republic

Offline Ján Masaryk

  • Mladík
  • **
  • Příspěvků: 53
  • Karma: 5
    • Verze Delphi: 2010
Re:OCR
« Odpověď #6 kdy: 10-12-2017, 14:51:39 »
Ďakujem Radek.

UITypes som skúsil zrušiť, bez toho šlo. Poprehadzoval som PUTF8Char na PAnsiChar, ale ešte je tam veľa hlásení.

Budem to musieť skúsiť prekopať ešte raz odznova, lebo neviem, či som tam včera náhodou nevymazal niečo dôležité.

 

S rychlou odpovědí můžete používat BB kódy a emotikony jako v běžném okně pro odpověď, ale daleko rychleji.

Jméno: E-mail:
Ověření:
Kolik je šest plus čtyři (slovem):