Autor Téma: OCR  (Přečteno 1806 krát)

Offline Lukáš Vlček

  • Plnoletý
  • ***
  • Příspěvků: 144
  • Karma: 2
  • Strength Through Unity, Unity Through Faith.
    • Verze Delphi: Rad Studio XE8
    • Bludspeed s.r.o.
OCR
« kdy: 29-11-2017, 11:26:08 »
Zdravíčko pánové,

nedělál jste někdo někdy s OCR ? Mám dokumenty pdf (faktury) a chci z těch dokumentů vždy vyčíst číslo objednávky.

Nasměruje mě někdo ? :))

Děkuji vám :)
Strength Through Unity, Unity Through Faith.

Offline Jirka Ondricek

  • Mladík
  • **
  • Příspěvků: 86
  • Karma: 5
    • Verze Delphi: 10.2 Tokyo, 10.3 Rio
Re:OCR
« Odpověď #1 kdy: 29-11-2017, 11:41:47 »
Excellent
Rated 1 time
Dlouhodobě používám toto https://github.com/tesseract-ocr/tesseract. Práce s tím zpracovaná pro Delphi např. zde https://www.winsoft.sk/ocr.htm, ale to už je placené.

Používám to nejen na dokumenty, ale mnohem více na práci s obrazem z kamery a jsem spokojen.

Offline Radek Červinka

  • Administrátoři
  • Padawan
  • *****
  • Příspěvků: 3006
  • Karma: 108
    • Verze Delphi: D2007, DXE + 2 poslední
    • O Delphi v češtině
Re:OCR
« Odpověď #2 kdy: 29-11-2017, 13:36:10 »
Embarcadero MVP - Czech republic

Offline Lukáš Vlček

  • Plnoletý
  • ***
  • Příspěvků: 144
  • Karma: 2
  • Strength Through Unity, Unity Through Faith.
    • Verze Delphi: Rad Studio XE8
    • Bludspeed s.r.o.
Re:OCR
« Odpověď #3 kdy: 29-11-2017, 14:11:59 »
Děkuju pánové :) jdu tvořit :)
Strength Through Unity, Unity Through Faith.

Offline Ján Masaryk

  • Mladík
  • **
  • Příspěvků: 89
  • Karma: 5
    • Verze Delphi: 2010
Re:OCR
« Odpověď #4 kdy: 09-12-2017, 20:45:35 »
Zdravím všetkých :)

Skúšal som TTesseractOCR4 podľa linku od Radka a skončil som na hlásení o neexistujúcom UITypes a následne na PUTF8Char,
čo sú nové veci v Delphi XE  :'(

Existuje niečo aj pre staršie Delphi (D2010) ? Zatiaľ som nič nenašiel.

Alebo to skúsim inak.

Existuje nejaká knižnica pre Delphi na "rozbitie" PDF dokumentu na elementy a následné vyčítanie údajov?

Vopred ďakujem za odpovede  :)


Offline Radek Červinka

  • Administrátoři
  • Padawan
  • *****
  • Příspěvků: 3006
  • Karma: 108
    • Verze Delphi: D2007, DXE + 2 poslední
    • O Delphi v češtině
Re:OCR
« Odpověď #5 kdy: 10-12-2017, 09:12:25 »
Excellent
Rated 2 times
PUTF8Char = PAnsiChar;

UITypes je jen slouceni ruznych typu do jedne nizsi jednotky. Zkus to vymazat a uvidis co ti bude chybet

Rozbiti PDF je slozite, zalezi na tom jakym způsobem je to PDF vytvořené. PDF formát je velmi univerzální a ne vše co vypadá jako text, je v PDF uložen jako text.
Embarcadero MVP - Czech republic

Offline Ján Masaryk

  • Mladík
  • **
  • Příspěvků: 89
  • Karma: 5
    • Verze Delphi: 2010
Re:OCR
« Odpověď #6 kdy: 10-12-2017, 14:51:39 »
Ďakujem Radek.

UITypes som skúsil zrušiť, bez toho šlo. Poprehadzoval som PUTF8Char na PAnsiChar, ale ešte je tam veľa hlásení.

Budem to musieť skúsiť prekopať ešte raz odznova, lebo neviem, či som tam včera náhodou nevymazal niečo dôležité.