04.02.2023 22:34
1
Ahoj všem. Potřeboval bych implementovat na webu nějaké OCR. Uživatel uploaduje fotku v podobě obrázku a já ji někde na serveru převedu na text. Český text. Může jít o online službu s API nebo i on premise software.

Trochu jsem zkoumal a nějaké tipy mám, ale zatím nic dostatečně rozumného jsem nenašel. Prioritou je spolehlivost a kvalita.

Píšu sem proto, že třeba někde existuje někdo, kdo již tento problém řešil a může něco na základě svých zkušeností doporučit. Na Googlu jinak umím hledat i sám.

Díky.
05.02.2023 10:02
2
Veľmi závisí od toho, aký druh textu je na tej fotke.
Ak sa jedná o čistý/dlhý text, tak používame to, kde má klient už doriešené zmluvy (Google, Azure, Amazon) rozdiely medzi nimi nie sú obvykle tak veľké, aby to stálo za byrokraciu :) 
Ak sa jedná o špecifický text - typicky formuláre/žiadosti. Tak je často najlepšie riešenie vziať Tesseract (open-source) a doladiť ho na konkrétne formuláre (u nás napr. technický preukaz). 
Ak je to generická zmes, tak máš problém
10.02.2023 00:14
3
Asi záleží, co tam je, ale nečekejte, že nějaké off-the-shelf řešení to vyřeší. Na tohle se utrácí miliony nebo desítky milionů třeba v oblasti zpracování faktur. Něco se dá postavit na Tesseract-ORC.