Ahoj všem. Potřeboval bych implementovat na webu nějaké OCR. Uživatel uploaduje fotku v podobě obrázku a já ji někde na serveru převedu na text. Český text. Může jít o online službu s API nebo i on premise software.
Trochu jsem zkoumal a nějaké tipy mám, ale zatím nic dostatečně rozumného jsem nenašel. Prioritou je spolehlivost a kvalita.
Píšu sem proto, že třeba někde existuje někdo, kdo již tento problém řešil a může něco na základě svých zkušeností doporučit. Na Googlu jinak umím hledat i sám.
Díky.
OCR na serveru
Veľmi závisí od toho, aký druh textu je na tej fotke.
Ak sa jedná o čistý/dlhý text, tak používame to, kde má klient už doriešené zmluvy (Google, Azure, Amazon) rozdiely medzi nimi nie sú obvykle tak veľké, aby to stálo za byrokraciu :)
Ak sa jedná o špecifický text - typicky formuláre/žiadosti. Tak je často najlepšie riešenie vziať Tesseract (open-source) a doladiť ho na konkrétne formuláre (u nás napr. technický preukaz).
Ak je to generická zmes, tak máš problém