Zadejte hledaný výraz...

Parser letáků ve stylu Kupi.cz

peeters111
verified
rating uzivatele
(4 hodnocení)
14. 4. 2015 12:16:12
Ahoj,
zajímalo by mě, zdali někdo nevíte jakým způsobem se dostávají servery jako kupi.cz apod. k letákům daných řetězců? Existuje nějaký parser?
S pozdravem
Petr
14. 4. 2015 12:16:12
https://webtrh.cz/diskuse/parser-letaku-ve-stylu-kupi-cz#reply1106278
Dmitrij
verified
rating uzivatele
14. 4. 2015 13:45:44
Zajímavý dotaz, také se přidávám.
Předem díky za případné rady
Dmitrij
14. 4. 2015 13:45:44
https://webtrh.cz/diskuse/parser-letaku-ve-stylu-kupi-cz#reply1106277
tomve
verified
rating uzivatele
(22 hodnocení)
14. 4. 2015 13:53:05
Vytáhnou si to z ofic webu ;)
14. 4. 2015 13:53:05
https://webtrh.cz/diskuse/parser-letaku-ve-stylu-kupi-cz#reply1106276
Pavel Kysilka
verified
rating uzivatele
19. 7. 2015 13:57:20
Napsal peeters111;1186314
Ahoj,
zajímalo by mě, zdali někdo nevíte jakým způsobem se dostávají servery jako kupi.cz apod. k letákům daných řetězců? Existuje nějaký parser?
S pozdravem
Petr
zdravim,
na necem pracuji pro jednu firmu pro letaky smerem na zapad od CR. Do toho z vytezovanim dat mam par let zkusenosti.
Popisi o dane aplikaci par zkusenosti, i obchodnich.
Urcite bych se nespolehal na nejake parsovani HTML. Treba i z duvodu zablokovani pristupu pri mirrovani. Takze zbyva PDF.
Je to trosku pracnejsi vec. V PHP bych to ani nepsal. To co by mel programator umet je predevsim shlukova analyza.
Prace s obdelniky a geometrii. Pak to chce umet rozpoznavat data a samotne regularni vyrazy asi nebudou stacit. Nerikam, ze to nejde.
Jedna vec je rozpoznat data. Dalsi vec je umet ty data zkontrolovat a taky zkontrolovat na zaklade jiz predchozich vysledku.
Navic system z principu nebude uplne 100% presny a bezudrzbovy.
Cenove pocitejte reseni zhruba okolo 200 tisic, 4 clovekomesice vyvoje. Plus nejaka prilezitostna mensi udrzba, kdyz se zmeni design, layout, klicova slova letaku.
Dalsi zadrhel je v tom, ze uz par obchodnich retezcu preslo na letaky ciste jako obrazky bez textu. Jasne, da se udelat OCR, ale uz se o to nekdo musi starat + resite presnost dat typu el a jednicka.
Dalsi stranka je, jak je to legalni? To si dovedu nejspise osetrit, nebot stahovani letaku neresim.
Osobne jsem premyslel i o nejake online sluzbe, ale to je rovnou poukazka, ze vyrobci letaku si na tom budou testovat, jak co dany parser umi a neumi.
Nebo, ze me nekdo slusne upozorni pres pravni oddeleni.
Podle me by to bylo nepruchodne v dnesni dobe zejmena cenove. Za 10,30, 50kKc se to proste vyrobit neda, tak aby to bylo presne a spolehlive.
Kazdopadne by me zajimalo jak soukrome do emailu, tak mozno i do diskuze, za jakou cenu by byla sluzba pro uzivatele zajimava. Jak cena za reseni, tak i cena za zpracovani jednoho letaku.
Ciste si delam zatim jen pruzkum trhu.
Pavel
19. 7. 2015 13:57:20
https://webtrh.cz/diskuse/parser-letaku-ve-stylu-kupi-cz#reply1106275
Pavel Kysilka
verified
rating uzivatele
21. 7. 2015 18:03:43
Doplnim jeste jednu dulezitou zkusenost z vyvoje.
Pokud by jste chtel nekdo neco takoveho programovat, tak se pripravte na to, ze letaky maji ochranne prvky.
To znamena, ze prvky komplikujici nejen vytezovani dat, ale i zobrazovani.
21. 7. 2015 18:03:43
https://webtrh.cz/diskuse/parser-letaku-ve-stylu-kupi-cz#reply1106274
Pro odpověď se přihlašte.
Přihlásit