Zadejte hledaný výraz...

Stahování dat z Heuréky

uzivatel1
verified
rating uzivatele
(7 hodnocení)
16. 11. 2019 18:53:44
Chtěli bychom monitorovat naše ceny na Heuréce. Bohužel Mergado ani placený i neplacený report od Heuréky nám nevyhovují.
Po technické stránce v PHP vím jak stáhnout data z URL adresy na Heuréce, jak to ale řešit například u 3000 stránek? Předpokládám, že budu muset projetí 3000 stránek rozložit například na jeden týden (430 stránek denně) a mezi jednotlivými stránkami bude muset být alespoň několika sekundová mezera, aby mě server Heuréky ihned nezablokoval. Mohl by mě někdo nasměrovat jak to v PHP řešit?
PHP script pojede v XAMPPu na PHP serveru. Napadlo mě použít Windows Scheduler a každou minutu spustit PHP script a parsovat jednu stránku, teoreticky bych tak projel 3000 produktů za dva dny. Neexistuje elegantnější řešení?
16. 11. 2019 18:53:44
https://webtrh.cz/diskuse/stahovani-dat-z-heureky/#reply1424110
node
verified
rating uzivatele
(5 hodnocení)
16. 11. 2019 20:25:47
bohuzial narazis. tiez som to skusal ked som si chcel spravit prehlad vyvoja cien v jednej kategorii ale maju tam skratka rate limit a nie je to uplne blbe. takze jedine ak maju nejake interne api, o ktorom neviem, inak asi len manualne 😄
16. 11. 2019 20:25:47
https://webtrh.cz/diskuse/stahovani-dat-z-heureky/#reply1424109
sae
verified
rating uzivatele
17. 11. 2019 20:11:41
To, co hledáš je asi data scraping ne? Na to existuje např česká firma Apify nebo jednoduchá appka Octoparse - to jsem používal na získání dat z Instagramu a naprosto OK(cca 1000 postů za hodinu).
17. 11. 2019 20:11:41
https://webtrh.cz/diskuse/stahovani-dat-z-heureky/#reply1424108
Pro odpověď se přihlašte.
Přihlásit