16.11.2019 18:53
1
Chtěli bychom monitorovat naše ceny na Heuréce. Bohužel Mergado ani placený i neplacený report od Heuréky nám nevyhovují.

Po technické stránce v PHP vím jak stáhnout data z URL adresy na Heuréce, jak to ale řešit například u 3000 stránek? Předpokládám, že budu muset projetí 3000 stránek rozložit například na jeden týden (430 stránek denně) a mezi jednotlivými stránkami bude muset být alespoň několika sekundová mezera, aby mě server Heuréky ihned nezablokoval. Mohl by mě někdo nasměrovat jak to v PHP řešit?

PHP script pojede v XAMPPu na PHP serveru. Napadlo mě použít Windows Scheduler a každou minutu spustit PHP script a parsovat jednu stránku, teoreticky bych tak projel 3000 produktů za dva dny. Neexistuje elegantnější řešení?
16.11.2019 20:25
2
bohuzial narazis. tiez som to skusal ked som si chcel spravit prehlad vyvoja cien v jednej kategorii ale maju tam skratka rate limit a nie je to uplne blbe. takze jedine ak maju nejake interne api, o ktorom neviem, inak asi len manualne 😄
17.11.2019 20:11
3
To, co hledáš je asi data scraping ne? Na to existuje např česká firma Apify nebo jednoduchá appka Octoparse - to jsem používal na získání dat z Instagramu a naprosto OK(cca 1000 postů za hodinu).