Zadejte hledaný výraz...

Automatický web scraper

Luděk Kvapil
verified
rating uzivatele
28. 8. 2014 15:54:02
Máte nějaký tip na webscraper, který by dokázal projet zadané URL a vybrat z nich určitý obsah definovaný přes Xpath? Mělo by to probíhat automaticky. Abych nemusel scapovat každou stránku zvlášť. No a kdyby uměl i sám ty URL na zadané doméně zaindexovat, tak už by to byly vůbec skvělé.
28. 8. 2014 15:54:02
https://webtrh.cz/diskuse/automaticky-web-scraper#reply1050819
profesor
verified
rating uzivatele
(33 hodnocení)
28. 8. 2014 16:08:46
Není to asi přesně to, co hledáš, ale jako výchozí třída dobré - http://sourceforge.net/projects/simplehtmldom/
28. 8. 2014 16:08:46
https://webtrh.cz/diskuse/automaticky-web-scraper#reply1050818
Luděk Kvapil
verified
rating uzivatele
28. 8. 2014 16:42:11
Napsal profesor;1119263
Není to asi přesně to, co hledáš, ale jako výchozí třída dobré - http://sourceforge.net/projects/simplehtmldom/
Jak je tam to upravit a zápis:
tak to find je v xPath? Na webu to tam moc nerozebírají.
Já mám třeba cestu //section/div/div. Fungovalo by to takhle?
---------- Příspěvek doplněn 28.08.2014 v 16:45 ----------
Jo a možná ještě jedna věc. Rád bych to měl vyexportovatelné do nějakého formátu pro tabulkový procesor
28. 8. 2014 16:42:11
https://webtrh.cz/diskuse/automaticky-web-scraper#reply1050817
Pro odpověď se přihlašte.
Přihlásit