Zadejte hledaný výraz...

Jak vygrabovat cast textu ze stranky (PHP nebo JQUERY)

Jiří Vávrů
verified
rating uzivatele
(30 hodnocení)
28. 10. 2011 20:02:16
Zdravim,
snazim se vygrabovat cast textu ze stranky horoskopy.cz, kontretne http://horoskopy.cz/stir
Konkretne bych rad obsah divu.
Nejlepsi kdyby mi nejaka PHP knihovna umoznovala pristup k DOM modelu a ja si vygraboval v requestu jednotlive DIVy.
Tusi nekdo jak to provest bez pouziti regulrnich vyrazu, zkratka co nejvice easy?
Diky za kazdou radu.
28. 10. 2011 20:02:16
https://webtrh.cz/diskuse/jak-vygrabovat-cast-textu-ze-stranky-php-nebo-jquery/#reply692458
Ladislav Balon
verified
rating uzivatele
(110 hodnocení)
28. 10. 2011 20:11:44
Je to možná trochu kostrbaté řešení ale funguje, pokud jsem vám pomohl budu rád za reputaci +1 =)
28. 10. 2011 20:11:44
https://webtrh.cz/diskuse/jak-vygrabovat-cast-textu-ze-stranky-php-nebo-jquery/#reply692457
sharkws
verified
rating uzivatele
(6 hodnocení)
28. 10. 2011 20:15:18
měl bych strach že $html bude obsahovat více ukončení
což je zrovna asi tento případ potom by to mohl být problém, ale jinak určitě funkční řešení
28. 10. 2011 20:15:18
https://webtrh.cz/diskuse/jak-vygrabovat-cast-textu-ze-stranky-php-nebo-jquery/#reply692456
hm
verified
rating uzivatele
(20 hodnocení)
28. 10. 2011 20:18:08
bud regulary nebo xpath = simplexml + xpath :) rivalovo reseni je snad to nejhorsi co jsem kdy videl :))
regulary asi takhle
$data = file_get_contents('http://horoskopy.cz/stir');
preg_match('~
(.*)?
~i',$data,$matches);
echo $matches;
a bacha na autorska prava :) protoze kradeni obsahu je rozhodne trestne a autorska prava jsou vymahatelna :)
28. 10. 2011 20:18:08
https://webtrh.cz/diskuse/jak-vygrabovat-cast-textu-ze-stranky-php-nebo-jquery/#reply692455
Tom
verified
rating uzivatele
(6 hodnocení)
28. 10. 2011 20:30:25
A máš na to autorská práva? ;) jestli jo, tak pomůžu..
28. 10. 2011 20:30:25
https://webtrh.cz/diskuse/jak-vygrabovat-cast-textu-ze-stranky-php-nebo-jquery/#reply692454
Jiří Vávrů
verified
rating uzivatele
(30 hodnocení)
28. 10. 2011 20:48:51
Napsal Jadro007;717578
A máš na to autorská práva? ;) jestli jo, tak pomůžu..
Nemam na to samoztreme autorska prava, jen si rad ctu horoskopy na seznamu:) No a kdyz tam neni moznost si je nechat posilat e-mailem, tak kdo na to ma porad myslet, takhle by mi mohl kazde rano pekne prijit na mail vzdycky v 6 spustim cronem skript a rano se mrknu co me "ceka":)
JInak dekuji za vsechny rady, necekal jsem tak rychlou radu.
28. 10. 2011 20:48:51
https://webtrh.cz/diskuse/jak-vygrabovat-cast-textu-ze-stranky-php-nebo-jquery/#reply692453
Tom
verified
rating uzivatele
(6 hodnocení)
28. 10. 2011 20:58:22
vj: dobře, to beru, osobně bych ti doporučil simpleHTMLDOM (http://simplehtmldom.sourceforge.net/) a pomocí tohoto kódu to z toho dostaneš (nezapomeň nalinkovat příslušnou knihovnu):
Osobně mi to přijde jako nejčistší řešení :)
28. 10. 2011 20:58:22
https://webtrh.cz/diskuse/jak-vygrabovat-cast-textu-ze-stranky-php-nebo-jquery/#reply692452
Napsal vj;717569
Tusi nekdo jak to provest bez pouziti regulrnich vyrazu...
Neštiťte se jich, ušetří vám spoustu práce a opravdu _nejsou_ složité.
3. 11. 2011 14:58:24
https://webtrh.cz/diskuse/jak-vygrabovat-cast-textu-ze-stranky-php-nebo-jquery/#reply692451
Jak se říká:
Člověk dostane při střetu s problémem nápad:
"Použiju regulární výraz."
Najednou má problémy dva.
:)
3. 11. 2011 15:17:21
https://webtrh.cz/diskuse/jak-vygrabovat-cast-textu-ze-stranky-php-nebo-jquery/#reply692450
hm
verified
rating uzivatele
(20 hodnocení)
3. 11. 2011 15:58:42
:) porad nechapu co vsichni proti regularum maj :) jasny ze na zpracovani html/xml, pokud jde o neco duleziteho s vysokymi na roky na fcnost se vic hodi DOM, simplexml, xpath... okey... ale pokud delam neco jendorazove, treba i pro svoje potreby apod. pak je regular ve vetsine pripadu mnohem rychlejsi reseni :) (teda pokud je clovek skutecne ovlada) :)
3. 11. 2011 15:58:42
https://webtrh.cz/diskuse/jak-vygrabovat-cast-textu-ze-stranky-php-nebo-jquery/#reply692449
Mám regexy taky rád jako výzvu v technickém těsnopisu :), ale na druhou stranu jsem si vědom toho, že to je velmi křehké - nerobustní řešení, které se může rozsypat.
Je to vlastně technický dluh, do budoucna má vyšší maintenance cost.
3. 11. 2011 16:02:46
https://webtrh.cz/diskuse/jak-vygrabovat-cast-textu-ze-stranky-php-nebo-jquery/#reply692448
genesis
verified
rating uzivatele
(3 hodnocení)
30. 11. 2011 18:08:51
Napsal Aleš Jiříček;719600
:) porad nechapu co vsichni proti regularum maj :) jasny ze na zpracovani html/xml, pokud jde o neco duleziteho s vysokymi na roky na fcnost se vic hodi DOM, simplexml, xpath... okey... ale pokud delam neco jendorazove, treba i pro svoje potreby apod. pak je regular ve vetsine pripadu mnohem rychlejsi reseni :) (teda pokud je clovek skutecne ovlada) :)
Podívej se. Developer změní
na
a už tu máme průšvih
30. 11. 2011 18:08:51
https://webtrh.cz/diskuse/jak-vygrabovat-cast-textu-ze-stranky-php-nebo-jquery/#reply692447
hm
verified
rating uzivatele
(20 hodnocení)
1. 12. 2011 08:57:21
Napsal genesis;728660
Podívej se. Developer změní
na
a už tu máme průšvih
ani ne :) kdyz s timhle budu chtit pocitat, vcetne prehazeni poradi atributu apod. tak s tim taky pocitat budu (zas tak moc slozitejsi regular to nebude)... kazdopadne jak rikam, pokud by slo o neco duleziteho tak bych to pres regulary nedelal, pokud jde o jednorazove nebo nedulezite veci, je regular rychle a efektivni reseni.
Uznavam vsak ze regulary se nejvic hodi na klasicky text, uzivatelske vstupy (formulare a jejich validace) apod.
1. 12. 2011 08:57:21
https://webtrh.cz/diskuse/jak-vygrabovat-cast-textu-ze-stranky-php-nebo-jquery/#reply692446
Pro odpověď se přihlašte.
Přihlásit