06.01.2012 22:39
1
Zdravím,
dá se něják jenoduše elegantně zjistit, kdo mi sosá web přes funkci file_get_contents?

Díky
06.01.2012 22:55
2
ne, muzes projit log a hledat indicie (roboti jsou rpesni - interval prochazeni bude stale stejny), taky se koukej na user-agenta, u te fce byva prazdny (nicmene kdo prochazi aspon trochu s mozkem tak zakladni hlavicky jako user-agent nastavi) jine moznosti tu nejsou
07.01.2012 01:00
3
A to ten web, který sosá obsah, třeba není indexovaný? Že by to šlo vyhledat. Ale teď vařím z vody. Jinak já jednou objevil náhodou web, který nám sosal obsah, ale bylo to do iframe. A bylo to dost specifické téma, takže jsem to ve vyhledávači našel.
07.01.2012 20:18
4
Možná by stálo za to, udělat na toho bota nějakou past. Např. přístupy bez User-Agentu logovat někam do souboru (zároveň ale zobrazovat původní obsah, jinak by moc rychle přišli na to, co se děje.

Pokud má ale ten bot nastaveného User-Agenta, pak to tak jednoduché nebude. Možná mu podstrčit nějaký odkaz, na který by přešel, ale člověk ho ignoroval...?
07.01.2012 21:04
5
Přesně něco takového jsem měl na mysli, na druhou stranu, Google tohle zakazuje, tak aby nepřišla nějaká penalizace :/