Zadejte hledaný výraz...

Seznam indexovaných stránek

meloun
verified
rating uzivatele
(5 hodnocení)
2. 1. 2010 13:51:39
Zdravím,
budu měnit strukturu webu a především odstraňovat duplicity, ale pro co nejúplnější přesměrování bych potřeboval seznam indexovaných stránek (opravdu seznam samotných adres, takže neraďte, ať zadám "site:mojedomena.cz") - existuje na to nějaká utilita? Potřeboval bych to vytáhnout ze Seznamu, ten indexuje nejvíc duplicit u daného webu...
Díky všem za rady.
2. 1. 2010 13:51:39
https://webtrh.cz/diskuse/seznam-indexovanych-stranek#reply430239
Jakub Stacho
verified
rating uzivatele
(20 hodnocení)
2. 1. 2010 14:42:03
Znáš Xenu? Nejčastěji se sice používá na odhalování 404, ale proskenováním získáš vlastně seznam všech inlinků.
Pokud by ti šlo i o odkazy zvenku, tak snad jen připsat do kódu hlídání refererů a třeba měsíc to logovat.
Zkus kdyžtak upřesnit, o co přesně ti jde...
2. 1. 2010 14:42:03
https://webtrh.cz/diskuse/seznam-indexovanych-stranek#reply430238
meloun
verified
rating uzivatele
(5 hodnocení)
2. 1. 2010 15:00:28
Joo, o Xeně jsem slyšel, ale nikdy jsem nekoukal, co všechno umí =) I když inlinky asi stačit nebudou...
Jde mi o to získat adresy, které mi vyjedou, když na seznamu zadám "site:mojedomena.cz", ale prostě jen adresy jako seznam, jeden řádek, jedna adresa.
Na seznamu jsou zaindexované stovky duplicit na mém webu a rád bych je správně přesměroval na jedinečné adresy... A seznam inlinků úplně tak nestačí, protože spousta těch stránek už na webu není...
Ale aspoň něco, díky moc ;o)
2. 1. 2010 15:00:28
https://webtrh.cz/diskuse/seznam-indexovanych-stranek#reply430237
Jakub Stacho
verified
rating uzivatele
(20 hodnocení)
2. 1. 2010 15:20:17
Aha.
Každopádně i kdyby sis rozparsoval to, co ti vyjede na seznamu přes site, tak ti to stejně bude k ničemu. Protože tam už seznam duplicity přece nevypisuje. Pokud vím...
2. 1. 2010 15:20:17
https://webtrh.cz/diskuse/seznam-indexovanych-stranek#reply430236
meloun
verified
rating uzivatele
(5 hodnocení)
2. 1. 2010 15:27:50
No, vzhledem k tomu, že mám fakticky na webu asi 500 stránek a seznam jich indexuje 2400, duplicity tam jsou :o)
2. 1. 2010 15:27:50
https://webtrh.cz/diskuse/seznam-indexovanych-stranek#reply430235
TouSt
verified
rating uzivatele
(1 hodnocení)
2. 1. 2010 15:57:30
Pokud jde o seznam.cz , mozna to zkusit vytahat pres script. Pouzit format vystupu na hledani RSS pr.: http://search.seznam.cz/?q=site%3Aonlinovky.cz&from=10&count=10&format=rss , poukladat si ty adresy nekam do souboru ci DB a pak si je zpracovat podle potreby. Teda jestli jsem pochopil co potrebujes...
2. 1. 2010 15:57:30
https://webtrh.cz/diskuse/seznam-indexovanych-stranek#reply430234
Pro odpověď se přihlašte.
Přihlásit