Zadejte hledaný výraz...

Neindexování v robots.txt pro jednu domény

Tomasoo
verified
rating uzivatele
(2 hodnocení)
5. 9. 2011 20:30:08
Ahoj,
mám 2 domény xyz.cz a xyz.sk s tím, že hlavní je xyz.cz a do jejího adresáře je nasměrována .sk.
.cz doména funguje normálně bez perifexu
.sk doména má perifex xyz.sk/sk
avšak roboti indexují u i xyz.cz i perifex xyz.cz/sk čímž se dostávají na stejný obsah jako u sk domény je tedy možné neindexovat /sk perifex, ale jen u české domény, když jsou oba weby nasměrovány do stejného adresáře?
Díky
5. 9. 2011 20:30:08
https://webtrh.cz/diskuse/neindexovani-v-robots-txt-pro-jednu-domeny/#reply674074
jarin001
verified
rating uzivatele
(37 hodnocení)
5. 9. 2011 20:47:54
Je to možné, sk je v tomto případě pouze adresář (pokud ne fyzický tak virtual), zakážeš tedy indexování pouze totoho adresáře na doméně xyz.cz - Disallow: /sk
5. 9. 2011 20:47:54
https://webtrh.cz/diskuse/neindexovani-v-robots-txt-pro-jednu-domeny/#reply674073
pozor, musí to být uzavřeno mezi lomítka:
Disallow: /sk/
Disallow: /sk znamená, že zakáže vše co začína na sk
takže třeba i sklep.html
5. 9. 2011 21:31:31
https://webtrh.cz/diskuse/neindexovani-v-robots-txt-pro-jednu-domeny/#reply674072
jarin001
verified
rating uzivatele
(37 hodnocení)
5. 9. 2011 21:37:33
To lomítko jsem tam nedal schválně, pochopil jsem to tak že xyz.cz/sk je jen virtuální adresář (doména), pro fyzický by samozřejmě platilo ještě lomítko za sk.
Edit viz : xyz.cz i perifex xyz.cz/sk čímž se dostávají na stejný obsah
5. 9. 2011 21:37:33
https://webtrh.cz/diskuse/neindexovani-v-robots-txt-pro-jednu-domeny/#reply674071
aha, tak to máš pravdu, ale aby se zamezilo tomu, co jsem napsal v předchozím příspěvku, tak bych tedy doporučil
Disallow: /sk$
jsou to v podstatě regularní výrazy
pěkně popsané je to zde http://www.jakpsatweb.cz/robots-txt.html
5. 9. 2011 21:41:50
https://webtrh.cz/diskuse/neindexovani-v-robots-txt-pro-jednu-domeny/#reply674070
jarin001
verified
rating uzivatele
(37 hodnocení)
5. 9. 2011 21:48:27
JJ, to bude konečná verze :-)
5. 9. 2011 21:48:27
https://webtrh.cz/diskuse/neindexovani-v-robots-txt-pro-jednu-domeny/#reply674069
Tomasoo
verified
rating uzivatele
(2 hodnocení)
6. 9. 2011 11:51:01
Jak jsem říkal - obě domény jsou nasměrovány na stejný obsah CZ pracuje pod xyz.cz a SK pod xyz.sk/sk
Kdybych použil Disallow: /sk$ tak tím nebude indexováno i ta sk verze, která má být. Mělo by to být platné jen u CZ domény.
Nebo se mýlím?
Díky
6. 9. 2011 11:51:01
https://webtrh.cz/diskuse/neindexovani-v-robots-txt-pro-jednu-domeny/#reply674068
jarin001
verified
rating uzivatele
(37 hodnocení)
6. 9. 2011 12:23:20
Jak jsem psal v mém prvním příspěvku, zakaž indexování sk pouze na doméně xyz.cz. Xyz.sk/sk bude normálně indexována protože si na xyz.cz/sk sahá pouze pro obsah.
Pro jasnější posouzení by bylo dobré uvést samozřejmě domény.
6. 9. 2011 12:23:20
https://webtrh.cz/diskuse/neindexovani-v-robots-txt-pro-jednu-domeny/#reply674067
Tomasoo
verified
rating uzivatele
(2 hodnocení)
6. 9. 2011 12:36:06
SK sahá pro obsah včetně robots.txt
tedy na CZ i SK je robot.txt stejný
6. 9. 2011 12:36:06
https://webtrh.cz/diskuse/neindexovani-v-robots-txt-pro-jednu-domeny/#reply674066
jarin001
verified
rating uzivatele
(37 hodnocení)
6. 9. 2011 12:51:13
Napsal Tomasoo;697957
SK sahá pro obsah včetně robots.txt
tedy na CZ i SK je robot.txt stejný
Není stejný, každá doména má svůj robots.txt s různým nastavením, nemůžeš např. na doméně ...cz zakazovat robotům přístup na ....sk, tobě jde samozřejmě o možnou (zřejmě jistou) duplikaci, takže při použití návodu výše :
Roboti budou indexovat všechny adresy xyz.cz kromě /sk, dále budou indexovat všechny adresy na doméně xyz.sk.
6. 9. 2011 12:51:13
https://webtrh.cz/diskuse/neindexovani-v-robots-txt-pro-jednu-domeny/#reply674065
Pro odpověď se přihlašte.
Přihlásit