Zadejte hledaný výraz...
Jakub Glos
Webtrh.cz
Vývoj webových stránek na WordPressu a proklientský přístup pro freelancery
Třídenní infromacemi nabitý prezenční + online kurz v Praze od Webtrhu pouze za 2 871 Kč
Více informací

Web archive wayback

theronin
verified
rating uzivatele
29. 7. 2013 12:31:09
Cau, nevite nekdo, jak dostat co nejvic souboru z web archivu? Nejak automaticky a co nejlevneji? Nasel jsem sw pro mac a pak dva placeny, ale vypada to neverohodne a je jsou drahy. Diky!
29. 7. 2013 12:31:09
https://webtrh.cz/diskuse/web-archive-wayback/#reply927819
Roman
verified
rating uzivatele
(15 hodnocení)
29. 7. 2013 13:07:40
Jestli jde přímo o Wayback Machine, tak jim napiš: http://faq.web.archive.org/how-can-i-have-my-site-removed-from-the-wayback-machine/
29. 7. 2013 13:07:40
https://webtrh.cz/diskuse/web-archive-wayback/#reply927818
theronin
verified
rating uzivatele
29. 7. 2013 13:09:52
To co jsi poslal je zadost o vymazani z archivu. Ja ho chci pouze stahnout.
29. 7. 2013 13:09:52
https://webtrh.cz/diskuse/web-archive-wayback/#reply927817
theronin
Nikdy jsem to nezkoušel, ale archive.org nabízí nějaké vlastní API, viz http://archive.org/help/json.php
29. 7. 2013 13:11:36
https://webtrh.cz/diskuse/web-archive-wayback/#reply927816
theronin
verified
rating uzivatele
29. 7. 2013 13:15:29
dekuju, ale tohle by se muselo asi nejak doprogramovat, protoze to co nabizeji resi pouze zobrazeni.
29. 7. 2013 13:15:29
https://webtrh.cz/diskuse/web-archive-wayback/#reply927815
Roman
verified
rating uzivatele
(15 hodnocení)
29. 7. 2013 13:23:56
Napsal theronin;978944
To co jsi poslal je zadost o vymazani z archivu. Ja ho chci pouze stahnout.
aha, špatně jsem to pochopil, myslel jsem, že chceš pryč s vlastní historií.
29. 7. 2013 13:23:56
https://webtrh.cz/diskuse/web-archive-wayback/#reply927814
wget -m "adresa v archivu" ... jen nevim na kolik to vsechno veme, chce to odzkouset.
29. 7. 2013 14:11:17
https://webtrh.cz/diskuse/web-archive-wayback/#reply927813
theronin
verified
rating uzivatele
29. 7. 2013 14:15:48
ale jo, wget a cygwin je dobry napad, ale moc to nefunguje.. wget -e robots=off --mirror --domains=web.archive.org http://web.archive.org/web/XXXXXX/http://www.YYYYYYY.com/
kazdopadne diky za jakoukoliv dalsi radu
29. 7. 2013 14:15:48
https://webtrh.cz/diskuse/web-archive-wayback/#reply927812
profesor
verified
rating uzivatele
(33 hodnocení)
29. 7. 2013 15:05:47
Tohle ti vytáhne URL archivovaných stránek - https://tools.digitalmethods.net/beta/internetArchiveWaybackMachineLinkRipper/
Obsah si pak postahuješ ručně ;), nebo v php přes curl/file_get_contents.
Edit: tak asi nic, vypadá to, že to nestahuje podstránky
29. 7. 2013 15:05:47
https://webtrh.cz/diskuse/web-archive-wayback/#reply927811
theronin
verified
rating uzivatele
29. 7. 2013 15:31:58
jj problem je s podstrankama. rucne to nedam, protoze potrebuji obnovit eshop klienta, ktery si nechal smazat a podstranek jsou tam stovky. :(
jinak co jsem nasel, tak tohle vypada podle screenshotu skvele: http://www.webarchivedownload.com, ale neco mi rika, ze to bude podvod..
pak jsem nasel jeste jednu moznost, ale to jede jenom na Macovi. bohuzel hodinu hledam navod, jak emulovat mac app a bezsance. jedine virtual s vcetne celeho OS a to zas nemam, takze take slepa ulice. treba nechapu, ze neni neco jako Wine.. Nenapada vas jak legalne obejit tohle? dik
29. 7. 2013 15:31:58
https://webtrh.cz/diskuse/web-archive-wayback/#reply927810
Jan Stejskal
verified
rating uzivatele
(7 hodnocení)
29. 7. 2013 15:46:09
Kdysi jsem používal Teleport Pro pro offline prohlížení webu. To by mohlo pomoct.
29. 7. 2013 15:46:09
https://webtrh.cz/diskuse/web-archive-wayback/#reply927809
theronin
verified
rating uzivatele
29. 7. 2013 15:56:33
dik, no zkousel jsem to poslat dolu s httrackerem, coz je asi cislo jedna pro stahovani webu pro offline, ale bohuzel, zacykli se na podstrankach, ale je pravda, ze ma hodne moznosti pro nastaveni a mozna jsem to nenastavil uplne nejlip.
29. 7. 2013 15:56:33
https://webtrh.cz/diskuse/web-archive-wayback/#reply927808
Pro odpověď se přihlašte.
Přihlásit