Stránka 3 z 3
Re: zajímavé stránky
Napsal: 10. 8. 2020, 10:00
od Grad
Díky,
wget.exe stažen, uložen do adresáře D:\offline-web a spuštěn z příkazového řádku (po zmáčknuti tlačítka Start ve Win jediné pole kam lze psát) a to skopírováním příkazu níže a pak Enter
Kód: Vybrat vše
D:\offline-web\wget --directory-prefix="kubac" --execute="robots = off" --mirror --convert-links --no-parent http://petr-kubac.blog.cz/
Základní info o možnostech wget
https://www.kutac.cz/pocitace-a-interne ... omoci-wget
Zatím to běží, ale předběžně to vypadá slibně.
Obsah lze prohlížet offline, tj. vnitřní linky jsou předělané a externí jsou také OK.
Uvidíme jak to dopadne
Re: zajímavé stránky
Napsal: 10. 8. 2020, 10:32
od prcek
Grad píše: ↑10. 8. 2020, 10:00
Díky,
wget.exe stažen, uložen do adresáře D:\offline-web a spuštěn z příkazového řádku (po zmáčknuti tlačítka Start ve Win jediné pole kam lze psát) a to skopírováním příkazu níže a pak Enter
Kód: Vybrat vše
D:\offline-web\wget --directory-prefix="kubac" --execute="robots = off" --mirror --convert-links --no-parent http://petr-kubac.blog.cz/
Základní info o možnostech wget
https://www.kutac.cz/pocitace-a-interne ... omoci-wget
Zatím to běží, ale předběžně to vypadá slibně.
Obsah lze prohlížet offline, tj. vnitřní linky jsou předělané a externí jsou také OK.
Uvidíme jak to dopadne
Mel jsi tomu pridat -o log.txt a pak se podivat, ktere ze to linky se nepovedlo stahnout. Kazdopadne preji, aby to proslo napoprve a spravne.
edit: zmeneno -o na male (velke dela neco jineho)
Re: zajímavé stránky
Napsal: 10. 8. 2020, 10:57
od robokop
Ja wgetem klonoval zivej web tak aby z nej byl mirror. Kazdy den update. Vyborny a silny nastroj.
Re: zajímavé stránky
Napsal: 10. 8. 2020, 12:37
od mmuzila
prcek píše: ↑8. 8. 2020, 2:33
Je na prd, ze blog.cz ma na jine domene obrazky a na jine textovy obsah.
Pro rekurzivni stahovani se da pouzit
wget ale pak je treba ze stazenych stranek vyparsovat odkazy na obrazky, scripty, css a dostahovat si je. A nasledne data upravit tak, aby to spolecne fungovalo.
Mam to v procesu (mj i kubacuv), ale uspechem si jisty nejsem.
Mimo to blog.cz vic pada, nez jede, takze stahnout to je docela orisek.
Obrázky (a ostatný balast) z inej domény sa dá stiahnuť aj pomocou wget.
Použil by som niečo ako:
Kód: Vybrat vše
wget --convert-links --random-wait -r -p -E -e robots=off -H -Djxs.cz -Dmlgeardesigns.blog.cz -U mozilla mlgeardesigns.blog.cz -o log.txt
Za zmienku stojí najmä:
Kód: Vybrat vše
-H -Djxs.cz -Dmlgeardesigns.blog.cz
Výňatok z manuálu:
Kód: Vybrat vše
-H
--span-hosts
Enable spanning across hosts when doing recursive retrieving.
-D domain-list
--domains=domain-list
Set domains to be followed. domain-list is a comma-separated list
of domains. Note that it does not turn on -H.
Re: zajímavé stránky
Napsal: 10. 8. 2020, 12:57
od xener
-H -Djxs.cz,mlgeardesigns.blog.cz
Re: zajímavé stránky
Napsal: 29. 10. 2020, 9:12
od marekluks@seznam.cz
Dobrý den, jsem rád že se Vám můj blog mlgeardesigns líbí. Server blog.cz sice skončil, nicméně jsem svůj blog přesunul jinam. Zde je link:
https://mlgeardesigns.blogspot.com/