Stránka 3 z 3

Re: zajímavé stránky

Napsal: 10. 8. 2020, 10:00
od Grad
Díky, wget.exe stažen, uložen do adresáře D:\offline-web a spuštěn z příkazového řádku (po zmáčknuti tlačítka Start ve Win jediné pole kam lze psát) a to skopírováním příkazu níže a pak Enter :D

Kód: Vybrat vše

D:\offline-web\wget --directory-prefix="kubac" --execute="robots = off" --mirror --convert-links --no-parent http://petr-kubac.blog.cz/
Základní info o možnostech wget https://www.kutac.cz/pocitace-a-interne ... omoci-wget
Zatím to běží, ale předběžně to vypadá slibně.
Obsah lze prohlížet offline, tj. vnitřní linky jsou předělané a externí jsou také OK.
Uvidíme jak to dopadne

Re: zajímavé stránky

Napsal: 10. 8. 2020, 10:32
od prcek
Grad píše: 10. 8. 2020, 10:00 Díky, wget.exe stažen, uložen do adresáře D:\offline-web a spuštěn z příkazového řádku (po zmáčknuti tlačítka Start ve Win jediné pole kam lze psát) a to skopírováním příkazu níže a pak Enter :D

Kód: Vybrat vše

D:\offline-web\wget --directory-prefix="kubac" --execute="robots = off" --mirror --convert-links --no-parent http://petr-kubac.blog.cz/
Základní info o možnostech wget https://www.kutac.cz/pocitace-a-interne ... omoci-wget
Zatím to běží, ale předběžně to vypadá slibně.
Obsah lze prohlížet offline, tj. vnitřní linky jsou předělané a externí jsou také OK.
Uvidíme jak to dopadne
Mel jsi tomu pridat -o log.txt a pak se podivat, ktere ze to linky se nepovedlo stahnout. Kazdopadne preji, aby to proslo napoprve a spravne.
edit: zmeneno -o na male (velke dela neco jineho)

Re: zajímavé stránky

Napsal: 10. 8. 2020, 10:57
od robokop
Ja wgetem klonoval zivej web tak aby z nej byl mirror. Kazdy den update. Vyborny a silny nastroj.

Re: zajímavé stránky

Napsal: 10. 8. 2020, 12:37
od mmuzila
prcek píše: 8. 8. 2020, 2:33 Je na prd, ze blog.cz ma na jine domene obrazky a na jine textovy obsah.
Pro rekurzivni stahovani se da pouzit wget ale pak je treba ze stazenych stranek vyparsovat odkazy na obrazky, scripty, css a dostahovat si je. A nasledne data upravit tak, aby to spolecne fungovalo.
Mam to v procesu (mj i kubacuv), ale uspechem si jisty nejsem.
Mimo to blog.cz vic pada, nez jede, takze stahnout to je docela orisek.
Obrázky (a ostatný balast) z inej domény sa dá stiahnuť aj pomocou wget.

Použil by som niečo ako:

Kód: Vybrat vše

wget --convert-links --random-wait -r -p  -E -e robots=off  -H -Djxs.cz -Dmlgeardesigns.blog.cz -U mozilla mlgeardesigns.blog.cz -o log.txt
Za zmienku stojí najmä:

Kód: Vybrat vše

 -H -Djxs.cz -Dmlgeardesigns.blog.cz
Výňatok z manuálu:

Kód: Vybrat vše

 -H
 --span-hosts
            Enable spanning across hosts when doing recursive retrieving.
            
-D domain-list
--domains=domain-list
           Set domains to be followed.  domain-list is a comma-separated list
           of domains.  Note that it does not turn on -H.

Re: zajímavé stránky

Napsal: 10. 8. 2020, 12:57
od xener
-H -Djxs.cz,mlgeardesigns.blog.cz

Re: zajímavé stránky

Napsal: 29. 10. 2020, 9:12
od marekluks@seznam.cz
Dobrý den, jsem rád že se Vám můj blog mlgeardesigns líbí. Server blog.cz sice skončil, nicméně jsem svůj blog přesunul jinam. Zde je link:
https://mlgeardesigns.blogspot.com/