zajímavé stránky

Grad
Příspěvky: 2073
Registrován: 13. 7. 2014, 9:32

10. 8. 2020, 10:00

Díky, wget.exe stažen, uložen do adresáře D:\offline-web a spuštěn z příkazového řádku (po zmáčknuti tlačítka Start ve Win jediné pole kam lze psát) a to skopírováním příkazu níže a pak Enter :D

Kód: Vybrat vše

D:\offline-web\wget --directory-prefix="kubac" --execute="robots = off" --mirror --convert-links --no-parent http://petr-kubac.blog.cz/
Základní info o možnostech wget https://www.kutac.cz/pocitace-a-interne ... omoci-wget
Zatím to běží, ale předběžně to vypadá slibně.
Obsah lze prohlížet offline, tj. vnitřní linky jsou předělané a externí jsou také OK.
Uvidíme jak to dopadne
prcek
Příspěvky: 692
Registrován: 31. 10. 2016, 2:26

10. 8. 2020, 10:32

Grad píše: 10. 8. 2020, 10:00 Díky, wget.exe stažen, uložen do adresáře D:\offline-web a spuštěn z příkazového řádku (po zmáčknuti tlačítka Start ve Win jediné pole kam lze psát) a to skopírováním příkazu níže a pak Enter :D

Kód: Vybrat vše

D:\offline-web\wget --directory-prefix="kubac" --execute="robots = off" --mirror --convert-links --no-parent http://petr-kubac.blog.cz/
Základní info o možnostech wget https://www.kutac.cz/pocitace-a-interne ... omoci-wget
Zatím to běží, ale předběžně to vypadá slibně.
Obsah lze prohlížet offline, tj. vnitřní linky jsou předělané a externí jsou také OK.
Uvidíme jak to dopadne
Mel jsi tomu pridat -o log.txt a pak se podivat, ktere ze to linky se nepovedlo stahnout. Kazdopadne preji, aby to proslo napoprve a spravne.
edit: zmeneno -o na male (velke dela neco jineho)
--
Všechno je snadné, než to zkusíš sám.
Uživatelský avatar
robokop
Site Admin
Příspěvky: 22371
Registrován: 10. 7. 2006, 12:12
Bydliště: Praha
Kontaktovat uživatele:

10. 8. 2020, 10:57

Ja wgetem klonoval zivej web tak aby z nej byl mirror. Kazdy den update. Vyborny a silny nastroj.
Vsechna prava na chyby vyhrazena (E)
mmuzila
Příspěvky: 36
Registrován: 16. 1. 2020, 4:49
Bydliště: Brno

10. 8. 2020, 12:37

prcek píše: 8. 8. 2020, 2:33 Je na prd, ze blog.cz ma na jine domene obrazky a na jine textovy obsah.
Pro rekurzivni stahovani se da pouzit wget ale pak je treba ze stazenych stranek vyparsovat odkazy na obrazky, scripty, css a dostahovat si je. A nasledne data upravit tak, aby to spolecne fungovalo.
Mam to v procesu (mj i kubacuv), ale uspechem si jisty nejsem.
Mimo to blog.cz vic pada, nez jede, takze stahnout to je docela orisek.
Obrázky (a ostatný balast) z inej domény sa dá stiahnuť aj pomocou wget.

Použil by som niečo ako:

Kód: Vybrat vše

wget --convert-links --random-wait -r -p  -E -e robots=off  -H -Djxs.cz -Dmlgeardesigns.blog.cz -U mozilla mlgeardesigns.blog.cz -o log.txt
Za zmienku stojí najmä:

Kód: Vybrat vše

 -H -Djxs.cz -Dmlgeardesigns.blog.cz
Výňatok z manuálu:

Kód: Vybrat vše

 -H
 --span-hosts
            Enable spanning across hosts when doing recursive retrieving.
            
-D domain-list
--domains=domain-list
           Set domains to be followed.  domain-list is a comma-separated list
           of domains.  Note that it does not turn on -H.
xener
Příspěvky: 853
Registrován: 2. 3. 2019, 12:48

10. 8. 2020, 12:57

-H -Djxs.cz,mlgeardesigns.blog.cz
marekluks@seznam.cz
Příspěvky: 1
Registrován: 28. 10. 2020, 9:47

29. 10. 2020, 9:12

Dobrý den, jsem rád že se Vám můj blog mlgeardesigns líbí. Server blog.cz sice skončil, nicméně jsem svůj blog přesunul jinam. Zde je link:
https://mlgeardesigns.blogspot.com/
Odpovědět

Zpět na „Ostatní odkazy“