Ako na kompletný mirror web stránky?
V práci sa dnes trochu pohrávame s problematikou stiahnutia celej web stránky do jednoduchých HTML súborov s CSS štýlmi a obrázkami. Jedno pomerne rýchle a šikovné riešenie ukrýva vo svojich útrobách operačný systém Linux. Hľa:
wget -m -k -K -E http://url/of/web/site
Riešenie naozaj jednoduché a šikovné (nám síce nepostačujúce – nezachováva URL adresy); pre bežné použitie celkom vhodné. Otestovali sme to na jednoduchšej stránke, výsledok bol na nerozoznanie od originálu. Trvalo to asi 30 sekúnd ;-)
Enjoy.
Len pre doplnenie, existuje aj wget (tento výborný konzolový nástroj na sťahovanie súborov) pre Windows.
Ano, funguje to, pokiaľ si niekto nezmyslí, že JavaScriptové odkazy + JavaScriptové galérie sú fajn. Po 30-tich sekundách nasleduje deň monotónnej driny :-P
— Johny apr 12, 12:11 #
Trochu od veci otázka, ale prečo niekto potrebuje sťahovať celú webstránku? Kvôli pomalému pripojeniu? Keď to robíte aj v práci tak asi to má aj iný zmysel, čo? :)
— Jaro apr 12, 12:12 #
Ak má firma vlastnú produktovú prezentáciu pre daný produkt, tak predajcovia si tieto stránky môžu poupraviť do vlastnej podoby. Preto je jednoduchšie ich takto skopírovať a upraviť, ako vytvárať odznova kópiu.
Ale dôvodov je veľa, ja som len uviedol jeden pracovný.
— Johny apr 12, 12:48 #
[1] Veru, to je potom fakt smutné. Ale ja som skúšal sťahovať jeden náš web, preto sa nevyskytol žiaden problém ;-)
[2], [3] Podobných aj úplne iných dôvodov asi môže byť viacero. Kvôli pomalému pripojeniu už asi stránky nikto sťahovať nebude (čo je to pomalé pripojenie? :), skôr možno kvôli absencii pripojenia.
Potom môžeš chcieť sťahovať celú stránku napríklad, keď sa ruší hysteria.sk – tak si ju stiahneš celú, aby si potom prípadne vedel poslúžiť.
A celkom bežné je ešte aj to, že niektoré weby pravidelne generujú svoje stránky do HTML (z redakčného systému) a tie potom nahodia na web. Toto bol napríklad náš prípad v práci.
— faster apr 12, 13:44 #
Myslel som si, ze to bude o wget-e :) Asi pred mesiacom som potreboval toto iste, potreboval som si zazalohovat jeden pre mna dost dolezity web, wget mi tuto ulohu vyriesil v priebehu par sekund. Skutocne skvely nastroj ;-)
— depi apr 12, 17:43 #
nj a pre tych menej konzolovych je tu gwget :)
— kane77 apr 12, 20:48 #
jop, a este jedna /zrejme pohodlnejsia/ alternativa :
httrack ..
na debian-like distrach:
$: sudo apt-get install httrack
a potom uz len
$: httrack faster.sk
— thomm apr 12, 22:04 #
[6] Gwget, hehe :)
[7] Dobre vediet, moze sa hodit. Vie to aj nieco naviac (nez ten wget napr.)?
— faster apr 12, 22:12 #