13. aprĂ­l 2007

Ako na kompletný mirror web stránky?

V práci sa dnes trochu pohrávame s problematikou stiahnutia celej web stránky do jednoduchých HTML súborov s CSS štýlmi a obrázkami. Jedno pomerne rýchle a šikovné riešenie ukrýva vo svojich útrobách operačný systém Linux. Hľa:

wget -m -k -K -E http://url/of/web/site

Riešenie naozaj jednoduché a šikovné (nám síce nepostačujúce – nezachováva URL adresy); pre bežné použitie celkom vhodné. Otestovali sme to na jednoduchšej stránke, výsledok bol na nerozoznanie od originálu. Trvalo to asi 30 sekúnd ;-)

Enjoy.

Len pre doplnenie, existuje aj wget (tento výborný konzolový nástroj na sťahovanie súborov) pre Windows.

Zdielať:     Poslať na vybrali.sme.sk

Komentáre k článku [8] rozbaliť ↓ zbaliť ↑

  1. Ano, funguje to, pokiaľ si niekto nezmyslí, že JavaScriptové odkazy + JavaScriptové galérie sú fajn. Po 30-tich sekundách nasleduje deň monotónnej driny :-P


    Johny    apr 13, 11:11    #
  2. Trochu od veci otázka, ale prečo niekto potrebuje sťahovať celú webstránku? Kvôli pomalému pripojeniu? Keď to robíte aj v práci tak asi to má aj iný zmysel, čo? :)


    Jaro    apr 13, 11:12    #
  3. Ak má firma vlastnú produktovú prezentáciu pre daný produkt, tak predajcovia si tieto stránky môžu poupraviť do vlastnej podoby. Preto je jednoduchšie ich takto skopírovať a upraviť, ako vytvárať odznova kópiu.

    Ale dôvodov je veľa, ja som len uviedol jeden pracovný.


    Johny    apr 13, 11:48    #
  4. [1] Veru, to je potom fakt smutné. Ale ja som skúšal sťahovať jeden náš web, preto sa nevyskytol žiaden problém ;-)

    [2], [3] Podobných aj úplne iných dôvodov asi môže byť viacero. Kvôli pomalému pripojeniu už asi stránky nikto sťahovať nebude (čo je to pomalé pripojenie? :), skôr možno kvôli absencii pripojenia.

    Potom môžeš chcieť sťahovať celú stránku napríklad, keď sa ruší hysteria.sk – tak si ju stiahneš celú, aby si potom prípadne vedel poslúžiť.

    A celkom bežné je ešte aj to, že niektoré weby pravidelne generujú svoje stránky do HTML (z redakčného systému) a tie potom nahodia na web. Toto bol napríklad náš prípad v práci.


    faster    apr 13, 12:44    #
  5. Myslel som si, ze to bude o wget-e :) Asi pred mesiacom som potreboval toto iste, potreboval som si zazalohovat jeden pre mna dost dolezity web, wget mi tuto ulohu vyriesil v priebehu par sekund. Skutocne skvely nastroj ;-)


    depi    apr 13, 16:43    #
  6. nj a pre tych menej konzolovych je tu gwget :)


    kane77    apr 13, 19:48    #
  7. jop, a este jedna /zrejme pohodlnejsia/ alternativa :
    httrack ..
    na debian-like distrach:
    $: sudo apt-get install httrack

    a potom uz len
    $: httrack faster.sk


    thomm    apr 13, 21:04    #
  8. [6] Gwget, hehe :)

    [7] Dobre vediet, moze sa hodit. Vie to aj nieco naviac (nez ten wget napr.)?


    faster    apr 13, 21:12    #

Komentáre sú uzatvorené

Volám sa Matúš Marcin a mám tento blog.