sábado, 11 de junio de 2011

Cómo descargar sitios web completos

Si necesitas descargar un sitio web completo, para poder verlo localmente en tu ordenador, podrás hacerlo facilmente, mediante el uso del comando 'wget', disponible en todas las distribuciones GNU/Linux.


Para iniciar la descarga de un sitio web, deberás hacer lo siguiente:
  • $ cd ~/directorio/descargas
  • $ wget --recursive --page-requisites --html-extension --restrict-file-names=windows --convert-links --domains blogspot.com --no-parent http://tuxfedorablog.blogspot.com
Deberás modificar los parámetros (blogspot.com) y (http://tuxfedorablog.blogspot.com.es), por las del sitio web que hayas elegido.
El significado de los distintos parámetros es el siguiente:
--recursive
Descarga recursiva del sitio web.
--page-requisites
Descarga todos los recursos de los documentos descargados (imagenes, sonidos, javascript, etc.)

--html-extension
Guarda todos los archivos descargados usando la extensión .html

--restrict-file-names=windows
Modifica el nombre de los archivos descargados para que éstos sean compatibles con Windows.

--convert-links
Modifica los enlaces para que sean accesibles localmente.

--domain sitio
Evita seguir enlaces fuera del sitio que se descarga.

--no-parent
Impide la descarga de enlaces fuera del ámbito de descarga, aunque éstos pertenezcan al mismo sitio.
Una vez concluida la descarga, encontrarás todo el contenido del sitio web, en un directorio con su mismo nombre.


Podrás obtener más información sobre el uso del comando 'wget', a través de su ayuda.

    No hay comentarios:

    Publicar un comentario

    Nota: solo los miembros de este blog pueden publicar comentarios.