Pavuk

Pavuk
Información sobre la plantilla
Pavuk-1.jpg
Sistemas Operativos compatiblesUnix
LicenciaGPL

Pavuk. Es un programa capturador de páginas web que nos permite bajar web enteras para su posterior visionado en nuestro disco duro sin necesidad de estar conectados a internet.

Descripción

Pavuk es un multifuncional grabber web de código abierto con el desarrollo lento pero continuo, se puede utilizar para reflejar el contenido de Internet / intranet y servidores para mantener copias de un árbol local de los documentos. Tiendas Pavuk documentos recuperados en el espacio de disco en mapas locales. La estructura del árbol local es el mismo que el del servidor remoto. Cada servicio de apoyo (protocolo) tiene su propio sub-directorio en el árbol local. Cada servidor de referencia tiene su propio sub-directorio en estos protocolos de sub-directorios, seguido por el número de puerto en el que reside el servicio, delimitado por el carácter puede ser cambiado. Con la opción-fnrules puede cambiar el diseño predeterminado del árbol de documentos locales, sin perder la consistencia enlace.

Características

  • Tiene soporte de JavaScript, conexiones seguras (https),
  • Es multitarea,
  • Tiene soporte de proxys y si tenemos la librería libsocks y sus devel en nuestro sistema se configura de forma automática para ser compilado con soporte de proxys SOCKS 4 y 5.
  • Se puede ejecutar en modo texto y en modo gráfico con soporte de dos tipos de interfaces: GTK1+ y GTK2+,
  • Es posible tener hasta al día las copias de los documentos a distancia en el espacio en el disco local.

Desde la versión 0.3pl2, Pavuk automáticamente puede reiniciar las conexiones rotas, y el contenido reget parcial de un servidor FTP (que debe ser compatible con el comando REST)​​, de un bien configurado HTTP/1.1 servidor, o desde un servidor HTTP/1.0 que soporta rangos.

A partir de la versión 0.6 es posible manejar las configuraciones a través de los escenarios de los llamados. La mejor manera de crear un archivo de configuración es utilizar la interfaz de ventanas X, y basta con guardar la configuración creada. La otra forma es utilizar el dumpscn-switch.

Desde la versión 0.7pl1 es posible almacenar la información de autenticación en el archivo authinfo, que Pavuk puede analizar y utilizar.

Pavuk puede ejecutar un número configurable de procesos en ejecución al mismo tiempo la descarga cuando se compila con soporte multithreading.

Pavuk 0.9pl128 introdujo el uso de enlaces de JavaScript para hacer algunas tareas complicadas (por ejemplo, la toma de decisiones, la transformación de nombre de archivo) que necesitan un poco más de complejidad de cómputo que se puede lograr con un regular, no de secuencias de comandos del programa.

Pavuk 0.9.36 introdujo el multiplicador opcional K sufijos, M o G para los valores de los parámetros numéricos de las opciones de línea de comandos. Estos multiplicadores representan la ISO multiplicadores Kilo (1000), Mega (1000000) y Giga (1.0E9), a menos que se especifique lo contrario (algunas opciones de línea de comandos relacionados con la memoria o el tamaño de disco, ya sea en bytes de kBytes, donde estos multiplicadores serán procesados ​​como el más cercano el poder-de-2: K (1024), M (1048567) o G (1073741824.

Formato de las URL admitidas

HTTP

  • http://[[user][:password]@]host[:port][/document][[user]:password]@]host[:port][/document]

HTTPS

  • https://[[user][:password]@]host[:port][/document]ssl[.domain][:port][/document]

FTP

  • ftp://[[user][:password]@]host[:port][/relative_path][;type=x]
  • ftp://[[user][:password]@]host[:port][1][;type=x]
  • ftp[.domain][:port][/document][;type=x]

FTPS

  • ftps://[[user][:password]@]host[:port][/relative_path][;type=x]
  • ftps://[[user][:password]@]host[:port][2][;type=x]
  • ftps[.domain][:port][/document][;type=x]

Gopher

  • gopher://host[:port][/type[document]]
  • gopher[.domain][:port][/type[document]]

Asignación predeterminada de URLs a nombres de archivos locales

HTTP

  • http://[[user][:password]@]host[:port][/document][?query]
  • http/host_port/[document][?query]

HTTPS

  • https://[[user][:password]@]host[:port][/document][?query]
  • https/host_port/[document][?query]

FTP

  • ftp://[[user][:password]@]host[:port][/path]
  • ftp/host_port/[path]

FTPS

  • ftps://[[user][:password]@]host[:port][/path]
  • ftps/host_port/[path]

Gopher

  • gopher://host[:port][/type[document]]
  • gopher/host_port/[type[document]]

El orden en que se aplican estas URL para presentar el nombre de conversiones es el siguiente:-tr_str_str se aplica en primer lugar, seguido por tr_del_chr, mientras que-tr_chr_chr viene al final.

Fuentes