Webalizer

Webalizer (software)
Información sobre la plantilla
Logo webalizer.gif
Permite generar reportes de una página web
CreadorBradford L. Barrett
Fecha de Creación1997
Última versión estable2.23 a 03 / 12 de octubre de 2010
Sistemas Operativos compatiblesLinux
Idiomamás de 30 soportados
LicenciaGNU GPL
Sitio web
http://www.webalizer.org/

Webalizer. Pequeño programa hecho en C que permite generar reportes de una página web. Este programa no sólo da los reportes cuantitativos, si no que también los repostes gráficos, lo que hace más elegante y fácil de observar esos reportes o estadísticas de la página web.

Funcionamiento

Es muy trivial de entender como funciona el webalizer. Cuando se tiene una página web y cualquier persona de la internet accede a ella eso queda registrado en una bitácora, que comúnmente se le denomina "logs". Una vez que esas bitácoras del sistema quedan registradas en una archivo llamado "access.log", el programa Webalizer analiza esos logs y genera unas gráficas en formato HTML para que puedan ser observadas desde el navegador.

Específicamente lo que hace es leer el formato del archivo de bitácoras ("access.log"), todos esos datos los analiza y seguidamente genera un archivo .html (archivo que es interpretado por el navegador) que va a poder ser accesible desde la web. Este archivo HTML, tiene reportes con gráficas de todos lo que ha sido el número de visitas, tráfico, archivos ofrecidos, el tipo de navegadores web que más visita la página, etcétera.

Instalación

Vale destacar que existen tres maneras de hacer funcionar el webalizer:

  1. Descargar el código fuente de la página web oficial de webalizer y compilarlo.
  2. Descargar los binarios y ejecutarlos.
  3. Instalar los archivos .deb, opción que ofrece mayor comodidad. (nota: disponible en el repositorio de Debian)

Para instalar webalizer en Debian lo único que se debe hacer es lo que normalmente se hace para instalar algo en cualquier linux Debian.

Cómo instalarlo

Una vez ejecutado ese comando el "aptitude" o "apt–get" este lo descarga he instala. Cuando se termina de instalar el hace unas preguntas, las cuales se pueden obviar presinando enter lo mas rápido que se pueda.

Para verificar que exista el comando webalizer. En una consola se escribe webalizer si no está instalado entonces aparece un aviso haciendo referencia a esto ("command not found"). En este caso se debe verificar cual fue el fallo.

Configuración

Archivo de configuración

Si se está en Debian el archivo de configuración de webalizer está en el directorio (/etc), si no, está en el directorio donde se compiló.

Opciones de configuración

  • LogFile: Aquí es donde se especifica el lugar donde se encuentran las bitácoras de las personas que acceden a la web, esas bitácoras las guarda el servidor web. Si se usamos apache normalmente esas están ubicadas en el directorio ("/var/log/apache") y el nombre del fichero que las guarda es ("access.log"). El Webalizer necesita saber dónde están esas bitácoras para saber quienes han entrado, con que navegadores y muchas otras cosas mas.
  • OutputDir: En esta opción se especifica el directorio donde se generaran los archivos HTML que contendrán las estadísticas y informes de la página web.
  • Incremental yes: Esta opción permite que webalizer analice todo por separado. Para hacerlo mas entendible hay que comprender que algunos servidores web (por ejemplo apache) parten sus bitácoras, por ejemplo, mensualmente crean un nuevo archivo de bitácoras y renombran el otro con un nombre nuevo. Si usas apache es normal que cada mes o cada cierto tiempo tu "access.log" lo renombren a "access.log.1" y se cree un nuevo "access.log" vacío donde se guardarán los próximos nuevos registros. Bueno está opción la va a seguir tomando en cuenta los archivos ya renombrados, como también los nuevos archivos.
  • ReportTitle Estadísticas de PAGINAWEB_NOMBRE: Se trata del título que se quiere que lleve las páginas HTML que se generarán.
  • HostName URL_PAGINA": Aquí se coloca el nombre o URL del servidor donde está el webalizer. Este nombre normalmente aparece al lado del título de informes ("ReportTitle"). En pocas palabras concatenan "ReportTitle" y "HostName". También se usa para los enlaces desde Webalizer a las páginas ofrecidas.
  • IgnoreSite localhost: Esto lo que hace es ignorar o no tomar en cuenta los registros que vengan de la computadora local. Si no se coloca está opción cada vez que desde la máquina en que está el servidor web se visite la página se registraría ese acceso y muchas veces no se quiere esto, porque normalmente se hacen prácticas de diseño o modificación de la página web lo que ocasiona que se entre a la página web y si se obvia esta opción se estaría haciendo informes o estadísticas de cuantas veces se estamos entró a la página.

Existen otras opciones que tiene que llevar el archivo de Webalizer:

  • HideURL (.gif)
  • HideURL (.GIF)
  • HideURL (.jpg)
  • HideURL (.JPG)
  • HideURL (.ra)

Webalizer no va actualizando esos archivos HTML que genera, se debe ir ejecutando un comando que le indique cada vez que se quiera actualizar los registros e informes de la página web. En Linux y en todos los Unix en general existe algo llamado "cron". El cron lo que hace es ejecutar tareas en intervalos de tiempo especificados.

Posibles problemas y soluciones

  • Problema: Cuando se posee un gran número páginas web y el webalizer hace las estadísticas de todas ellas ya que analiza un único archivo de bitácora del sistema.
  1. Respuesta: En este caso se debe configurar el servidor web para que genere varios archivos de bitácoras, es decir, que genere un logfile (access.log) por cada página web.
  • Problema: En caso que no se sepa cuando son necesarios los binarios y cuando es necesario compilarlo.
  1. Respuesta: El compilar un programa hace que sea un poco mas rápido, pero es solo un poco. Pero la principal razón para elegir entre binarios y descargar el código fuente para compilarlo es cuando se está en un servidor compartido, es decir no se tiene total control del sistema.
  • Problema: En caso que se tenga acceso a un servidor compartido pero no una cuenta de usuarios root ni tampoco con la instalación del webalizer.
  1. Respuesta: En este caso es conveniente descargarlos binarios y ejecutarlos en vez de compilarlo he instalarlo.

Internacionalización

Los informes HTML se pueden producir en más de 30 idiomas, incluido el catalán, croata, checo, danés, holandés, Inglés, estonio, finlandés, francés, gallego, alemán, griego, húngaro, islandés, indonesio, italiano, japonés, coreano, letón, malayo, noruego, polaco, portugués, portugués (Brasil), rumano, ruso, serbio, chino simplificado, eslovaco, esloveno, español, sueco, turco, ucraniano. Para generar informes en un idioma alternativo requiere un binario compilado por separado webalizer específicamente para ese idioma.

Crítica

  • Las estadísticas generadas no diferencian entre los visitantes humanos y robots. Muchos webmasters afirman que webalizer produce cifras de visitas muy poco realistas, que a veces son 200 a 900% más alto que los datos producidos por las estadísticas basadas en la web de javascript, como Google Analytics o StatCounter .
  • Ningún análisis de cadena de consulta. Sitios web dinámicos generados no se pueden enumerar por separado (por ejemplo, las páginas PHP con argumentos)

Copyrigth y licencia

Copyright (C) 1997-2008 Bradford L. Barrett

This program is free software; you can redistribute it and/or modify it under the terms of the GNU General Public License as published by the Free Software Foundation; either version 2 of the License, or (at your option) any later version, and provided that the above copyright and permission notice is included with all distributed copies of this or derived software.

This program is distributed in the hope that it will be useful, but WITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License for more details.

You should have received a copy of the GNU General Public License along with this program; if not, write to the Free Software Foundation, Inc., 59 Temple Place - Suite 330, Boston, MA 02111-1307, USA

Enlaces externos

Fuentes