Combined Logfile

Combined Logfile es un formato de registro de accesos web que extiende el Formato Común de Registro (CLF) añadiendo campos de referente (Referer) y agente de usuario (User-Agent) para cada petición HTTP.

En el contexto de servidores web, como Apache HTTP Server, el Combined Logfile (o formato de registro combinado) es una variante del registro de accesos estándar que incluye más información sobre el comportamiento de los usuarios en el sitio.

Parte del Common Log Format (CLF), que registra datos básicos como la IP del cliente, la fecha y hora, la petición realizada, el código de estado HTTP y el tamaño de la respuesta. El formato combinado añade dos campos clave:

  • Referer: la URL de procedencia desde la que el usuario llega a la página.
  • User-Agent: información sobre el navegador, dispositivo y sistema operativo del usuario.

En una configuración típica de Apache, el formato combinado se define con una directiva similar a:

LogFormat "%h %l %u %t "%r" %>s %b "%{Referer}i" "%{User-agent}i" combined
CustomLog log/access_log combined

Gracias a estos campos adicionales, el Combined Logfile es especialmente útil para:

  • SEO y analítica: entender qué fuentes de tráfico (referers) envían más visitas y cómo se comportan los distintos navegadores y dispositivos.
  • Monitorización técnica: detectar bots, scrapers o agentes sospechosos a partir del User-Agent.
  • Seguridad: analizar patrones anómalos de acceso, intentos de ataque o peticiones masivas procedentes de determinados agentes o referentes.

La gran ventaja del Combined Logfile es que mantiene la compatibilidad con herramientas que entienden el formato común, pero enriquece el análisis al disponer de más contexto sobre cada petición HTTP.

Ejemplos

  • Ejemplo:
    Un administrador configura su servidor Apache para usar el formato combinado y así poder analizar desde qué webs (referers) llegan más visitas orgánicas y desde qué navegadores se producen más errores 404.
  • Ejemplo:
    Un equipo de SEO descarga los archivos de Combined Logfile del servidor para identificar qué URLs rastrea Googlebot, con qué frecuencia lo hace y desde qué user agent específico accede.
  • Ejemplo:
    Un analista de seguridad revisa el Combined Logfile para localizar un pico de peticiones procedentes de un mismo user agent sospechoso y bloquearlo a nivel de servidor.

Preguntas frecuentes

¿En qué se diferencia un Combined Logfile del Common Log Format (CLF)?
El Common Log Format registra información básica de cada petición (IP, fecha, petición, código de estado, tamaño), mientras que el Combined Logfile añade dos campos adicionales: el referente (Referer) y el agente de usuario (User-Agent). Esto permite un análisis más completo del origen del tráfico y de los dispositivos y navegadores utilizados.
¿Para qué sirve el Combined Logfile en SEO y analítica web?
En SEO y analítica web, el Combined Logfile se usa para entender cómo rastrean los bots las páginas, desde qué fuentes externas llegan las visitas, qué dispositivos y navegadores utilizan los usuarios y qué patrones de acceso generan errores o problemas de rendimiento. Esta información ayuda a priorizar optimizaciones técnicas y de contenido.
¿Es obligatorio usar el formato Combined Logfile en un servidor web?
No es obligatorio, pero sí muy recomendable cuando se desea un análisis más profundo del tráfico y del comportamiento de los usuarios y bots. Muchos servidores se configuran por defecto con el Common Log Format y se pasa al Combined Logfile cuando se necesitan datos adicionales para SEO, seguridad o analítica avanzada.

SINÓNIMOS

También conocido como: formato de registro combinado, combined log format

ÚLTIMA REVISIÓN

Actualizado el: 01/11/2025