El despliegue masivo de proxies y cachés en Internet hace que, en muchos casos, las páginas de un sitio no sean entregadas por el servidor del sitio, sino por otras máquinas que en algún momento se han quedado copia de las mismas. El motivo para realizar esas copias es reducir el tráfico en la red, ahorrando coste de comunicaciones. Esto interesa en general tanto a los proveedores de contenidos como a los proveedores de acceso. Sin embargo, cuando una página llega al navegador de un usuario directamente desde una caché de su proveedor de acceso a Internet, o desde el proxy de su empresa, o incluso desde la caché de su propio navegador, entonces el proveedor del contenido pierde en general la posibilidad de conocer que esa página fue accedida, ya que no fue servida por el servidor del sitio ni, por lo tanto, registrado el acceso en el registro log del servidor.
El efecto de las cachés es doble para el propietario de un sitio web: se ahorra ancho de banda de comunicaciones pero, en principio, se pierde control sobre el uso del sitio.
Este efecto puede llegar a ser muy fuerte en el caso de sitios con mucho tráfico. DAEDALUS ha comprobado que en el caso de un cliente como la Agencia Tributaria, la proporción de páginas entregadas por sus propios servidores podía llegar a ser sólo de un 3% del total de las páginas vistas. Esta es una situación extrema, durante un mes de mayo, época de declaraciones de impuestos, y con un tráfico elevadísimo de consultas a las páginas de la Agencia.
Como consecuencia, las estadísticas de los sistemas que analizan los archivos log de servidores web se construyen a partir de datos muy poco fiables. Por eso es preciso usar otros métodos de registro de la información, como los basados en huellas o marcadores (estilo Lawerinto).