Errores de rastreo

« Volver al Diccionario SEO

Los errores de rastreo son como semáforos rotos para Googlebot: no puede avanzar, se equivoca de camino, o directamente no encuentra la calle.

O dicho más técnicamente: ocurren cuando Google intenta acceder a una URL de tu sitio y se encuentra con un problema que le impide rastrear o interpretar el contenido correctamente. No puede rastrear, no puede indexar. Y si no indexa, no clasifica…

Pueden ser errores de servidor, problemas de redirección, URLs bloqueadas, timeouts o errores 404 (gran error SEO, mejor camiseta friki). Y aunque no todos afectan igual, si Google no puede rastrear bien, tu contenido no lo puede leer.

Veamos los errores de rastreo más comunes y cómo pueden arruinarte el SEO sin hacer ruido:

Tipos de errores de rastreo más comunes

Errores de Servidor (5xx)

Estos errores indican que el problema está en el servidor. Google intenta acceder, pero algo se rompe en el camino.
Son los más peligrosos si se repiten: consumen crawl budget y, si son sistemáticos, hacen que Googlebot visite tu web cada vez menos.

  • 500 Internal Server Error: error genérico. El servidor falla, pero no se especifica por qué.
  • 502 Bad Gateway: el servidor actúa como intermediario y falla la conexión con otro servidor.
  • 503 Service Unavailable: web en mantenimiento o sobrecargada. Si no se gestiona con cabeceras adecuadas (como Retry-After), Google lo interpreta como error grave. Pero Google lo entiende si es puntual.
  • 504 Gateway Timeout: el servidor tarda tanto en responder que Google se rinde y se va.

Errores más comunes: el 500 sin logs claros y el 503 mal gestionados (por ejemplo, sin cabeceras adecuadas en mantenimiento), sin indicar que es un tema temporal.

Errores de Cliente (4xx)

Aquí Google llega, pero la respuesta indica que el recurso solicitado no está disponible o el acceso está restringido. Cómo hacer un pedido a domicilio y no abrirle al repartidor.

  • 404 Not Found: página no encontrada. Es el más frecuente. No penaliza por sí mismo, pero muchos sí afectan.
  • 410 Gone: página eliminada de forma permanente. A diferencia del 404, este se puede usar intencionadamente, y Google lo trata como una señal clara de que esa URL debe salir del índice.
  • 403 Forbidden: acceso denegado por el servidor (puede deberse a IPs bloqueadas o configuraciones de seguridad).
  • 401 Unauthorized: requiere autenticación y el bot no puede pasar.
  • Soft 404: páginas que no devuelven un error 404 real, pero que Google interpreta como “esto no vale nada”.
    Por ejemplo: una URL que carga un 200 OK, pero solo tiene un texto tipo “producto no disponible” o “página no encontrada” sin contenido real.
    Google lo detecta, lo clasifica como basura útil y deja de indexarla, aunque tú pienses que está bien. El soft 404 no lo ves con un código de error, ni te aparece (sin una configuración de búsqueda avanzada) en Screaming Frog. Lo ves en Search Console. Y puede estar afectando decenas de páginas sin levantar ninguna alarma técnica.

Error más común (y peligroso): el 404. Y peor si viene desde enlaces internos o externos sin corregir.

Otros errores y bloqueos de rastreo

No son errores HTTP como tal, pero afectan gravemente al rastreo de tu web.

  • Errores DNS: el dominio no resuelve. Google ni siquiera puede empezar el rastreo.
  • Timeouts: la página tarda tanto en cargar que Googlebot la abandona.
  • Redirecciones infinitas o en bucle: encadenamientos mal hechos que acaban en A → B → A. Google no sigue más de 5 saltos.
  • Bloqueo por robots.txt: Google quiere rastrear, pero tú (o tu CMS) le dicen que no. A veces sin saberlo. Hay sitios que sin saberlo bloquean con «/" (todo lo que haya, carpetas, subcarpetas, archivos, etc), «/wp-content/» o cualquier ruta crítica. Y claro, Google acata… y acabas desapareciendo.

Error más común: DNS y bloqueos por robots.txt mal configurado, especialmente en sitios en staging o migraciones.

¿Son los errores de rastreo los errores más peligrosos que puede tener tu web?

No van a hundir una web por sí solos si están localizados, pero cuando afectan a URLs clave, se multiplican o pasan desapercibidos… sí, son de lo más destructivo que puedes tener a nivel técnico.

¿Por qué?

  • Porque si Google no puede rastrear, no puede indexar. Y si no indexa, da igual lo bueno que sea tu contenido.
  • Porque desperdician crawl budget. Y si eso se agota en errores, Google pasa menos por las URLs que sí importan.
  • Porque son señales de baja calidad técnica. Google puede deducir que tu sitio está mal mantenido y priorizar otros más estables.
  • Porque durante migraciones, cambios de dominio o rediseños… pueden cargarse todo tu posicionamiento sin que ni el cliente ni tú os enteréis.
Relevancia dentro del SEO: B - Importante
Sinónimos:
crawl errors
Scroll al inicio