Crawl Budget

« Volver al Diccionario SEO

Google tiene recursos limitados para rastrear una web, y si los desperdicias en páginas inútiles, las que realmente importan pueden quedar fuera del radar. Aquí es donde entra en juego la optimización del Crawl Budget.

No se trata de hacer que Google rastree más, sino de hacer que rastree lo correcto.

Piénsalo como si fuera un repartidor de Amazon con un tiempo fijo para entregar paquetes. Si en vez de llevar productos esenciales, se entretiene recogiendo paquetes rotos, visitando direcciones equivocadas o volviendo a sitios donde ya ha estado, pierde tiempo y deja entregas importantes sin hacer. Lo mismo pasa con Googlebot.

Una web bien optimizada para el Crawl Budget prioriza sus páginas más valiosas, evita que Google pierda tiempo en contenido duplicado, URLs infinitas con parámetros inútiles o páginas sin valor.

Las manos a la cabeza. Esto es lo primero que te he visto hacer cuando has leído esta descripción. Que te veo.

¿Crawl Budget tan poco importante? Claro, porque tu web es un e-commerce con miles de productos, filtros y parámetros infinitos y sabes que si no lo gestionas bien, Google se perderá en el laberinto y dejará de rastrear lo que realmente importa.

¿Crawl Budget tan importante? Claro, porque tienes un blog con 50 artículos bien trabajados y piensas que Google va a tener problemas para rastrearlos. Spoiler: no los tiene.

Entonces, ¿dónde lo meto?

Si tu web tiene menos de 1.000 URLs, no pierdas el tiempo. Google puede rastrear todo sin esfuerzo. No necesitas volverte loco con logs de servidor ni con robots.txt llenos de reglas innecesarias. Enfócate en calidad, indexabilidad y enlazado interno.

Pero si manejas un monstruo de miles o millones de páginas, el Crawl Budget es crítico. Si Googlebot pasa demasiado tiempo en URLs inútiles, duplicadas o sin valor, estarás dejando fuera las que realmente deberían rankear. Y ahí tienes un problema real.

Porque aquí está la clave: Google no te da un número infinito de rastreos. Si los malgastas, alguien más los aprovechará mejor que tú.

Los titanes del Crawl Budget

Amazon es un maestro en esto.

Con millones de productos y variaciones, tiene un control quirúrgico sobre qué se indexa y qué no. Sus filtros de búsqueda no generan URLs infinitas rastreables, y el contenido que realmente aporta valor está bien enlazado internamente.

Wikipedia también juega en otra liga.

No tiene problemas de indexación porque su arquitectura es limpia, las URLs son claras y cada página enlaza de manera eficiente con otras relacionadas. No hay derroche de rastreo.

Zalando maneja un e-commerce enorme sin que Google se pierda en un laberinto de parámetros de URL inútiles. Su canonicalización y uso de etiquetas robots.txt aseguran que solo las páginas clave reciban la atención de Googlebot.

Errores de Crawl Budget a evitar

Muchos sitios desperdician su Crawl Budget sin darse cuenta. Las webs con contenido duplicado descontrolado, como portales de noticias que generan múltiples URLs para la misma noticia con ligeras variaciones, son carne de cañón para que Google se aburra y deje de rastrear lo importante.

Otro error común es dejar que los parámetros de URL generen combinaciones infinitas de la misma página. Filtrados en tiendas online, versiones de impresión o parámetros de tracking mal gestionados pueden llenar el índice de Google con basura que no aporta nada.

Y ojo con los sitios que crean demasiadas URLs con thin content. Un blog con miles de artículos irrelevantes de 200 palabras mal escritas solo consigue que Google pierda tiempo.

Tal y como te he dicho anteriormente, si todas las URL de tu web incluso las puede rastrear Screaming Frog sin problemas, no te preocupes por el Crawl Budget.

Relevancia dentro del SEO: C - Normal
Sinónimos:
Presupuesto de rastreo
Scroll al inicio