Arreglar errores soft 404 en Prestashop 1.6

En este tutorial vamos a ver cómo solucionar los errores soft 404 de Productos sin módulos, con varias herramientas SEO y nuestro querido Excel para crear estas redirecciones 301.

Este tutorial puede ir genial cuando heredas una web con multitud de errores soft 404 que quieres redireccionar, muchas veces ocasionado por renombramiento de categorías y/o productos. Es un trabajo que deberás guardar, ya que estoy seguro de que utilizarás más de una vez.

En los soft 404 de productos y categorías que crea Prestashop nos da la dirección nueva del producto o categoría, así que, si tenemos toda la suma de url’s que da un soft 404, con 4 herramientas básicas y gratuitas podemos crear redirecciones 301 de miles de URL’s. La mise en place de herramientas y webs que vamos a necesitar:

¿Prefieres una bonita redirección 301 o un precioso soft 404?

A partir de aquí podemos debatir si es bueno o no las redirecciones 301.

¿Es bueno tener más de 1000 redirecciones 301 en el archivo htaccess? Los 301 son redirecciones que gastan “recursos de rastreo”, pero aún más problemas nos dan los soft 404, además de entregar una URL con error a Google.

Nos interesa redireccionar estas URL’s para no generar ese tipo de páginas que Google las considera Soft 404, aunque para nosotros sean URL que sigan existiendo.

Extraer errores 404 de Google Search Console

Lo primero que vamos a hacer es ir a Google Search console, al apartado de Cobertura, haremos clic en la tabla de Excluidas, buscaremos el informe de errores Soft 404 y una vez dentro del informe haremos clic en Exportar, para poder extraer por csv las url’s que dan soft 404.

extraer soft 404 de google search console

Preparar listado de URL para Webscraper

Primero, debemos analizar si estas URL son de productos o categorías que en un pasado cambiaron de nombre.

Después tenemos que crear un listado de url’s que dan soft 404 y que tendremos que listar de la siguiente forma:

“https://www.ejemplo.com/url-con-error-soft-404-1.html”,”https://www.ejemplo.com/url-con-error-soft-404-2.html”,”https://www.ejemplo.com/url-con-error-soft-404-3.html”

Separándolos por comas y colocando comillas al principio y final. Para hacerlo es posible concatenar estos caracteres en el Excel mediante una sencilla función de concatenación donde la primera columna seria la url (columna A), la segunda columna serian las comillas (columna B) y en la tercera la coma (columna C), y así en todas las columnas:

=CONCAT(B1;A1;B1;C1)

=CONCAT(B2;A2;B2;C2)

=CONCAT(B3;A3;B3;C3)

La última url no debe tener la coma detrás, ya que al ser la última url, no hace falta. Quedaría una columna así:

 

Pasar la columna D con todos los valores por un fijador de texto que borre los saltos de columna, en este caso yo he utilizado Textfixer: : https://www.textfixer.com/tools/remove-line-breaks.php

Una vez borrados los saltos de columna tenemos que tener un listado similar a esto:

“https://www.ejemplo.com/url-con-error-soft-404-1.html”, “https://www.ejemplo.com/url-con-error-soft-404-2.html”, “https://www.ejemplo.com/url-con-error-soft-404-3.html”, “https://www.ejemplo.com/url-con-error-soft-404-4.html”, “https://www.ejemplo.com/url-con-error-soft-404-5.html”

Aquí es donde añadiremos la cabecera y funciones del sitemap de webscraper:

{“_id”:”redirects-soft404″,”startUrl”:[

Y

],”selectors”:[{“id”:”link”,”type”:”SelectorLink”,”parentSelectors”:[“_root”],”selector”:”a”,”multiple”:false,”delay”:0}]}

Concatenamos el listado de urls y las funciones, quedando el siguiente sitemap json , que utilizaremos en Webscraper:

{“_id”:”redirects-soft404″,”startUrl”:[“https://www.ejemplo.com/url-con-error-soft-404-1.html”, “https://www.ejemplo.com/url-con-error-soft-404-2.html”, “https://www.ejemplo.com/url-con-error-soft-404-3.html”, “https://www.ejemplo.com/url-con-error-soft-404-4.html”, “https://www.ejemplo.com/url-con-error-soft-404-5.html”],”selectors”:[{“id”:”link”,”type”:”SelectorLink”,”parentSelectors”:[“_root”],”selector”:”a”,”multiple”:false,”delay”:0}]}

Con esto vamos a la extensión Webscraper de Chrome, vamos a la pestaña Create new sitemap -> Import Sitemap.

Allí es donde pegaremos el sitemap que hemos creado mediante la extracción de url’s del Google search console, el Excel y todos los arreglos posteriores.

 

Clicamos en Import Sitemap y ya tendremos creado el sitemap listo para scrapear. Si el sitemap está creado correctamente, saldrá marcada la caja en color verde.

Una vez importado el sitemap, nos dirigirá hacia el sitemap creado y allí donde tenemos que elegir Scrape.

 

 

Dejando el intervalo de Request Interval (ms) y Page load delay (ms) intactos, a 2000ms ya estará correcto. Le damos al Start scraping y dejamos que rastree todas las url’s para obtener todas las url’s correctas correspondientes.

A partir de aquí vamos a recibir un csv similar a esto:

web-scraper-order,web-scraper-start-url,link,link-href

“1553596126-187″,”https://www.ejemplo.com/url-con-error-soft-404-1.html”,”https://www.ejemplo.com/url-correcta-1.html”,”https://www.ejemplo.com/url-correcta-1.html”

“1553595826-43″,”https://www.ejemplo.com/url-con-error-soft-404-2.html”,”https://www.ejemplo.com/url-correcta-2.html”,”https://www.ejemplo.com/url-correcta-2.html”

“1553596043-147″,”https://www.ejemplo.com/url-con-error-soft-404-3.html”,”https://www.ejemplo.com/url-correcta-3.html”,”https://www.ejemplo.com/url-correcta-3.html”

“1553596314-277″,”https://www.ejemplo.com/url-con-error-soft-404-4.html”,”https://www.ejemplo.com/url-correcta-4.html”,”https://www.ejemplo.com/url-correcta-4.html”

“1553596151-199″,”https://www.ejemplo.com/url-con-error-soft-404-5.html”,”https://www.ejemplo.com/url-correcta-5.html”,”https://www.ejemplo.com/url-correcta-5.html”

 

Concatenar columnas para crear Redirects 301 en Excel (o en sheets de Gugul)

Y esto lo pasaremos nuevamente por Excel, creando una hoja nueva, donde iremos a Datos, y allí vamos a importar Desde el texto/csv. Vamos a elegir el archivo CSV.

 

 

La primera columna vamos a obtener la ID de webscraper: web-scraper-order -> Nos cargamos esta columna.

La siguiente columna, web-scraper-start-url, es donde vamos a obtener la url con error, (columna la cual vamos a procesar mediante un Reemplazar para cambiarle la url con la sintaxis correcta:Redirect 301 /url.html)

La columna link-href nos la cargamos ya que es la misma que la columna link.

Nos quedarán dos columnas.

Aquí es donde haremos la función de reemplazar en la primera columna el dominio “https://www.ejemplo.com/” por “Redirect 301 /” de la siguiente forma:

Una vez hecho este reemplazo sólo quedará concatenar columnas y copia pega en el .htaccess.

Para ello, vamos a generar una 3ra columna que será la concatenación de las otras:

=concat(A2;” “;B2)

Vamos a elegir toda la columna concatenada (columna C) preparada para pegar en el archivo .htaccess.

Et voilà! Esta suma de operaciones te servirán siempre, quizás al primer dia tendrás que invertir más tiempo, pero una vez creado el Excel con una hoja para hacer las redirecciones y otra para concatenar el sitemap, para las siguientes necesidades que tengas, lo harás en un abrir y cerrar de ojos.

Está claro que para hacer 5 url’s puede no ser necesario, pero para hacer miles de url’s.. ¡te servirá seguro!