Si Google no indexa tu sitio web, entonces eres prácticamente invisible. No aparecerás en ninguna consulta de búsqueda, y no recibirás nada de tráfico orgánico en lo absoluto. Zilch. Nothing. Cero.
Dado que ya estás aquí, supongo que esto no es nada nuevo para ti. Así que iremos de manera directa al grano.
Este artículo te enseña cómo solventar cualquiera de estos tres problemas:
Pero primero, vamos a asegurarnos de que estamos en la misma frecuencia y que entendemos completamente estos despropósitos sobre la indexación.
Google descubre nuevas páginas web
rastreando la web, y después añade esas páginas a su
índice. Hacen esto utilizando una
araña web llamada
Googlebot.
¿Confundido? Vamos a definir algunos términos clave.
Aquí tienes que explica el proceso con más detalle:
Cuando googleas algo, le estás pidiendo a Google que muestre todas y cada una de las páginas relevantes de su índice. Debido a que de manera frecuente hay millones de páginas que se ajustan a tu búsqueda, el algoritmo de ranking de Google hace todo lo que es posible para ordenar las páginas de tal forma que veas los mejores y más relevantes resultados primero.
El punto crítico que estoy destacando aquí es que
la
indexación
y el
posicionamiento
son 2 cosas diferentes.
Indexar es presentarte para la carrera; posicionar es ganarla.
No puedes ganar sin presentarte a la carrera en primer lugar.
Ve a Google, a continuación, busca
sitio:tusitioweb.com
Este número señala aproximadamente el número de tus páginas que Google ha indizado.
Si deseas comprobar el estado del índice de una URL en específico, utiliza el mismo
sitio:tusitioweb.com/página-web-slug
No se mostrarán resultados si la página no está indexada.
Ahora bien, merece la pena señalar que si eres un usuario de, puedes emplear el informe de Cobertura para obtener una visión más precisa sobre el estado de indexación de tu sitio web. Sólo tienes que ir a:
Google Search Console > Índice > Cobertura
Mira el número de páginas válidas (con y sin advertencias).
Si estos dos números suman algo diferente a cero, entonces Google tiene por lo menos algunas de las páginas de tu sitio web indexadas. Si no, entonces tienes un problema grave, puesto que ninguna de tus páginas web están indexadas.
¿No eres un usuario de Google Search Console? Regístrate. Es gratis. Todo el que tiene un sitio web y se preocupa por lograr tráfico de Google debería utilizar Google Search Console.
Así de importante es.
También puedes usar Search Console para comprobar si una página específica está indexada. Para ello, queja la URL en
s.
Si esa página está indizada, te indicará “la URL está Google.”
Si la página no está indexada, verás la frase “la URL no está en Google.”
¿Descubriste que tu lugar o bien página web no está indexada en Google? Prueba esto:
Este proceso es una buena práctica cuando publicas una nueva entrada o bien página. Le estás diciendo de forma eficaz a Google que has añadido algo nuevo a tu sitio y que deberían echarle un vistazo.
Sin embargo, es poco probable que el solicitar la indexación resuelva los inconvenientes latentes que impiden que Google indexe páginas viejas. Si ese es el caso, sigue el siguiente checklist para diagnosticar y solucionar el inconveniente.
Aquí hay algunos enlaces rápidos a cada táctica- caso de que ya hayas probado algunas:
¿Google no está indexando todo tu sitio web? Podría ser debido a un bloqueo de rastreo en algo que se llama un archivo robots.txt.
Para comprobar si este es el problema, ve a
tudominio.com/robots.txt.
Busca cualquiera de estos dos fragmentos de código:
Ambos le dicen al robot de Google que no tienen permitido rastrear ninguna página de tu lugar. Para solventar el inconveniente, elimínalos. Es
así de simple.
Un bloqueo de rastreo en robots.txt también podría ser el culpable de que Google no esté indexando una página web particularmente. Para revisar si este es el caso, pega la URL en la herramienta de inspección de URLs en Google Search Console. Haz clic en el bloque de Cobertura para conseguir más detalles, y a continuación, busca el fallo de “¿Se permite el rastreo? No: bloqueado por un error de robots.txt”.
Esto señala que la página está bloqueada en robots.txt.
Si ese es el caso, vuelve a comprobar el fichero robots.txt y busca cualquier regla de “disallow” relacionada con la página o apartado pertinente.
Elimina en donde sea necesario.
Google no indexará páginas si así se lo señalas. Esto es útil para sostener algunas páginas web en modo privado. Hay 2 formas de hacerlo:
Las páginas con cualquiera de estas metaetiquetas en su sección
<head>
no serán indizadas por Google:
Esta es una metaetiqueta robots, y le dice a los motores de búsqueda si pueden o no indexar la página.
La pieza clave es el valor “noindex”. Si lo ves, entonces la página está con el ajuste noindex.
Para hallar todas y cada una de las páginas con una metaetiqueta noindex en tu sitio, ejecuta un rastreo en
Site Audit. Ve al informe
Internal Pages. agencia posicionamiento web seo en madrid advertencias de “Noindex page”.
Haz click para poder ver todas las páginas perjudicadas. Retira la metaetiqueta noindex de cualquier página en la que no deba de estar.
Los rastreadores también respetan el encabezado de contestación HTTP X‑Robots-Tag. Puedes implementar esto utilizando un lenguaje de script del lado del servidor como PHP, o en tu archivo .htaccess, o bien cambiando la configuración de tu servidor.
La herramienta de inspección de URLs en Search Console te señala si Google está bloqueado para rastrear una página por este este encabezado. Sólo tienes que introducir la URL y después buscar “¿Se permite la indexación? No: ‘noindex’ detectado en el encabezado http ‘X‑Robots-Tag’ ”
Si deseas revisar este inconveniente durante tu sitio, ejecuta un rastreo con (Auditoría del Lugar), enseguida utiliza el filtro “Robots information in HTTP header” (“Información de los robots en la cabecera HTTP”) en Data Explorer:
Pide a tu desarrollador que impida que las páginas que deseas indexar muestren esta cabecera.
Lectura recomendada:
Un sitemap le afirma a Google qué páginas de tu lugar son esenciales y cuáles no. También puede dar alguna orientación sobre la frecuencia con que deben ser vueltas a rastrear.
Google ha de ser capaz de localizar las páginas de tu sitio web, con independencia de si están en tu sitemap, mas incluso así es buena práctica incluirlas. Después de todo, no hay razón para hacerle la vida difícil a Google.
Para comprobar si una página está en tu sitemap, emplea la herramienta de inspección de URLs en Search Console. Si ves el error “la URL no está en Google” y “sitemap: N / A”, entonces no está en tu sitemap o indexada.
¿No usas Search Console? Dirígete a la URL de tu sitemap, por norma general,
tudominio.com/sitemap.xml- y busca la página.
O bien, si quieres localizar todas las páginas que se puedan rastrear e indexar y que no están en tu sitemap, ejecuta un rastreo en
Site Audit. Ve a
Data Explorer y aplica estos filtros:
Estas páginas deberían estar en tu sitemap, así que añádelas. Una vez hecho esto, avísale a Google que has actualizado tu sitemap haciendo ping a esta URL:
/ping?sitemap=<URL_completa_de_sitemap>
Reemplaza la última parte con la URL del sitemap. Enseguida deberías ver algo como esto:
Eso debería acelerar la indexación de la página en Google.
Una etiqueta canónica le dice a Google cuál es la versión preferida de una página. Se ve algo como esto:
<link rel=“canonical” href=“/page.html”/>
La mayoría de las páginas o bien no tienen ninguna etiqueta canónica, o bien lo que se llama una etiqueta canónica de autorreferencia. Eso le afirma a Google que la página en sí es la preferida y, probablemente, la única versión. En otras palabras, tú deseas que esta página sea indizada.
Pero si tu página tiene una etiqueta canónica maliciosa, entonces podría estarle diciendo a Google sobre una versión preferida de esta página que no existe. En tal caso, tu página no se indexará.
Para revisar si hay una canónica, emplea la herramienta de inspección de URLs de Google. Verás una advertencia de “página opción alternativa con etiqueta canónica” si la canónica apunta a otra página.
Si esto no debiera estar allí, y quieres indexar la página, retira la etiqueta canónica.
Toma en cuenta que las etiquetas canónicas no siempre y en todo momento son malas. La mayoría de las páginas con estas etiquetas las tendrán por una razón. Si ves que tu página tiene un conjunto canónico, entonces verifica la página canónica. Si esta es en verdad la versión preferida de la página, y no resulta necesario indexar la página en cuestión, entonces la etiqueta canónica debe quedarse.
Si quieres una forma rápida de encontrar las etiquetas canónicas maliciosas durante todo tu lugar, ejecuta un rastreo en Ahrefs’ Audit Tool. Ve a Data Explorer. Utiliza estos ajustes:
Esto busca las páginas en tu sitemap con etiquetas canónicas de no autorreferencia. Debido a que es casi seguro que deseas indexar las páginas en tu sitemap, deberías investigar más a fondo si es que este filtro devuelve algún resultado.
Es muy probable que estas páginas tengan, o una canónica maliciosa, o no deberían estar en tu sitemap en primer lugar.
Las páginas huérfanas son las que no tienen links internos que apuntan hacia ellas.
Debido a que Google descubre nuevos contenidos rastreando la página web, son incapaces de descubrir páginas huérfanas a través de ese proceso. Los visitantes del sitio no serán capaces de hallarlas tampoco.
Para revisar si hay páginas huérfanas, rastrea tu sitio con
Site Audit. A continuación, examina en el Reporte de
Incoming links (links entrantes) los errores de “Orphan page (has no incoming internal links)”:
Esto muestra todas y cada una de las páginas que son indexables y están presentes en tu sitemap y que, sin embargo, no tienen vínculos internos que apuntan hacia ellas.
Este proceso sólo funciona cuando dos cosas son ciertas:
¿No estás seguro de que todas las páginas que deseas sean indizadas están en tu sitemap? Prueba esto:
Cualquier URL no encontrada a lo largo del rastreo es una página huérfana.
Puedes corregir páginas huérfanas en una de 2 maneras:
Los enlaces nofollow son links con una etiqueta rel = “nofollow”. Evitan la trasferencia de
PageRanka la URL de destino. Además, Google tampoco rastrea los enlaces nofollow.
Aquí está sobre el asunto:
En esencia,
el empleo de nofollow nos hace abandonar los links objetivo de nuestra gráfica general de la página web. Sin embargo, estas páginas objetivo todavía pueden aparecer en nuestro índice si otros sitios enlazan a ellas sin usar nofollow, o si las URL se envían a Google en un Sitemap.
En resumen, debes cerciorarte de que todos y cada uno de los links internos a páginas indexables sean seguidos.
Para hacer esto, utiliza la herramienta de Ahref´s Site Audit para rastrear tu lugar. Comprueba en el Reporte de
Incoming Links las páginas indexables con el fallo “Page has no follow incoming internal enlaces only” (“La página tiene solamente enlaces internos entrantes no follow”):
Retira la etiqueta nofollow de estos links internos, asumiendo que quieres que Google indexe la página. Si no es así, elimina la página o bien añade un no index.
Lectura recomendada:
Google descubre nuevos contenidos mediante el rastreo de tu sitio. Si olvidas enlazar internamente la página en cuestión, entonces podría no ser capaz de hallarla.
Una solución fácil a este problema es añadir algunos enlaces internos a la página. Puedes hacer esto desde cualquier otra página web que Google pueda rastrear e indexar. No obstante, si deseas que Google indexe la página lo más rápido posible, tiene sentido hacerlo desde una de tus páginas más “poderosas”.
¿Por qué? Porque es más probable que Google vuelva a rastrear estas páginas más rápidamente que las páginas menos importantes.
Para ello, dirígete a Ahref´s Site Explorer, introduce tu dominio, a continuación, visita el reporte
Mejor por enlaces.
Esto muestra todas las páginas de tu sitio web ordenados conforme al Rating de cada URL (UR). En otras palabras, muestra las páginas de mayor autoridad primero.
Revisa esta lista y busca páginas relevantes desde las que puedas añadir enlaces internos cara la página en cuestión.
Por ejemplo, si estuviéramos buscando agregar un link interno a, nuestra
probablemente ofrecería un lugar relevante desde el que hacerlo. Y sucede que esa página es la 11va con mayor autoridad en nuestro blog:
Google entonces verá y seguirá ese enlace la próxima vez que vuelva a rastrear la página.
Pega la página desde la que agregaste el enlace interno en la herramienta de Inspección de URLs de Google. Pulsa el botón “Solicitud de indexación” para informar a Google de que algo en la página ha cambiado y que debe volver a rastrear tan pronto como resulte posible. Esto podría acelerar el proceso a fin de que ellos descubran el link interno y, en consecuencia, la página que deseas indexar.
Es poco probable que Google indexe las páginas de baja calidad por el hecho de que no tienen ningún valor para sus usuarios. Esto es lo que dijo en 2018 John Mueller de Google sobre la indexación:
Soy yo: y cuál podría ser la razón para no estar indexado? Esas URLs están en los sitemaps, con “index, follow” y enlazadas internamente.
John Mueller: Jamás indexamos todas las URLs conocidas, eso es bastante normal. Yo me enfocaría en hacer el sitio pasmante y también inspirador, entonces las cosas acostumbran a funcionar mejor.
Da a entender que si deseas que Google indexe tu sitio web o página web, debe ser “impresionante y también inspiradora.”
Si has descartado problemas técnicos para la falta de indexación, entonces una falta de valor podría ser la culpable. Por esa razón, vale la pena revisar la página con nuevos ojos y preguntarse: ¿Esta página es genuinamente valiosa? ¿Un usuario encontraría valor en esta página si hiciera clic tras encontrarla en los resultados de búsqueda?
Si la contestación es no a cualquiera de estas preguntas, entonces precisas mejorar tu contenido.
Puedes hallar más páginas que pueden ser de baja calidad y que no están indizadas utilizando la herramienta
Site Audit y
Profiler. Para ello, ve a Data Explorer en Ahref´s Site Audit y emplea estos ajustes:
Esto devolverá páginas “thin” (“delgadas”) que son indexables y que en la actualidad no obtienen tráfico orgánico. En otras palabras, hay una buena posibilidad de que no estén indexadas.
Exporta el informe, después queja todas y cada una de las URLs en URL Profiler y realiza una verificación de Indexación de Google.
Se recomienda el uso de servidores proxy, si estás haciendo esto para un montón de páginas (esto es, más de 100). De lo contrario, se corre el peligro de que tu IP sea prohibida por Google. Si no puedes hacer eso, entonces otra opción alternativa es buscar en Google un “verificador gratis de indexación en masa en Google.” Hay algunas de estas herramientas, pero la mayoría de ellas se limitan a <25 páginas a la vez.
Revisa cualquier página que no esté indizada por inconvenientes de calidad. Mejora donde sea preciso, y enseguida solicita la reindexación en Google Search Console.
También deberías buscar solventar los problemas de contenido copiado. No probablemente Google indexe páginas duplicadas o prácticamente duplicadas. Emplea el informe de
Content Quality (Contenido de Calidad) en Site Audit para verificar estos problemas.
Tener demasiadas páginas de baja calidad en tu sitio sólo sirve para desperdiciar el presupuesto de rastreo (crawl budget).
Esto es sobre este tema:
Desperdiciar recursos del servidor en [páginas-de-bajo-valor-agregado] drenará la actividad de rastreo de las páginas que realmente tienen valor, lo que puede ocasionar un retraso significativo en el descubrimiento de gran contenido en un sitio.
Piensa en ello como un profesor calificando ensayos, uno de los cuales es el tuyo. Si tienen diez ensayos por calificar, llegarán al tuyo con bastante rapidez. Si tienen un ciento, les tomará un poco más de tiempo. Si tienen miles, su carga de trabajo es demasiado alta, y quizás nunca lleguen a revisar tu ensayo.
Google declara que el “presupuesto de rastreo […] no es algo de lo que la mayoría de los editores deba preocuparse”, y que “si un lugar tiene menos de unos pocos de miles de URLs, la mayor parte del tiempo se va a rastrear eficientemente.”
Aun así, la eliminación de páginas de baja calidad de su sitio web nunca es algo malo. Sólo puede tener un efecto agencia marketing digital cadiz presupuesto de rastreo.
Puedes usar para hallar páginas potencialmente de baja calidad e irrelevantes que se pueden eliminar.
Los Enlaces le afirman a Google que una página web es importante. Después de todo, si alguien la está enlazando, entonces debe tener algún valor. Estas son páginas que Google desea indexar.
Para una total transparencia, Google no sólo indexa páginas web con backlinks. Hay muchas (mil millones) páginas indexadas que no tienen enlaces entrantes. No obstante, debido a que Google ve a las páginas con links de alta calidad como más importantes, es probable que rastreen — y re-rastreen- dichas páginas más rápido que las que no. Esto acarrea a una indexación más rápida.
Tenemos un montón de recursos sobre la construcción de backlinks de alta calidad en el blog.
Echa un vistazo a algunas de las guías de abajo.
LECTURA COMPLEMENTARIA (en inglés)
Tener tu sitio o página web indexadas en Google
no es comparable al posicionamiento o bien tráfico.
Son dos cosas distintas.
La indexación quiere decir que Google está al tanto de tu sitio. Esto no desea decir que lo vayan a posicionar para cualquier consulta relevante y útil.
Ahí es donde entra en juego el SEO- el arte de la optimización de tus páginas web para posicionarte en consultas específicas.
En pocas palabras, el SEO implica:
Aquí tienes para que puedas iniciarte en el SEO:
… y ciertos artículos:
LECTURA COMPLEMENTARIA (en inglés)
Sólo hay 2 posibles razones por las que Google no indexa tu sitio web o página web:
Es completamente posible que estas 2 razones se den. Sin embargo, yo diría que las cuestiones técnicas son mucho más comunes. Las cuestiones técnicas también pueden conducir a la generación automática de contenido indexable de baja calidad (por poner un ejemplo, inconvenientes con la navegación facetada). Eso no es bueno.
Aun así, al realizar el checklist precedente se debe resolver el problema de indexación en nueve de cada diez veces.
Sólo recuerda que la indexación ≠ posicionamiento. El posicionamiento en buscadores sigue siendo vital si deseas posicionarte para cualquier consulta de búsqueda que valga la pena y atraer un flujo incesante de tráfico orgánico.
Traducido por . Llega a nuevos clientes todos los días con tu sitio.