Primero lee el archivo desde el principio hasta el final. Seguidamente procede a extraer las URLs sin distinguir si son páginas o entradas. Cuando Google recibe un sitemap, lo primero que hacer es descargar el archivo XML.

Después lee cada nodo <loc> que son los que contienen la URL. Posteriormente identifica todas las URLs listadas en el sitemap, y las guarda en su índice interno, para agregarlas posteriormente a la cola de rastreo (crawl queue).

Clasifica cada URL internamente

Google etiqueta cada URL con metadatos:

  • Tipo de recurso (HTML, imagen, vídeo…)
  • Fecha de última modificación
  • Frecuencia estimada de actualización
  • Profundidad del enlace
  • Relación con otras URLs

👉 En ningún momento Google mira si es “página” o “entrada”. Solo ve URLs.

Qué significa “asignar prioridad según señales internas”

Cada URL recibe una prioridad dinámica, basada en señales internas. Estas señales no vienen del sitemap. Vienen del comportamiento del sitio y de la web.

Estas señales internas determinan la prioridad. Son: El enlace interno, una URL enlazada desde el home tiene prioridad altísima. En segundo lugar los Backlinks externos. Si una URL recibe enlaces de otros sitios, sube la prioridad, se rastrea antes y más a menudo.

La frecuencia de la actualización estro elemento muy importante. Si google detecta que una URL cambia a menudo, aumenta su crawl rate. La revisa más frecuentemente. Pongamos por caso, que actualizas una URL cada mes porque se modifica y se cambia su contenido. Prevalece por tanto ante una página estática.

Otro elemento a tener en cuenta es la relevancia temática. Google agrupa las URLs por temas. Si una URL destaca el tema dominante del sitio, sube en prioridad.

Y por último Google utiliza su historial de rastreo. Si ha rastreado la URL numerosas veces, ajusta su prioridad en función de los cambios anteriores.

Las señales técnicas como: Canonical; Noindex; Redirecciones; Velocidad; Errores 404, y Robots.txt, son podríamos afirmar prioridades estándar.

Entonces… ¿qué rastrea antes: páginas o entradas?

✔ Si el sitemap tiene secciones separadas (lo normal en WordPress con RankMath/Yoast):

  • /page-sitemap.xml
  • /post-sitemap.xml
  • /category-sitemap.xml
  • etc.

Google:

  • No da prioridad a “page” sobre “post”.
  • Rastrea primero lo que tenga más autoridad, enlaces internos y relevancia temática.
  • Ignora completamente si es página o entrada.

✔ Si el sitemap es uno solo (WordPress nativo wp-sitemap.xml):

Google:

  • Lee el índice, luego cada sub‑sitemap.
  • No importa si el sub‑sitemap de páginas está antes o después.
  • Rastrea según importancia, no según orden.

Señales que SÍ determinan qué rastrea primero

Aquí está la verdad que casi nadie dice:

Google prioriza URLs según:

  • Autoridad interna (enlazado interno)
  • Autoridad externa (backlinks)
  • Frecuencia de actualización
  • Relevancia temática
  • Historial de rastreo
  • Canonical
  • Popularidad del contenido
  • Profundidad de clics (cuántos clics desde la home)

👉 Ninguna de estas señales depende de si es página o entrada.

Usa esta Herramienta Sitemap FJGG.

Analizador de Sitemap

Introduce la URL de tu sitemap:

Esta herramienta es solo un ejemplo de funcionamiento para este dominio para ver otros sitemaps de otros dominios utiliza el enlace de abajo.

Google rastrea primero la entrada, aunque sea “menos importante” para ti.

Google NO prioriza páginas ni entradas. Prioriza URLs con más señales de importancia.

El sitemap solo le dice qué existe, no qué es más importante.

Si quieres que Google rastree antes algo concreto

Debes reforzar:

  • Enlazado interno hacia esa URL
  • Ubicación en el menú
  • Enlaces desde la home
  • Actualización reciente
  • Canonical correcto
  • Evitar redirecciones
  • Evitar profundidad > 3 clics

Orden real de importancia de señales (de mayor a menor peso)

  1. Enlazado interno — la señal más fuerte
  2. Backlinks externos
  3. Profundidad de clics
  4. Relevancia temática
  5. Historial de rastreo
  6. Señales técnicas (canonical, noindex, velocidad, errores…)
  7. Actualización reciente
  8. Fecha del sitemap <lastmod> (Google no confía mucho en ella)

👉 La actualización reciente está en la parte media-baja de la lista.

👁️ 10 visitas