¿Qué tan rápido rastrea Google una página nueva?

En un sitio sano con enlaces internos apuntando a la URL nueva, Googlebot suele rastrearla entre 24 y 72 horas después de publicada. La indexación (la decisión de guardarla y de posicionarla) tarda otros 1 a 7 días en la mayoría de los sitios. Las páginas con enlazado interno débil, contenido pobre o errores de schema pueden quedarse en 'Rastreada sin indexar' durante semanas. La palanca son los enlaces internos desde páginas con autoridad más un sitemap limpio.

¿Los motores de IA usan el mismo índice que Google?

No, cada uno arma el suyo. La búsqueda web de ChatGPT funciona con Bing por debajo. Gemini usa el índice de Google. Perplexity combina varias fuentes. Claude lanzó su propia búsqueda en 2025. La implicación: una página indexada en Google no aparece automáticamente en ChatGPT — lograr citas en motores de IA es un problema de optimización aparte, con señales que se cruzan pero no son idénticas.

¿Por qué a veces una página cae en posiciones sin que yo cambie nada?

Porque el buscador recalcula el posicionamiento de forma continua. Una caída casi siempre significa que un competidor mejoró (mejores señales, contenido más reciente, más citaciones), que cambió la intención de la consulta (Google reinterpretó lo que el usuario quiere) o que un core update modificó cómo se ponderan los factores. Si miras tu página aislada, te pierdes la causa: el posicionamiento es relativo al resto de las candidatas.

¿Cuántas páginas tiene Google en su índice?

Cientos de miles de millones, pero el número que importa es el de páginas indexadas para las consultas de tu categoría — normalmente entre unos miles y unos pocos millones. Estar en el índice es el piso; el recurso escaso de verdad son las posiciones uno a diez para tus consultas objetivo, un cupo fijo de 10 lugares sin importar cuántas páginas existan.

Fundamentos

Capítulo 02 / 09

Cómo funcionan los buscadores

Rastreo, indexación, posicionamiento — y la cuarta etapa que no existía en 2018 pero hoy decide a quién citan ChatGPT y los AI Overviews de Google en 2026.

10 min de lecturaPublicado 4 may 2026

Los buscadores funcionan repitiendo cuatro etapas en un ciclo continuo. Tres de ellas — rastreo, indexación, posicionamiento — son el modelo desde 1998. La cuarta — síntesis — no existía cuando se escribió la mayoría de los consejos de SEO y hoy decide a quién citan ChatGPT, Google AI Overview, Gemini, Perplexity y Claude. Saltársela es la razón por la que muchos equipos publican contenido técnicamente impecable que nadie encuentra.

Este artículo recorre cada etapa y señala dónde el SEO moderno realmente mueve la aguja, frente a dónde los manuales te dicen que mires.

“La mayoría de los problemas de SEO no están donde los equipos optimizan. El cuello de botella suele estar una etapa antes de donde están mirando.”

Las cuatro etapas

Etapa	Qué pasa	Dónde está la palanca de SEO
1. Rastreo	Un bot descarga la URL, sigue los enlaces y regresa a la cola	Enlaces internos, sitemap, robots.txt, rendimiento de renderizado
2. Indexación	El buscador decide si vale la pena guardar la página	Calidad del contenido, detección de duplicados, canonical, schema
3. Posicionamiento	Cuando llega una consulta, las candidatas se puntúan y se ordenan	Coincidencia con la intención de búsqueda, señales de autoridad, frescura, E-E-A-T
4. Síntesis	Los motores de IA componen una respuesta citando varias fuentes indexadas	Estructura de pasajes, claridad de entidad, sameAs, contenido listo para citar

Etapa1. Rastreo

Qué pasaUn bot descarga la URL, sigue los enlaces y regresa a la cola

Dónde está la palanca de SEOEnlaces internos, sitemap, robots.txt, rendimiento de renderizado

Etapa2. Indexación

Qué pasaEl buscador decide si vale la pena guardar la página

Dónde está la palanca de SEOCalidad del contenido, detección de duplicados, canonical, schema

Etapa3. Posicionamiento

Qué pasaCuando llega una consulta, las candidatas se puntúan y se ordenan

Dónde está la palanca de SEOCoincidencia con la intención de búsqueda, señales de autoridad, frescura, E-E-A-T

Etapa4. Síntesis

Qué pasaLos motores de IA componen una respuesta citando varias fuentes indexadas

Dónde está la palanca de SEOEstructura de pasajes, claridad de entidad, sameAs, contenido listo para citar

1. Rastreo — cómo el bot encuentra tu página

Googlebot, Bingbot, GPTBot de ChatGPT, ClaudeBot, PerplexityBot y OAI-SearchBot de OpenAI hacen lo mismo: descargan una URL, leen el HTML, siguen los enlaces internos y agregan URLs nuevas a una cola. La cola se vuelve enorme rapidísimo — miles de millones de URLs en la web abierta — así que los buscadores priorizan. El error es asumir que “publicado” equivale a “rastreado”.

Tres cosas determinan si un bot llega a tu página en días o en semanas:

Enlaces internos desde páginas con autoridad. Una URL nueva con tres enlaces internos desde páginas que ya posicionan se rastrea antes que la misma URL con cero enlaces internos. La palanca de prioridad de rastreo más desaprovechada en 2026 es publicar un artículo nuevo y no enlazarlo desde el home, la página de cluster ni los artículos hermanos.
Sitemap actualizado. Un sitemap XML con marcas de tiempo lastmod precisas le dice al buscador qué URLs son nuevas o cambiaron desde el último rastreo. Un sitemap que se generó una sola vez en el lanzamiento y nunca se volvió a regenerar es invisible para la lógica de priorización.
Rendimiento de renderizado. Los bots tienen un presupuesto por sitio (informalmente, el crawl budget). Las páginas que tardan 8 segundos en renderizar queman presupuesto que el buscador pudo haber gastado en otras URLs. Los Core Web Vitals importan también aquí — no solo para posicionar, sino para cuántas páginas se rastrean en una ventana dada.

2. Indexación — la decisión de guardar

Rastreada no es lo mismo que indexada. Después de descargar la página, el buscador se hace una pregunta: ¿esto vale la pena guardarlo? Las páginas que reprueban ese filtro se rastrean pero se descartan — nunca van a posicionar, por muy buena que se vea la optimización on-page.

Las razones por las que una página reprueba la decisión de indexar en 2026:

Contenido pobre o duplicado. Si la página repite lo que ya existe en el índice — el mismo texto plantilla, la misma descripción de producto, las mismas FAQs — el buscador no tiene motivo para guardar otra copia. El SEO programático mal hecho falla aquí.
Señales canonical confusas. Cuando dos URLs sirven prácticamente el mismo contenido (por ejemplo, una variante con query string) y no coinciden en cuál es la canónica, el buscador suele no indexar ninguna. Las cadenas de canonicals y los canonicals que se apuntan a sí mismos disparan esto todo el tiempo.
Schema ausente o inválido. El schema no garantiza la indexación, pero un graph con Article + FAQPage + BreadcrumbList le indica al buscador que pensaste qué es la página. Las páginas sin él se ven genéricas y pierden los desempates.
Patrones de soft 404.Las páginas que cargan pero dicen “sin resultados” o “este producto no está disponible” en su contenido principal terminan clasificadas como soft 404 por Google y se descartan.

3. Posicionamiento — la puntuación en cada consulta

Cuando un usuario escribe una consulta, el buscador saca páginas candidatas del índice, las puntúa contra cientos de factores y las ordena. La puntuación no es un número único calculado una sola vez: se recalcula en cada consulta, porque la misma página puede encajar perfecto en una y muy mal en otra.

La mayoría de los consejos de SEO se obsesionan con la etapa de posicionamiento porque es la visible. La realidad es que los factores de posicionamiento solo importan para páginas que ya pasaron la decisión de indexar — así que optimizar elementos on-page antes de resolver el problema de indexación es esfuerzo tirado a la basura.

Dicho eso, las categorías de factores que mueven el posicionamiento en 2026 están bien establecidas:

Coincidencia con la intención de búsqueda. ¿La página responde a la necesidad real detrás de la consulta? Las consultas informacionales piden guías; las transaccionales piden productos. Una intención mal alineada pierde frente a una página más débil que sí acertó la intención.
Señales de autoridad.Backlinks, menciones de marca, identidad sameAs, conteo de citaciones en medios adyacentes. Es la forma corta con la que el buscador se pregunta “¿este sitio es confiable en esta categoría?”
Frescura.Distintos tipos de consulta exigen distinta frescura. “Qué año es” necesita actualizaciones diarias; “cómo redactar un testamento” no. Las páginas viejas en consultas sensibles al tiempo pierden; las páginas recién actualizadas en consultas evergreen no ganan automáticamente.
E-E-A-T. Experiencia, expertise, autoridad, confianza — el marco de Google para definir a quién debe creerle el buscador. Se codifica con Person + Author schema, identidad sameAs y señales editoriales de terceros.

4. Síntesis — la etapa que los manuales de SEO siguen ignorando

Los motores de IA no muestran diez enlaces azules. Componen una respuesta tomando pasajes de varias fuentes indexadas, tejiéndolos en una sola respuesta y citando cada fuente. Decidir qué fuentes tomar y citar es la etapa de síntesis — y puntúa páginas con señales a las que el posicionamiento clásico no les da el mismo peso.

Lo que la síntesis busca y el posicionamiento subestima:

Pasajes autocontenidos. Dos o tres oraciones que responden a una subpregunta sin necesitar el resto del artículo para tener contexto. La síntesis tiende a tomar párrafos, no páginas, así que los párrafos que se sostienen solos se citan más seguido.
Claridad de entidad. La página menciona la entidad (tu marca, producto, persona) de una forma que el buscador puede desambiguar. Descripciones de entidad inconsistentes a lo largo del sitio, descripciones de empresa vagas, enlaces sameAs faltantes — todo eso afecta que la síntesis te elija, aunque el posicionamiento clásico esté bien.
Hechos listos para citar.Números, fechas, atribución de fuentes. Los motores de IA prefieren citar páginas donde los hechos se enuncian con claridad y se atribuyen con claridad. La escritura vaga (“los estudios muestran”) pierde frente a la escritura específica (“un estudio de Ahrefs de 2026 sobre 4 millones de URLs encontró”).

La síntesis es la razón por la que una página puede posicionar en el lugar 8 de Google y ser la fuente más citada en ChatGPT para la misma consulta — y a la inversa. Las dos etapas premian cosas distintas.

Qué implica esto para la práctica del SEO

Antes de nada, mapea cada problema de SEO que estás intentando resolver a una de las cuatro etapas. La solución vive en la etapa donde empieza el problema, no en la etapa donde aparece el síntoma.

Síntoma	Etapa probable	Solución probable
Página fuera del índice de Google	Rastreo o indexación	Agrega enlaces internos y revisa en Search Console si aparece como 'Rastreada: actualmente sin indexar' o con errores de duplicado/canonical
Indexada pero posiciona en el lugar 30+	Posicionamiento	Mala alineación de intención o poca autoridad para esta categoría — casi siempre del lado de contenido, no técnico
Posiciona bien en Google pero nunca aparece en ChatGPT	Síntesis	Reestructura los párrafos para que sean autocontenidos, aprieta la descripción de entidad y agrega sameAs
Pierde posiciones después de un core update de Google	Posicionamiento	Cambiaron los pesos de los factores — normalmente significa que el sitio dependía de algo que el algoritmo ahora devalúa

SíntomaPágina fuera del índice de Google

Etapa probableRastreo o indexación

Solución probableAgrega enlaces internos y revisa en Search Console si aparece como 'Rastreada: actualmente sin indexar' o con errores de duplicado/canonical

SíntomaIndexada pero posiciona en el lugar 30+

Etapa probablePosicionamiento

Solución probableMala alineación de intención o poca autoridad para esta categoría — casi siempre del lado de contenido, no técnico

SíntomaPosiciona bien en Google pero nunca aparece en ChatGPT

Etapa probableSíntesis

Solución probableReestructura los párrafos para que sean autocontenidos, aprieta la descripción de entidad y agrega sameAs

SíntomaPierde posiciones después de un core update de Google

Etapa probablePosicionamiento

Solución probableCambiaron los pesos de los factores — normalmente significa que el sitio dependía de algo que el algoritmo ahora devalúa

Preguntas frecuentes

Respuestas rápidas a lo que nos preguntan antes de cada prueba.

Rastrear (crawling) es cuando un bot descarga una URL y lee su contenido. Indexar es cuando el buscador decide que esa página vale la pena guardar en su base de datos para después posicionarla. Rastreada no es lo mismo que indexada — Search Console muestra esa brecha como 'Rastreada: actualmente sin indexar', y es la razón más común de que una página exista pero jamás posicione.

En este clúster

Fundamentos

01. ¿Qué es el SEO?
Leído
02
Cómo funcionan los buscadores
Leyendo ahora
03. El algoritmo de Google
Próximo
04. Tipos de SEO
Próximo
05. SEO vs paid
Próximo
06. SEO vs otros canales
Próximo
07. ¿El SEO está muerto? Mitos del SEO desmentidos
Próximo
08. Beneficios del SEO
Próximo
09. Hoja de ruta para una estrategia de SEO
Próximo

Capítulo anterior

01. ¿Qué es el SEO?

Siguiente capítulo

03. El algoritmo de Google

Producto

Recursos

Empresa

Cómo funcionan los buscadores

Las cuatro etapas

1. Rastreo — cómo el bot encuentra tu página

2. Indexación — la decisión de guardar

3. Posicionamiento — la puntuación en cada consulta

4. Síntesis — la etapa que los manuales de SEO siguen ignorando

Qué implica esto para la práctica del SEO

Preguntas frecuentes

Fundamentos