Skip to main content
← Recursos
SEO9 min de lectura

La mayoría de tiendas Shopify pierden revenue por SEO técnico que no pueden ver.

Filtros de Shopify: qué bloquear y por qué

Cómo las apps de filtros consumen silenciosamente el presupuesto de rastreo de tu tienda Shopify — y las decisiones de robots.txt, canonical y noindex que lo solucionan.

Actualizado 19 de mayo de 2026

Trabajamos típicamente con tiendas Shopify y Shopify Plus con $500k+ en revenue anual.

Samuel Noriega
Por

Publicado

CompartirXLinkedIn

Filtros de Shopify y presupuesto de rastreo: qué bloquear y por qué

La mayoría de los vendedores de Shopify añaden una aplicación de filtros, ven cómo los compradores empiezan a usarla y consideran que el trabajo está hecho. Lo que no ven es lo que sucede por debajo: Googlebot llega a su tienda, sigue cada URL filtrable que encuentra, agota su tiempo de rastreo asignado en páginas de colección casi duplicadas y nunca llega a las páginas de productos y categorías que realmente importan para el posicionamiento.

Esto no es una hipótesis. Es el patrón que vemos en la mayoría de las tiendas que han estado utilizando aplicaciones de filtro durante más de seis meses sin ningún control de rastreo.

Cómo Genera Shopify las URLs de Filtro — y Por Qué la Fuente es Importante

El filtrado nativo de Shopify, impulsado por la aplicación Search & Discovery, genera URLs utilizando una estructura de parámetros documentada. Un visitante que filtra una colección por color y tipo de producto producirá una URL como:

/collections/shoes?filter.v.option.color=red&filter.p.product_type=sneakers

El prefijo filter.p.* denota los filtros de metacampos y etiquetas de productos. El prefijo filter.v.* cubre atributos a nivel de variante como tamaño o color. Esta estructura está documentada en las documentos para desarrolladores de filtrado de escaparate de Shopify, y conocerla es importante porque le proporciona un patrón predecible para trabajar en robots.txt.

Las aplicaciones de filtro de terceros se comportan de manera diferente. Dependiendo de la aplicación, puede ver parámetros como ?pf_t_color=red, ?sort_by=price-ascending&color=black, o incluso segmentos basados en rutas que crean estructuras de URL completamente nuevas fuera de la familia de parámetros nativos de Shopify. Algunas aplicaciones inyectan filtros a través de JavaScript sin generar una URL rastreable en absoluto. Otras generan parámetros GET reales que Googlebot sigue sin dudarlo.

La distinción da forma a toda su estrategia de control. Los filtros nativos de Search & Discovery son predecibles y fáciles de desautorizar en masa. Los parámetros de filtro de terceros varían y deben ser auditados individualmente antes de escribir una sola regla robots.txt.

Qué Significa Realmente el Presupuesto de Rastreo para una Tienda con Más de 500 Productos

La documentación del presupuesto de rastreo de Google establece que el presupuesto de rastreo se convierte en una preocupación significativa una vez que un sitio tiene más de aproximadamente 10,000 URLs actualizadas con frecuencia, o muestra una alta proporción de páginas "Descubiertas, actualmente no indexadas" en Search Console.

Una tienda de Shopify con 500 productos y una aplicación de filtros funcionando en diez colecciones con cinco atributos de filtro cada una puede generar fácilmente decenas de miles de combinaciones de URL rastreables. La matemática no es complicada: quince atributos de filtro con un promedio de ocho valores cada uno, distribuidos en diez colecciones, produce millones de combinaciones teóricas. En la práctica, Googlebot no las rastreará todas, pero pasará una parte desproporcionada de su tiempo asignado intentándolo.

El resultado es predecible. Sus páginas de colección principales se rastrean con menos frecuencia. Los productos nuevos tardan más en aparecer en el índice. Las páginas para las que ha trabajado duro para construir autoridad reciben menos visitas de rastreo y, por extensión, menos oportunidades para que Google recoja los cambios recientes en el contenido, los precios o los datos estructurados.

robots.txt vs. Etiquetas Canónicas: No Son Intercambiables

Esta es la idea errónea más común que encontramos. Las etiquetas canónicas y las directivas robots.txt resuelven problemas diferentes, y usar una donde necesita la otra crea un problema que se agrava.

Una etiqueta canónica (rel="canonical") le dice a Google qué versión de una página considera la autoritativa. Consolida las señales de equidad de enlaces hacia esa URL preferida. Lo que no hace es evitar que Googlebot rastree la página en primer lugar. Google también ha sido explícito en cuanto a que las sugerencias canónicas pueden ser anuladas si su propia evaluación de la página difiere de su declaración. Las etiquetas canónicas son una señal, no una directiva.

Una regla Disallow en robots.txt impide que Googlebot rastree una URL por completo. Ahorra presupuesto de rastreo. Pero aquí está la trampa crítica: si desautoriza una URL, Googlebot no puede ver una metaetiqueta noindex en esa página, porque nunca recupera el HTML. La propia documentación de Google confirma que especificar noindex dentro de robots.txt no es compatible. Si bloquea el rastreo, Google aún puede mostrar la URL en los resultados de búsqueda basándose en enlaces externos que apunten a ella, pero sin título ni descripción.

Esto significa que su árbol de decisiones se ve así:

Bloquee el rastreo con robots.txt cuando las URLs filtradas tengan cero valor de búsqueda y nunca quiera que Google pierda el tiempo en ellas. Los parámetros de ordenación (?sort_by=price-ascending) son el ejemplo más claro. También lo son los parámetros de paginación en vistas filtradas, los identificadores de sesión y las combinaciones de filtros de múltiples valores que producen conjuntos de resultados casi vacíos.

Permita el rastreo, aplique noindex cuando quiera evitar la indexación pero necesite que Google pueda leer la página, por ejemplo, porque la página contiene enlaces internos a destinos valiosos y quiere que esos enlaces sean seguidos. Este es un caso de uso más estrecho pero real.

Permita el rastreo, no noindex, añada canonical cuando la página filtrada tenga contenido legítimo y valor de búsqueda, pero quiera consolidar las señales a una colección principal. Un filtro como /collections/boots?filter.v.option.color=black podría canonicalizarse razonablemente a /collections/boots a menos que "botas negras" tenga su propia demanda de búsqueda que justifique una página de destino dedicada.

Déjelo completamente indexable solo cuando la URL filtrada se mapea a una consulta de búsqueda distinta y de alta intención con un volumen real. Una colección filtrada por una marca, material o caso de uso específico puede servir como una página de destino genuina si está bien construida con contenido único.

Qué Patrones Bloquear en robots.txt

Para tiendas Shopify que utilizan el filtrado nativo de Search & Discovery, un bloque robots.txt de desautorización inicial se ve así:

User-agent: *
Disallow: /*?*sort_by=
Disallow: /*?*filter.v.availability=
Disallow: /*?*filter.p.vendor=

Los parámetros de ordenación generan cero contenido único. Los filtros de disponibilidad (En Stock / Sin Stock) producen vistas casi duplicadas que fluctúan con el inventario y nunca deben ser indexadas. Los filtros de proveedor pueden ir en cualquier dirección: si las páginas de colección específicas de una marca existen como URLs propias en su arquitectura, los equivalentes filtrados no añaden valor.

Para aplicaciones de terceros, necesita identificar los patrones de parámetros reales que generan, lo que requiere una herramienta de rastreo como Screaming Frog o una revisión de las URLs que aparecen en el informe de Cobertura de Google Search Console.

Uso de Google Search Console para Auditar la Eficiencia del Rastreo

El informe de Cobertura en Google Search Console es donde el daño se hace visible. Busque dos patrones en particular.

Primero, un alto volumen de páginas listadas bajo "Descubiertas, actualmente no indexadas." Este estado significa que Google encontró las URLs, decidió no priorizar su rastreo y las puso en cola indefinidamente. En tiendas con parámetros de filtro incontrolados, esta lista puede contener miles de URLs de colecciones filtradas que Googlebot encontró a través de enlaces internos y optó por no procesar más.

En segundo lugar, compare el número total de páginas indexadas con el número de productos y colecciones que realmente tiene. Si tiene 600 productos en 20 colecciones y Search Console muestra 4,000 páginas indexadas, la diferencia son casi con certeza URLs de parámetros de filtro y ordenación que se han colado.

El informe de Estadísticas de rastreo, accesible en Configuración de Search Console, muestra los volúmenes diarios de solicitudes de rastreo. Una tienda con controles de rastreo adecuados debería mostrar una tasa de rastreo relativamente estable concentrada en las páginas de productos y colecciones. Una tienda con filtros de navegación incontrolada a menudo muestra picos de rastreo que se correlacionan con la actividad de la aplicación de filtros.

Una Auditoría Real: Lo Que Encontramos y Lo Que Arreglamos

En una auditoría reciente de una tienda de artículos para el hogar con aproximadamente 800 productos distribuidos en 30 colecciones, la tienda utilizaba una aplicación de filtros de terceros que generaba parámetros fuera de la estructura nativa filter.* de Shopify. La aplicación producía URLs como ?pf_pt_category=outdoor&pf_v_color=grey&pf_v_size=large.

Google Search Console mostró 11,400 URLs en el informe de Cobertura, frente a un catálogo de productos que debería haber producido aproximadamente 900 páginas indexables como máximo. La categoría "Descubiertas, actualmente no indexadas" contenía más de 6,000 entradas. Las páginas de colecciones principales que habían sido actualizadas recientemente mostraban fechas de último rastreo de 45 a 60 días de antigüedad.

La solución implicó tres pasos. Primero, identificamos todos los patrones de parámetros activos de la aplicación de filtros y los bloqueamos en robots.txt, conservando dos combinaciones de un solo filtro específicas que correspondían a un volumen de búsqueda genuino. Segundo, agregamos etiquetas canónicas en las páginas filtradas restantes que apuntaban a sus colecciones principales. Tercero, enviamos un mapa del sitio actualizado que contenía solo las 900 URLs legítimamente indexables.

En ocho semanas, el recuento de "Descubiertas, actualmente no indexadas" se redujo en más de la mitad, y la frecuencia de rastreo en las páginas de colecciones principales aumentó notablemente en el informe de Estadísticas de rastreo.

Cuándo noindex Es la Decisión Correcta

Existe un escenario en el que noindex tiene más sentido que el bloqueo a través de robots.txt: cuando una página filtrada contiene enlaces internos significativos que desea que Googlebot siga, pero no desea que la página en sí esté en el índice.

El ejemplo clásico es una URL de "ordenar por más nuevo" en una colección grande. Usted quiere que Googlebot siga los enlaces de productos en esa página y descubra rápidamente los productos nuevos. No quiere que la vista ordenada se indexe como una página separada. Aplicar noindex sin una desautorización en robots.txt logra exactamente eso: Google rastrea la página, lee la directiva noindex, no la indexa, pero aún procesa los enlaces salientes a las páginas de productos.

Esta es una decisión matizada y requiere comprender su estructura de enlaces internos antes de implementarla. En la mayoría de las tiendas Shopify, Googlebot llega a las páginas de productos a través de la URL base de la colección sin problemas, lo que significa que el bloqueo de robots.txt suele ser la opción más simple y eficiente para los parámetros de ordenación y disponibilidad.

El Panorama General

El control de la filtros de navegación es un capítulo en una historia más amplia de SEO técnico. Las decisiones tomadas aquí interactúan directamente con su arquitectura de enlaces internos, la configuración de su mapa del sitio y la eficacia con la que Googlebot puede descubrir y volver a rastrear sus páginas de mayor valor a medida que su catálogo evoluciona. Si desea profundizar en el marco técnico completo, nuestro Manual de SEO técnico para Shopify cubre el panorama completo, desde controles de rastreo hasta datos estructurados y Core Web Vitals.

En Shugert, hemos estado realizando auditorías técnicas en tiendas Shopify desde 2015, y las configuraciones erróneas de la filtros de navegación son consistentemente uno de los primeros problemas que encontramos en tiendas que se han estancado orgánicamente. La solución rara vez es drástica, pero el efecto compuesto de devolver el presupuesto de rastreo a sus páginas principales sí lo es.

CompartirXLinkedIn

Sigue leyendo

Recursos relacionados

En esta página