Centro de ayuda

Preguntas frecuentes de Crawler SDR

Respuestas sobre Crawler SDR, licencias beta, rastreo SEO, JavaScript, informes, Search Console, GA4, PageSpeed, CrUX, logs y privacidad.

50 respuestas

Categoría

Producto y alcance

Qué es Crawler SDR, para quién está pensado y qué tipo de auditorías cubre.

¿Qué es Crawler SDR?

Crawler SDR es una herramienta de escritorio para auditoría SEO técnica. Rastrea una web, detecta URLs internas y externas, redirecciones, códigos HTTP, indexabilidad, titles, meta descriptions, H1/H2, canonicals, hreflang, imágenes, contenido, JavaScript, datos estructurados y genera informes accionables.

¿Qué flujo de trabajo cubre Crawler SDR?

Crawler SDR cubre un flujo de auditoría SEO técnica completo: crawl, renderizado JavaScript, exportaciones, detección de warnings/errors y comparativas con fuentes externas. La herramienta prioriza que los resultados sean útiles, claros y exportables.

¿Qué tipo de webs puedo analizar?

Puedes analizar sitios corporativos, blogs, ecommerce, páginas con JavaScript, webs multiidioma, proyectos con sitemaps, webs con robots.txt y sitios que necesiten revisar indexabilidad, arquitectura y rendimiento.

¿La herramienta sirve para auditorías de clientes?

Sí. Está pensada para generar auditorías técnicas, priorizar problemas y entregar informes HTML/XLSX con KPIs y tablas filtrables. En la fase beta conviene validar resultados antes de usarlos como entregable final.

¿Crawler SDR es una herramienta online?

No. El crawler principal se ejecuta en escritorio Windows. La web se usa para descargar la herramienta, gestionar cuenta/licencia beta, soporte y documentación.

Categoría

Licencias, beta e instalación

Activación, descarga, avisos de Windows y funcionamiento de la licencia temporal.

¿La versión beta es gratuita?

Durante la fase beta puedes generar una licencia PRO temporal gratuita desde tu panel. La licencia permite probar funciones avanzadas mientras se valida la primera versión pública.

¿Dónde obtengo una licencia beta?

Entra en tu cuenta, abre el panel de usuario y usa el botón de licencia PRO gratuita durante la beta. La licencia se mostrará en el apartado de Licencias con su estado y caducidad.

¿Cuánto dura la licencia beta?

La licencia beta está pensada como licencia temporal con caducidad limitada, normalmente de un mes. Su duración puede cambiar mientras el producto esté en fase de prueba.

¿La licencia queda vinculada a mi equipo?

Sí. La herramienta usa un identificador de dispositivo en formato hash para vincular la licencia al equipo sin guardar un identificador legible del hardware.

¿Por qué Windows SmartScreen o Chrome pueden mostrar avisos al descargar el instalador?

Aunque el instalador esté firmado, Windows y Chrome pueden mostrar avisos cuando una aplicación es nueva y todavía no tiene reputación suficiente. Esto suele mejorar con descargas reales, firma consistente, ausencia de detecciones y reputación del editor.

¿La aplicación está firmada?

La intención es distribuir instaladores firmados digitalmente. La firma ayuda a identificar al editor, pero no elimina automáticamente todos los avisos de SmartScreen o reputación en las primeras versiones.

¿Cómo se actualiza Crawler SDR?

La herramienta consulta si hay nuevas versiones disponibles. Cuando detecta una actualización, debe informar al usuario y pedir confirmación antes de actualizar.

¿Qué pasa si me quedo sin espacio en disco durante un crawl?

Crawler SDR incluye control de espacio: si detecta menos de 10 GB libres en el disco donde trabaja con archivos temporales, el crawl debe detenerse y no reanudarse hasta liberar espacio suficiente.

Categoría

Crawling, renderizado e indexabilidad

Cómo rastrea la herramienta, qué respeta y qué señales SEO revisa.

¿Crawler SDR respeta robots.txt?

Sí. La herramienta puede respetar robots.txt y marcar URLs o recursos bloqueados para que puedas revisar si el bloqueo es correcto o si afecta a páginas importantes.

¿Puede renderizar JavaScript?

Sí. La versión PRO incluye renderizado JavaScript adaptativo, extracción de URLs dinámicas y workers dedicados para analizar páginas donde el contenido o enlaces dependen del navegador.

¿Puedo limitar profundidad, alcance o tipos de recursos?

Sí. En la configuración avanzada puedes ajustar alcance, profundidad, delay, tipo de recurso, extracción desde JavaScript y filtros de parámetros para controlar cómo se ejecuta el crawl.

¿Analiza solo páginas HTML?

El crawl puede detectar recursos HTML, CSS, JS, imágenes y otros archivos. Algunas comparativas, como GSC, GA4, PageSpeed y CrUX, se aplican solo a URLs HTML porque comparar imágenes o CSS con datos de rendimiento orgánico no tiene sentido práctico.

¿Qué diferencia hay entre Address y Final URL?

Address es la URL descubierta originalmente. Final URL es la URL resultante tras redirecciones. Para datos de title, meta, H1, H2 y contenido se debe priorizar Final URL, porque la URL inicial puede no tener contenido propio si redirige.

¿Detecta URLs no indexables?

Sí. Revisa señales como noindex, canonical hacia otra URL, robots, redirecciones, bloqueos y estados no 200 para clasificar indexabilidad e indexability status.

¿Detecta canonicals problemáticos?

Sí. Puede identificar canonicals ausentes, múltiples, canonicalizados, canonical hacia redirección o canonical hacia URL no indexable cuando existe información suficiente en el crawl.

¿Analiza hreflang?

Sí. Incluye pestaña de hreflang para revisar anotaciones, referencias, idiomas/regiones, URLs no 200 o no indexables y problemas habituales en sitios multiidioma.

¿Analiza datos estructurados?

Sí. El crawler recopila datos estructurados y puede mostrar warnings o errores cuando detecta marcado incompleto o inválido según la información disponible.

¿Detecta enlaces internos y externos rotos?

Sí. La herramienta informa de enlaces internos, externos, inlinks, outlinks, profundidad, fuentes de descubrimiento, estados HTTP y errores relacionados con enlaces.

Categoría

Informes, KPIs y exportaciones

Qué se puede descargar, filtrar y compartir después de un crawl.

¿Qué incluye el informe HTML descargable?

El informe HTML incluye resumen ejecutivo, KPIs, tipos de warnings/errors, pestañas del crawl, tablas filtrables y, si se han ejecutado, bloques adicionales para GSC, GA4, PageSpeed, CrUX y logs de servidor.

¿Los KPIs del informe son clicables?

Sí. Los KPIs principales pueden filtrar la tabla inferior para ver las URLs afectadas, por ejemplo páginas con H1 duplicado, URLs no indexables o meta descriptions ausentes.

¿Puedo exportar warnings y errores?

Sí. Los apartados de warning audit y error audit pueden exportar XLSX por issue para trabajar cada problema con una tabla más limpia y priorizada.

¿Por qué algunos warnings muestran columnas distintas?

Cada warning debe mostrar solo los campos relevantes. Por ejemplo, un title duplicado muestra Final URL, title, número de ocurrencias y URLs duplicadas; no necesita columnas genéricas de crawl que no aportan contexto.

¿Puedo guardar y cargar crawls?

Sí. La herramienta permite guardar y cargar proyectos de crawl para continuar análisis, revisar resultados o generar informes más tarde.

¿Qué hace Compare with XLSX?

Permite subir un Excel con una columna de URLs para compararlas contra las URLs del crawl. Sirve para detectar URLs presentes solo en el archivo, solo en el crawl o en ambos.

¿El informe muestra datos de conexiones externas?

Sí, pero solo si se han ejecutado esas comparativas o enriquecimientos antes de descargarlo. Si no hay datos de GSC, GA4, PageSpeed, CrUX o logs, el informe no debe inventarlos ni mencionarlos como resultados reales.

Categoría

Google, PageSpeed, CrUX y logs

Conexiones PRO, límites de URLs y cruce de datos externos con el crawl.

¿Para qué sirve conectar Google Search Console?

Sirve para comparar las URLs HTML rastreadas con las páginas que tienen datos en Search Console. Así puedes detectar URLs solo en crawl, URLs solo en GSC, cobertura, clics, impresiones, CTR y posición media.

¿Para qué sirve conectar GA4?

Sirve para comparar las URLs HTML del crawl con páginas que tienen sesiones, usuarios, vistas o engagement en GA4. Ayuda a detectar páginas con tráfico que no aparecen enlazadas o páginas rastreadas sin señal de uso.

¿La conexión con Google importa datos dentro del crawl?

La función principal es crear comparativas Crawl vs GSC y Crawl vs GA4. No sustituye el crawl técnico, lo enriquece con datos de rendimiento orgánico y comportamiento cuando el usuario autoriza la conexión.

¿Qué permisos OAuth usa la herramienta?

La app solicita permisos de lectura para Search Console y Google Analytics cuando conectas Google. El objetivo es listar propiedades y consultar datos necesarios para los informes comparativos.

¿PageSpeed Insights y CrUX funcionan con el mismo login de Google?

No exactamente. Search Console y GA4 usan OAuth. PageSpeed Insights y CrUX usan API key de Google Cloud configurada por el usuario, como hacen muchas herramientas SEO de escritorio para no consumir la cuota del proveedor de la herramienta.

¿Por qué PageSpeed/CrUX tiene límite de URLs?

Estas APIs consumen cuota del proyecto Google Cloud asociado a la API key. Por eso la herramienta limita el volumen y permite seleccionar qué URLs HTML quieres analizar.

¿Qué URLs analiza PageSpeed/CrUX?

Solo URLs HTML seleccionadas por el usuario. Puedes buscar, marcar URLs y ejecutar la consulta para las más importantes, evitando gastar cuota en páginas irrelevantes.

¿Qué hace Import server logs?

Permite subir logs del servidor para cruzar el rastreo real de bots con las URLs del crawl. Ayuda a ver qué URLs reciben hits de bots, cuáles no, y dónde puede haber ruido o oportunidades de indexación.

¿Las conexiones de GSC, GA4, PageSpeed, CrUX y logs están en la versión PRO?

Sí. Las conexiones externas, comparativas avanzadas y enriquecimientos con fuentes externas forman parte del flujo PRO y pueden tener límites de URLs para controlar rendimiento y cuotas.

Categoría

Privacidad, seguridad y datos

Cómo se tratan tokens, claves, crawls y datos de terceros.

¿Dónde se guardan las API keys y tokens?

Las conexiones se guardan localmente en la instalación del usuario. Las API keys y tokens OAuth no deben subirse a archivos de crawl ni informes compartibles.

¿Mis datos de GSC o GA4 se comparten con terceros?

La herramienta usa los datos autorizados para crear comparativas dentro de tu instalación. La política de privacidad explica el tratamiento de datos en la web y las conexiones que el usuario decide autorizar.

¿Puedo desconectar Google?

Sí. En Conexiones puedes desconectar Google para eliminar la conexión activa y dejar de usar sus propiedades en nuevas comparativas.

¿El crawler puede rastrear cualquier web?

Debes usarlo de forma responsable y respetar leyes, términos del sitio, robots.txt cuando corresponda y límites razonables. La responsabilidad del uso del crawler recae en quien decide ejecutarlo.

¿La web usa cookies?

Sí. La web tiene banner de consentimiento para gestionar cookies necesarias, analítica y publicidad. Puedes revisar o cambiar preferencias desde la política de cookies.

Categoría

Problemas comunes

Dudas habituales durante crawls, informes o conexiones.

¿Por qué algunas URLs aparecen bloqueadas?

Pueden estar bloqueadas por robots.txt, cabeceras, reglas de seguridad, autenticación o porque el sitio impide el acceso. El crawler debe mostrar el estado para que revises si el bloqueo es esperado.

¿Por qué una URL externa aparece con status 0?

Puede significar que no se ha consultado, que se ha bloqueado, que hubo timeout o que la herramienta solo la registró como enlace externo sin rastrearla completamente.

¿Por qué se comparan solo URLs HTML con GSC o GA4?

Porque GSC y GA4 trabajan principalmente con páginas. Incluir imágenes, CSS o JS en esa comparación generaría ruido y falsos gaps.

¿Qué hago si el crawl tarda demasiado?

Revisa renderizado JavaScript, workers, delay, profundidad, robots, recursos pesados, límites y espacio en disco. En webs complejas, el renderizado JS puede ser el punto más lento.

¿Por qué algunas métricas de legibilidad pueden no aparecer?

La legibilidad solo tiene sentido cuando hay texto suficiente. En páginas con poco contenido, redirecciones, recursos o contenido no textual, el resultado puede quedar vacío o no ser relevante.

¿Dónde pido ayuda?

Puedes usar el área de soporte desde tu cuenta o contactar desde la página de contacto. Incluye URL, versión de la herramienta, tipo de crawl y captura o export si el problema es reproducible.