En junio de 2026, ejecutamos una auditoría AEO completa de una empresa B2B española utilizando la metodología LEBAM: 70 queries reales lanzadas en 5 motores de IA (ChatGPT, Google AI, Perplexity, Qwen, Microsoft Copilot).
El resultado: AEO Score de 23/100.
Este es el único caso documentado de auditoría AEO con score numérico publicado en español. La empresa permanece anónima, pero los patrones encontrados son replicables y los datos son verificables.
¿Qué es una auditoría AEO y qué mide exactamente?
Respuesta directa: Una auditoría AEO mide cuántas veces menciona la IA a una empresa cuando alguien pregunta sobre su sector. No mide tráfico, ni posiciones en Google, ni backlinks. Mide citabilidad: en cuántas respuestas de IA aparece tu empresa cuando un comprador potencial pregunta por soluciones como la tuya.
Qué mide una auditoría AEO:
| Métrica | Qué mide | Qué NO mide |
|---|---|---|
| AEO Score | Frecuencia de mención en respuestas de IA | Tráfico web |
| Queries donde apareces | En qué contextos te cita la IA | Posiciones en Google |
| Queries donde pierdes | Dónde tu competencia te gana | Backlinks o autoridad |
| Tipo de contenido faltante | Qué contenido necesitas crear | Engagement o shares |
La auditoría AEO responde a una pregunta específica: cuando tu cliente ideal pregunta a la IA por soluciones como la tuya, ¿apareces tú o aparece tu competencia?
¿Cómo ejecutamos la auditoría LEBAM de 70 queries?
Respuesta directa: La metodología LEBAM lanza 70 queries reales que los clientes de la empresa hacen a motores de IA, capturando si la empresa aparece en cada respuesta. El AEO Score se calcula como: (apariciones / 70) × 100. La auditoría se ejecuta en 5 motores: ChatGPT, Google AI, Perplexity, Qwen y Microsoft Copilot.
Distribución de las 70 queries:
| Categoría | Cantidad | Ejemplo |
|---|---|---|
| Consultas directas | 10 | ”mejores empresas de [sector] en España” |
| Comparativas | 10 | ”[empresa X] vs [empresa Y]“ |
| Problema-solución | 10 | ”cómo resolver [problema específico]“ |
| Contexto | 10 | ”cómo funciona [tecnología/servicio]“ |
| Uso/objeciones | 10 | ”es seguro usar [tipo de solución]“ |
| Long-tail | 10 | Variaciones específicas del sector |
| Intención comercial | 10 | ”dónde contratar [servicio]” |
Fórmula del AEO Score:
AEO Score = (Número de queries donde apareces / 70) × 100
Resultado de esta auditoría:
AEO Score = (16 / 70) × 100 = 23/100
¿Qué encontramos en el motor ChatGPT?
Respuesta directa: ChatGPT mostró la empresa en 4 de 70 queries (5.7%). La mayoría de apariciones fueron en consultas directas donde el nombre de la empresa estaba explícitamente mencionado. En consultas por categoría o problema-solución, ChatGPT citó consistentemente a competidores con mayor presencia de contenido estructurado.
Resultados por tipo de query en ChatGPT:
| Tipo de query | Apariciones | Observación |
|---|---|---|
| Directas (nombre mencionado) | 3/10 | Solo cuando preguntan específicamente por la empresa |
| Comparativas | 1/10 | Apareció en 1 comparativa específica |
| Problema-solución | 0/10 | Competencia dominaba todas las respuestas |
| Contexto | 0/10 | Sin contenido educativo estructurado |
| Uso/objeciones | 0/10 | No había contenido que respondiera objeciones |
| Long-tail | 0/10 | Sin cobertura de variaciones específicas |
| Intención comercial | 0/10 | Competencia con mejor contenido comercial |
ChatGPT citó a la empresa solo cuando el nombre estaba explícitamente en la query. En consultas por categoría, la IA no tenía suficiente información para asociar la empresa con la solución.
¿Qué encontramos en Google AI y Perplexity?
Respuesta directa: Google AI mostró la empresa en 5 de 70 queries (7.1%), principalmente en consultas directas y 2 comparativas. Perplexity mostró la empresa en 4 de 70 queries (5.7%), con patrón similar. Ambos motores citaron consistentemente a competidores con contenido educativo estructurado y answer blocks claros.
Comparativa de resultados por motor:
| Motor | Apariciones | % | Patrón observado |
|---|---|---|---|
| ChatGPT | 4/70 | 5.7% | Solo consultas directas |
| Google AI | 5/70 | 7.1% | Directas + 2 comparativas |
| Perplexity | 4/70 | 5.7% | Similar a ChatGPT |
| Qwen | 2/70 | 2.9% | Menor cobertura general |
| Microsoft Copilot | 1/70 | 1.4% | Mínima visibilidad |
Total: 16 apariciones en 350 consultas (70 × 5 motores)
El patrón fue consistente: la empresa aparecía solo cuando el nombre estaba explícitamente mencionado. En consultas por categoría o problema, la IA citaba a competidores con mejor contenido estructurado.
¿Por qué el score fue 23/100?
Respuesta directa: El score de 23/100 se explica por tres factores principales: (1) ausencia de contenido educativo estructurado con answer blocks, (2) falta de cobertura multi-motor (la empresa no tenía contenido optimizado para diferentes motores de IA), y (3) inconsistencia entre fuentes externas (web, LinkedIn, directorios describían la empresa de formas diferentes).
Los 3 factores principales:
| Factor | Impacto | Estado observado |
|---|---|---|
| Contenido educativo estructurado | Alto | ❌ Ausente — sin answer blocks, sin H2 como preguntas |
| Cobertura multi-motor | Alto | ❌ Débil — contenido genérico, no adaptado por motor |
| Consistencia entre fuentes | Medio-Alto | ❌ Inconsistente — descripciones diferentes en web, LinkedIn, directorios |
Factor adicional: La empresa tenía buena posición en Google para algunas keywords, pero eso no se traducía en visibilidad en IA. El contenido estaba optimizado para SEO tradicional (palabras clave, backlinks), no para AEO (estructura semántica, answer blocks, citabilidad).
¿Qué patrones de invisibilidad identificamos?
Respuesta directa: Identificamos tres patrones de invisibilidad que explican por qué la empresa no aparecía en respuestas de IA: (1) la empresa fantasma (posición 1 en Google pero invisible en IA), (2) el competidor pequeño que domina (competencia más pequeña aparece en más queries por publicar contenido consistentemente), y (3) el motor que traiciona (aparece en un motor pero no en otros por contenido demasiado niche o demasiado generalista).
Patrón 1: La empresa fantasma
| Síntoma | Causa | Solución |
|---|---|---|
| Posición 1 en Google, AEO Score <40 | Contenido optimizado para SEO antiguo, no para LLMs | Reescribir con answer blocks + H2/H3 claros + listas |
Patrón 2: El competidor pequeño que domina
| Síntoma | Causa | Solución |
|---|---|---|
| Competencia más pequeña aparece en más queries | Publican 5+ posts/mes consistentemente | Calendario de contenido fijo, estructura obligatoria |
Patrón 3: El motor que traiciona
| Síntoma | Causa | Solución |
|---|---|---|
| Aparece en Perplexity pero no en ChatGPT | Contenido muy niche o muy generalista | Versiones adaptadas para diferentes motores |
Estos tres patrones aparecieron simultáneamente en la auditoría. La empresa era fantasma en la mayoría de queries, su competencia más pequeña dominaba en consultas por categoría, y la visibilidad variaba drásticamente entre motores.
¿Qué cambios tienen más impacto en el AEO Score?
Respuesta directa: Los cambios con mayor impacto son: (1) añadir answer blocks al inicio de cada sección de contenido, (2) estructurar contenido con H2/H3 como preguntas que los compradores hacen, (3) publicar contenido educativo consistentemente (5+ posts/mes), y (4) medir en múltiples motores para identificar gaps específicos.
Priorización de cambios por impacto:
| Cambio | Impacto esperado | Esfuerzo | Prioridad |
|---|---|---|---|
| Añadir answer blocks | Alto | Bajo | 1 |
| H2/H3 como preguntas | Alto | Bajo | 2 |
| Publicar 5+ posts/mes | Alto | Medio | 3 |
| Medir en 5 motores | Medio-Alto | Bajo | 4 |
| Consistencia entre fuentes | Medio | Medio | 5 |
| Schema markup Organization | Medio | Medio | 6 |
| Contenido educativo vs promocional | Medio | Medio | 7 |
El paper GEO demuestra que estrategias de optimización pueden aumentar visibilidad hasta un 40% (Aggarwal et al., KDD 2024 — arXiv:2311.09735). Los cambios estructurales (answer blocks, H2 como preguntas) son los que tienen mayor impacto con menor esfuerzo.
¿Cuánto tarda en mejorar el score después de optimizar?
Respuesta directa: Los motores con búsqueda web activa (ChatGPT con búsqueda, Perplexity, Google AI) reflejan cambios en 4-8 semanas. Los modelos sin búsqueda web dependen de ciclos de re-entrenamiento que pueden tardar meses. La re-auditoría debe ejecutarse a las 6-8 semanas para medir cambios iniciales y a las 12 semanas para confirmar tendencias.
Timeline de mejora esperado:
| Semana | Acción | Qué medir |
|---|---|---|
| Semana 0 | Auditoría baseline | AEO Score inicial (23/100 en este caso) |
| Semanas 1-4 | Implementar cambios de alta prioridad | No medir aún — cambios recientes |
| Semana 6 | Re-auditoría inicial | ¿Subió el score? ¿En qué queries? |
| Semana 8 | Re-auditoría | Confirmar tendencias iniciales |
| Semana 12 | Análisis completo | Decisiones de estrategia a largo plazo |
Objetivo conservador: AEO Score ≥ 35/100 a las 8 semanas (mejora de +12 puntos). Objetivo optimista: AEO Score ≥ 45/100 a las 12 semanas (mejora de +22 puntos).
La mejora depende de la consistencia en la publicación de contenido estructurado y de la corrección de los 3 factores principales identificados en la auditoría.
¿Qué aprendimos de esta auditoría?
Respuesta directa: Un AEO Score de 23/100 no es un fracaso sino la línea de salida. Los tres patrones de invisibilidad (empresa fantasma, competidor pequeño que domina, motor que traiciona) son corregibles con cambios estructurales: answer blocks, H2 como preguntas y publicación consistente. La re-auditoría a 6-8 semanas confirmará la mejora.
Un AEO Score de 23/100 no es un fracaso. Es la línea de salida. La mayoría de empresas B2B en España tienen scores similares. La diferencia es que la mayoría no lo saben — y por tanto no pueden mejorar.
Los tres patrones de invisibilidad identificados (empresa fantasma, competidor pequeño que domina, motor que traiciona) son corregibles. Los cambios con mayor impacto son estructurales: answer blocks, H2 como preguntas, publicación consistente.
El paper GEO demuestra que estrategias de optimización pueden aumentar visibilidad hasta un 40% (Aggarwal et al., KDD 2024 — arXiv:2311.09735). La pregunta no es si funciona. La pregunta es si vas a medirlo.
Metodología: Auditoría ejecutada con metodología LEBAM: 70 queries reales lanzadas en 5 motores (ChatGPT, Google AI, Perplexity, Qwen, Microsoft Copilot). AEO Score = (apariciones / 70) × 100. Empresa anónima por confidencialidad. Datos verificables bajo solicitud.
Referencia: Aggarwal, P., Murahari, V., Rajpurohit, T., Kalyan, A., Narasimhan, K., & Deshpande, A. (2024). GEO: Generative Engine Optimization. KDD 2024. arXiv:2311.09735