¿Por qué los motores de IA no citan tu empresa? Datos reales de 14.000 conversaciones
En 2025, un equipo de investigadores analizó ~14.000 logs reales de LMArena, la plataforma donde usuarios comparan respuestas de distintos modelos de IA. El objetivo no era medir cuál modelo es más listo. Era entender una cosa mucho más concreta para las empresas: ¿cuándo y cómo citan fuentes los motores de IA?
Lo que encontraron no tranquiliza.
El 34% de las respuestas de Gemini se generan sin buscar en internet. El 92% de las respuestas de Gemini que sí buscan no incluyen un enlace clickeable. Y Perplexity, aunque visita ~10 páginas para responder, solo cita 3 o 4 de ellas (Strauss et al., 2025 — arXiv:2508.00838).
Si tu empresa depende de que la IA te mencione, estos números explican por qué la mayoría no aparece.
¿Por qué los motores de IA no citan a la mayoría de empresas?
Los LLMs están optimizados para resolver la pregunta del usuario, no para enviar tráfico a tu web. Si el modelo puede generar una respuesta plausible sin buscar, lo hace. Y si busca, cita solo la fracción de fuentes que considera necesaria para justificar la respuesta. Esto crea un attribution gap que deja a la mayoría de empresas fuera de las respuestas de IA.
| Motivo | Qué ocurre en la práctica | Impacto para una empresa B2B |
|---|---|---|
| Optimización por respuesta, no por tráfico | La IA prioriza dar una respuesta completa sobre enlazar fuentes | Tu web puede ser consultada y nunca mencionada |
| Recuperación selectiva | El motor no busca si cree que ya sabe la respuesta | El 34% de Gemini responde sin búsqueda web |
| Atribución mínima | Cuando busca, cita pocas fuentes | El 92% de Gemini no da fuente clickeable |
| Síntesis agresiva | La IA resume información en lugar de remitir a ella | Incluso si eres fuente, el usuario no lo sabe |
El resultado: estar en internet no es suficiente. La IA tiene que decidir que eres una fuente digna de ser citada.
¿Qué descubrió el análisis de 14.000 conversaciones con IA?
Strauss et al. (2025 — arXiv:2508.00838) analizaron logs reales de LMArena y documentaron tres patrones sistemáticos de atribución deficiente. No son bugs ocasionales. Son comportamientos estructurales de los motores de IA actuales.
| Patrón de explotación | Definición | Dato clave |
|---|---|---|
| No Search | El modelo responde sin consultar internet | 34% de Gemini, 24% de GPT-4o |
| No Citation | El modelo busca pero no da fuente clickeable | 92% de Gemini sin fuente clickeable |
| High-volume / Low-credit | El motor consume muchas fuentes pero cita pocas | Perplexity visita ~10 páginas, cita 3-4 |
Estos tres patrones explican por qué una empresa puede tener una web excelente, contenido relevante y buena reputación, y aun así no aparecer en las respuestas de IA.
No es que la IA no te encuentre. Es que la IA no tiene incentivo para citarte.
¿Cómo decide un motor de IA si te cita o no?
El proceso de una respuesta con fuentes tiene tres fases. Cada una es un filtro donde tu empresa puede quedar fuera. Entender estas fases es clave para diagnosticar por qué no apareces.
| Fase | Qué hace el motor | Tu riesgo principal |
|---|---|---|
| 1. Recuperación | Decide si busca en web y qué páginas consulta | Que el motor crea que ya sabe la respuesta y no busque |
| 2. Síntesis | Genera una respuesta coherente a partir de lo recuperado | Que tu contenido no encaje como fuente citable |
| 3. Atribución | Decide si menciona fuentes y cuáles | Que seas consultado pero no seleccionado para la cita |
Una empresa puede estar presente en la fase de recuperación y desaparecer en la de atribución. De hecho, eso es exactamente lo que le pasa a la mayoría: Perplexity puede visitar 10 páginas pero solo citar 3 o 4.
La pregunta no es “¿la IA me encuentra?”. La pregunta es “¿la IA me considera una fuente que vale la pena citar?”.
¿Por qué Gemini apenas enlaza a fuentes externas?
Gemini prioriza la respuesta directa. Su arquitectura de recuperación está diseñada para que el usuario reciba una respuesta completa sin necesidad de hacer clic. El problema es que, para las empresas, eso significa que el tráfico orgánico desaparece de la ecuación.
| Comportamiento de Gemini | Dato del estudio | Consecuencia práctica |
|---|---|---|
| Respuestas sin búsqueda web | 34% de los casos | Ni siquiera se consultan fuentes |
| Respuestas sin fuente clickeable | 92% de los casos | El usuario no puede llegar a tu web |
| Respuestas con fuente | ~8% de los casos | Solo una minoría de consultas genera tráfico |
Para una empresa B2B, esto es especialmente peligroso. Cuando un comprador pregunta “¿qué empresas de [sector] recomiendas en España?”, Gemini puede dar una lista de nombres sin enlaces. Si no estás en esa lista, el usuario no tiene forma de saber que existes.
¿Por qué Perplexity visita más páginas de las que cita?
Perplexity es más transparente que Gemini: casi siempre muestra fuentes. Pero la transparencia no implica que cite todo lo que consulta. Strauss et al. (2025 — arXiv:2508.00838) encontraron que Perplexity Sonar visita aproximadamente 10 páginas por consulta pero solo cita 3 o 4.
| Métrica | Valor aproximado | Qué significa |
|---|---|---|
| Páginas visitadas por consulta | ~10 | El motor hace una recuperación amplia |
| Fuentes citadas por consulta | 3-4 | Solo el 30-40% de lo visitado se atribuye |
| Eficiencia de citación | 0.19 - 0.44 | Hay una selección agresiva de qué citar |
Esto significa dos cosas para una empresa:
- Estar consultado no basta. Perplexity puede leerte y decidir que no eres una de las 3-4 fuentes más relevantes.
- La estructura importa. Una página que responde directamente la pregunta tiene más probabilidad de ser citada que una página que la aborda de forma indirecta.
¿Qué puede hacer una empresa para ser citada más por IA?
No existe un truco que obligue a un LLM a citarte. Lo que sí existe es un conjunto de señales que aumentan la probabilidad de que la IA te recupere, te sintetice y te atribuya. El paper fundacional de GEO demuestra que estas optimizaciones pueden aumentar la visibilidad en respuestas de IA hasta un 40% (Aggarwal et al., KDD 2024 — arXiv:2311.09735).
| Señal | Qué le dice a la IA | Nivel de impacto |
|---|---|---|
| Schema Organization claro | Quién eres, qué haces, para quién | Alto |
| Contenido que responde preguntas reales | Que eres fuente directa para consultas del ICP | Alto |
| Coherencia entre fuentes externas | Que tu entidad es estable y verificable | Medio-Alto |
| llms.txt en la raíz | Una descripción limpia de tu empresa para LLMs | Medio |
| FAQPage con schema | Respuestas estructuradas que la IA puede citar fácilmente | Medio-Alto |
La clave no es añadir una sola de estas señales. Es que todas digan lo mismo sobre tu empresa. Cuando tu web, LinkedIn, directorios y medios coinciden, la IA tiene menos incertidumbre y más confianza para citarte.
¿Cuándo esperar resultados tras mejorar la presencia para IA?
Las mejoras de AEO no se reflejan de la noche a la mañana. El tiempo depende del tipo de motor y de cómo consume información.
| Tipo de motor | Tiempo típico de actualización | Por qué |
|---|---|---|
| Perplexity / ChatGPT con búsqueda web | 4-8 semanas | Reindexan contenido web en ciclos cortos |
| Modelos cerrados sin búsqueda web | Meses | Dependen del re-entrenamiento del modelo |
| Google AI Overviews | 4-12 semanas | Depende del índice de Google y del Knowledge Graph |
La medición debe ser mensual y comparar las mismas consultas. Si cambias las consultas cada mes, no sabrás si mejoraste tu visibilidad o si solo elegiste preguntas más fáciles.
Un buen protocolo es:
- Define 5-10 consultas representativas de tu sector.
- Lanza cada consulta en Perplexity, ChatGPT y Microsoft Copilot.
- Registra si apareces, en qué posición y cómo te describe la IA.
- Repite cada 30 días con las mismas consultas.
Conclusión
Los motores de IA no citan a la mayoría de empresas porque no están diseñados para hacerlo. Están diseñados para responder preguntas. Cuando una empresa no está estructurada como fuente clara y citable, simplemente queda fuera del 8% de respuestas de Gemini que sí enlazan, o de las 3-4 fuentes que Perplexity muestra.
Los datos son claros: el 92% de Gemini no da fuente clickeable y Perplexity cita menos de la mitad de lo que visita (Strauss et al., 2025 — arXiv:2508.00838). Pero también hay una parte positiva: el trabajo de GEO puede aumentar la visibilidad en respuestas de IA hasta un 40% (Aggarwal et al., KDD 2024 — arXiv:2311.09735).
La diferencia entre las empresas que aparecen y las que no no es magia. Es una cuestión de señales: claridad, estructura, coherencia y contenido que responda lo que realmente preguntan los compradores.
Si quieres saber si tu empresa aparece hoy en las respuestas de IA —y dónde estás perdiendo citas— puedes solicitar una auditoría AEO gratuita. El informe incluye las respuestas literales de cada motor para consultas de tu sector y un diagnóstico de por qué la IA te cita o no.
El protocolo completo de medición está documentado en nuestra metodología.