La propuesta llega sin avisar, normalmente por LinkedIn: "Haremos que ChatGPT recomiende tu marca a cada comprador en tu categoría — garantizado." Adjunta hay una gráfica que muestra a un competidor con un 31 % de "cuota de voz en IA", a ti con un 4 %, y un contrato de retención por 6.000 € al mes. El miedo está bien calibrado. Los compradores realmente se han trasladado a los asistentes de IA, y las marcas realmente son invisibles allí. Pero el mercado que vende la solución tiene apenas dos años, carece de métricas estándar y crece más rápido que su propia honestidad. La optimización para motores generativos (GEO, generative engine optimization) es una disciplina real; una parte mensurable de lo que se vende bajo ese nombre no lo es.
Una aclaración previa: nosotros también vendemos servicios de visibilidad en IA, así que esto es una auditoría de nuestra propia categoría — interpreta nuestro sesgo en consecuencia. Está escrito para ser útil incluso si nunca contratas a nadie: la física que hace que ciertas promesas sean estructuralmente falsas, diez señales de alerta en palabras de los propios proveedores, referencias de precios justos y las preguntas que distinguen a los operadores serios de los impostores.
TL;DR
- Las respuestas de los LLM (modelos de lenguaje de gran escala) son probabilísticas y dependen de la versión del modelo. Un proveedor puede aumentar las probabilidades de que aparezcas; nadie puede garantizar un posicionamiento fijo. El lenguaje de garantía es la señal de alerta más ruidosa de la categoría.
- Aplica la Prueba de Olfato de 5 Preguntas en la llamada de ventas: conjunto de prompts, prueba de línea base a variación, qué estás comprando exactamente, el plan ante actualizaciones del modelo y por qué no usar una herramienta de 99 € en su lugar.
- Referencias de precios justos para 2026: auditorías productizadas en torno a 900–1.500 €, auditorías de agencia completas hasta 7.500 $, retenciones boutique de 3.000–8.000 € al mes — pagadas únicamente contra entregables nombrados en el SOW (statement of work, declaración de trabajo).
- La "cuota de voz en IA" sin un conjunto de prompts publicado, recuentos de muestras y varianza es decoración, no medición.
- El GEO honesto es principalmente trabajo de fuentes sin glamour — entidades, datos estructurados, superficies de citación como Wikipedia — no contenido generado por IA en volumen.
Por qué este mercado se llenó de aceite de serpiente de la noche a la mañana
Tres condiciones llegaron al mismo tiempo, y cada una favorece al vendedor.
Sin métricas estándar. Cada proveedor calcula la "cuota de voz en IA" a partir de su propio panel de prompts, por lo que las cifras no son comparables entre proveedores ni auditables por ti.
Un mecanismo invisible. Nadie fuera de los laboratorios de modelos puede explicar del todo por qué un asistente nombró una marca y omitió otra en una respuesta concreta. Cuando el comprador no puede verificar el mecanismo, la publicidad rellena el vacío.
Presupuestos aterrorizados. El tráfico orgánico está cayendo, el consejo pregunta qué dice ChatGPT sobre la empresa y "no hacer nada" parece más arriesgado que "firmar algo". El miedo comprime la diligencia debida.
El resultado es una economía de fiebre del oro: coberturas escépticas señalan una startup de GEO valorada por encima de 100 millones de dólares antes de su primer cumpleaños (Webbiquity). Parte de eso es crecimiento real de la categoría. El resto es lo que ocurre cuando la demanda supera la capacidad del comprador de verificar la entrega.
La física: por qué un posicionamiento garantizado en IA es estructuralmente falso
No necesitas creerle la palabra a ningún proveedor sobre lo que es posible. El propio sistema establece los límites.
Las respuestas se muestrean, no se recuperan de un ranking. Un modelo genera cada respuesta de forma probabilística: el mismo prompt, el mismo día, en dos sesiones limpias, puede nombrar marcas diferentes en un orden diferente. No existe un índice con posiciones, así que no hay ninguna posición que nadie pueda venderte. El trabajo de fuentes cambia la distribución de probabilidad — con qué frecuencia apareces en muchas consultas — nunca una posición fija.
Las versiones de los modelos reorganizan todo. Cada nueva versión del modelo cambia los datos de entrenamiento, el comportamiento de recuperación y la ponderación de fuentes. Una marca que dominaba las respuestas en una versión puede perder terreno en la siguiente, sin ninguna acción propia. Incluso las plataformas mismas intercambian cuota: la investigación de compradores de G2 encontró que la cuota de ChatGPT entre los compradores de software B2B que usan IA cayó del 89 % al 63 % en un año, mientras que Claude subió del 1,4 % al 18,5 % (G2 vía PRNewswire). "Posicionarse en IA" no es un único marcador; son varios, y todos se mueven.
Lo que hace el trabajo legítimo es elevar el suelo bajo esa volatilidad: más fuentes independientes que un modelo pueda citar, datos de entidad consistentes sobre los que pueda apoyarse, presencia en las superficies de las que recupera información. Eso eleva la probabilidad de mención de forma medible y duradera. No puede fijar el posicionamiento. Cualquier proveedor que prometa determinismo o no entiende el sistema o espera que tú no lo entiendas.
La Prueba de Olfato de 5 Preguntas
Haz las cinco en la primera llamada. Cada una lleva un minuto, y juntas filtran a la mayor parte del mercado.
- "¿Qué conjunto de prompts, qué modelos, cómo se muestrea?" Un operador real te entrega una lista de prompts por escrito, nombra las versiones de los modelos y declara las ejecuciones por prompt. Un impostor dice "nuestro seguimiento propietario lo cubre todo".
- "Muéstrame la línea base a variación en un cliente anterior." Aprobado: un antes/después anonimizado sobre el mismo conjunto de prompts congelado, varianza incluida, con algunos prompts que no mejoraron. Suspenso: un muro de logos y "+340 % de visibilidad en IA" sin denominador.
- "¿Qué parte de esto es contenido, PR o trabajo de entidades — qué estoy comprando exactamente?" El GEO es un paquete de disciplinas existentes dirigidas a superficies legibles por máquinas. Un proveedor honesto descompone el paquete. Uno deshonesto dice que el algoritmo hace el trabajo.
- "¿Qué ocurre con mis resultados cuando llega el próximo GPT?" La única respuesta honesta es una variante de: las respuestas se reorganizarán, volvemos a establecer la línea base y la capa duradera son tus fuentes y datos de entidad. Cualquier variante de "nuestros resultados persisten a través de actualizaciones del modelo" falla ante la física descrita anteriormente.
- "¿Por qué no puedo obtener lo mismo con una herramienta de 99 € más mi equipo de contenido?" A veces se puede, y un proveedor serio lo dirá. Quien no puede articular el valor por encima de la medición te está vendiendo el panel de control a precios de retención.
Las 10 señales de alerta, en palabras de los propios proveedores
1. La garantía. "Garantizamos que ChatGPT te recomendará en 90 días." Los sistemas probabilísticos no emiten garantías; quienes quieren tu firma, sí. Esta única frase debería terminar la llamada.
2. El algoritmo propietario. "Nuestro algoritmo propietario de clasificación en IA ha descifrado cómo ChatGPT clasifica las marcas." Nadie fuera de los laboratorios ha descifrado los internos del modelo, y no existe un "ranking" estable que descifrar. Lo que los proveedores tienen realmente es un panel de prompts y un scraper — útil, pero no física secreta.
3. La mesa de envíos. "Enviamos tu marca directamente a OpenAI, Google y Anthropic." Esa mesa no existe. No hay ningún formulario donde se archive una marca para futuras respuestas. Esta afirmación no es una exageración; es un mecanismo inventado.
4. llms.txt como partida de cuatro cifras. "Archivo de configuración de rastreadores de IA — 1.200 €." El archivo es markdown simple, lleva unos veinte minutos, no otorga nada y ningún motor lo trata como señal de clasificación. Publicar uno es sensato — nosotros publicamos el nuestro — pero cuatro cifras por ello es arbitraje sobre tu desconocimiento.
5. El gráfico de cuota de voz sin metodología. "Estás al 4 %; tu competidor está al 31 %." Pregunta qué prompts, cuántas ejecuciones, qué modelos, muestreados cuándo. Si el gráfico de la preventa no puede responder, los informes de la postventa tampoco lo harán — el deck estaba diseñado para alarmar, no para medir.
6. Resultados dentro de un ciclo de modelo. "Verás movimiento en 30 días, antes de tu próxima reunión de consejo." Los cambios en fuentes se propagan a través de rastreos, índices de recuperación y reentrenamiento durante semanas o meses. Cualquier cosa que "se mueva" en días es ruido de recuperación o medición creativa.
7. Sin línea base antes de empezar el trabajo. "Empezaremos a optimizar de inmediato y enviaremos informes mensuales de visibilidad." Un proveedor que nunca captura una línea base congelada nunca puede demostrar una variación — lo cual es conveniente para exactamente una de las partes del contrato.
8. El SOW que no nombra nada. "Optimización continua de motores generativos — 6.000 €/mes." Si la línea de entregable no tiene sustantivos — ni conjunto de prompts, ni lista de fuentes, ni trabajo de entidades, ni cadencia de remedición — estás comprando una suscripción a vibraciones.
9. Todo, en todas partes, a un precio. "Optimizamos para todas las IA." Cada motor se apoya en una mezcla de fuentes diferente, y el comportamiento varía por idioma y mercado. Prometer todos los motores a la vez, sin priorización, significa no medir ninguno correctamente.
10. Volumen de contenido rebautizado como GEO. "30 artículos optimizados para IA al mes." Los motores recompensan la autoridad citable, no el volumen de producción; el contenido de IA producido en masa es exactamente lo que las plataformas están aprendiendo a descontar. El volumen tampoco produce nada que otra fuente quiera citar alguna vez — que es el juego real.
Referencias de precios justos para 2026
Los precios en este mercado abarcan dos órdenes de magnitud para promesas que suenan similar — los contratos de retención de GEO publicados van desde aproximadamente 200 € al mes en el extremo freelance hasta 25.000 $ al mes en el extremo enterprise (Citable). Referencias que se ajustan a lo que el trabajo realmente cuesta:
| Tipo de encargo | Rango honesto 2026 | Qué debe incluir | La versión del timo |
|---|---|---|---|
| Auditoría productizada de visibilidad en IA | 900–1.500 € | Conjunto de prompts fijo, línea base multimodelo, mapa de fuentes de citación, lista de correcciones priorizada | PDF con plantilla y puntuaciones pero sin lista de prompts, vendido a 3.000 € o más |
| Auditoría GEO de agencia | 1.500–3.000 $ enfocada; 5.000–7.500 $ completa (Demand Local) | Todo lo anterior más revisión de entidades y datos estructurados, análisis de citaciones de competidores | Una auditoría SEO (optimización para motores de búsqueda) con otra etiqueta — mismo rastreo, nuevo acrónimo, precio doblado |
| Retención boutique | 3.000–8.000 €/mes (Citable) | Entregables mensuales nombrados: construcción de fuentes de citación, trabajo de entidades, remedición contra línea base | "Optimización continua", entregables sin nombrar, resultados infalsificables |
| Herramientas de monitorización | 29–500 €/mes de autoservicio | Prompts fijos, ejecuciones programadas, cobertura multimotor | La misma herramienta revendida dentro de una retención a 10× como "seguimiento propietario" |
| Correcciones técnicas puntuales (llms.txt, schema) | Horas de trabajo, agrupadas en una auditoría | Implementación más verificación | Partidas independientes de cuatro cifras por archivos de veinte minutos |
Para calibrar: nosotros vendemos paquetes de alcance fijo en esta categoría a 700 €, 1.500 € y 3.500 €, de pago único — lo mencionamos aquí no como discurso de ventas sino como declaración. Esta tabla es el estándar por el que esperamos ser juzgados.
Lo que un contrato de retención legítimo nombra en el SOW
Si un encargo mensual está justificado, la declaración de trabajo se lee como un documento de ingeniería, no como un manifiesto. Cinco entregables deben aparecer por nombre:
- Definición del conjunto de prompts. La lista congelada de prompts relevantes para el comprador — categoría, comparación, marca, adversos — acordada por escrito antes de que comience cualquier trabajo.
- Captura de línea base. Medición multimodelo y multiejecución de dónde estás hoy, archivada para que ninguna de las partes pueda mover los postes más adelante.
- Trabajo de entidades y datos estructurados. Registros específicos a crear o corregir — entradas en grafos de conocimiento, marcado schema, datos de organización consistentes en todas las superficies.
- Construcción de fuentes de citación. Qué fuentes independientes y citables existirán al final que no existían al principio. Esta es la línea más lenta y la que más importa.
- Cadencia de remedición. Los mismos prompts, el mismo método, intervalo declarado, varianza reportada — incluyendo los prompts que empeoraron.
Un proveedor que se resiste a poner esto por escrito te está diciendo que el entregable es la factura.
El engaño de las métricas: cómo se falsifica la cuota de voz
Tres movimientos producen un gráfico impresionante de la nada, y los tres son invisibles a menos que preguntes.
Prompts seleccionados a mano. Mides 200 prompts, informas de los 20 que mejoraron. La solución: el conjunto de prompts está congelado en el SOW, y cada informe lo cubre todo.
Muestreo de ejecución única. Una respuesta por prompt al mes es cara o cruz presentada como tendencia. El mismo prompt puede incluirte al mediodía y omitirte a la una. La solución: múltiples ejecuciones por prompt, con la tasa de mención reportada en todas las ejecuciones.
Sin intervalos de confianza. Un movimiento del 22 % al 26 % en un panel de prompts pequeño no es estadísticamente significativo, pero se representa como una satisfactoria barra ascendente. La solución: los informes de cuota de voz deben incluir recuentos de ejecuciones y varianza — y señalar qué cambios están dentro del ruido.
Nada de esto requiere un título en estadística para controlarlo. Requiere preguntar, una vez, en la llamada: "¿Cuántas ejecuciones por prompt y cuál es el suelo de ruido?" El silencio es una respuesta.
Dónde encajan Wikipedia y Wikidata honestamente
Quita el acrónimo y el GEO es principalmente un problema de fuentes: los modelos citan lo que confían, y confían en una lista corta de superficies. Los estudios de citación siguen encontrando a Wikipedia en la cima — el 5W's Citation Source Index la midió en el 13,15 % de las citaciones de ChatGPT en EE. UU., la mayor fuente individual, con Reddit en segundo lugar con el 11,97 % (5WPR). Wikidata desempeña el papel más silencioso, alimentando los grafos de conocimiento que los motores usan para establecer quién eres y qué afirmaciones sobre ti son canónicas. Cómo fluye la capa de la enciclopedia hacia las respuestas de IA es una disciplina propia — véase Wikipedia AEO (AEO, answer engine optimization, optimización para motores de respuesta).
Esto funciona en ambas direcciones, y la simetría es la prueba. Un proveedor de GEO que nunca menciona fuentes, superficies de citación o trabajo de entidades está vendiendo spam de contenido con un nuevo acrónimo. Y el mercado de servicios de Wikipedia tiene su propio ecosistema de estafas de larga data — las señales de alerta allí riman con este artículo: garantías, agencias fantasma, estudios de caso inverificables. La misma estafa, superficie diferente.
Construir vs. comprar: cuándo gana una herramienta más tu equipo
Una retención es la compra equivocada si tu universo de prompts es pequeño (menos de unos 100 consultas relevantes para el comprador), operas en un idioma, los motores ya declaran datos correctos sobre ti y tu equipo de contenido puede actuar sobre los hallazgos. Entonces una herramienta de monitorización desde 29 € al mes — o la línea base gratuita de 20 prompts de nuestra guía de herramientas de monitorización de marca en IA — más tus propios redactores cubre la mayor parte de lo que afirma una retención de rango medio.
La ayuda externa gana su tarifa en tres situaciones: medición en múltiples mercados y trabajo de fuentes en idiomas en los que no tienes personal; trabajo de entidades y superficies de citación que tu equipo no puede hacer internamente (correcciones en grafos de conocimiento, fuentes enciclopédicas); y alucinaciones activas sobre tu empresa que necesitan corregirse en la fuente. Los tres son proyectos con fin — por eso el alcance fijo suele encajar mejor en este trabajo que una retención abierta.
La hoja de interrogatorio de proveedores en una página
Lee esto durante la próxima llamada de ventas. Cada "no" es un dato; tres son un veredicto.
- ¿Se ofrece un conjunto de prompts escrito y versiones de modelo nombradas sin que lo pidas?
- ¿La captura de línea base se delimita antes de cualquier trabajo de optimización?
- ¿Se muestra una variación de línea base a cliente pasado sobre un conjunto de prompts congelado?
- ¿Las ejecuciones por prompt y la varianza están incluidas en los informes?
- ¿El SOW nombra trabajo de entidades y fuentes de citación, en lugar de "optimización continua"?
- ¿Se declara un plan para la próxima versión del modelo?
- ¿Cero lenguaje de garantía en cualquier parte de la propuesta?
- ¿El precio está dentro de la tabla de referencias anterior para el tipo de encargo?
- ¿Pueden explicar qué podrías hacer internamente en su lugar?
- ¿Pondrán los términos de reembolso o salida por escrito?
Descarga: PDFel cuadro de evaluación de proveedores (PDF) — lo construimos para proveedores de Wikipedia, pero las filas son agnósticas al proveedor: cambia "URLs de artículos activos" por "metodología del conjunto de prompts" y puntúa a los proveedores de GEO lado a lado igual de bien.
Si prefieres saltarte la pregunta de la retención por completo, así es como vendemos deliberadamente: los paquetes de visibilidad en IA de WikiBusines son de alcance fijo y pago único — Starter 700 €, Standard 1.500 €, Enterprise 3.500 € — cada entregable nombrado antes de que pagues, resultados enmarcados como probabilidades medibles, porque eso es todo lo que alguien honesto puede vender en esta categoría. Trae el cuadro de evaluación a nuestra llamada también.