SEO & IA
GPTBot, ClaudeBot, PerplexityBot: ¿hay que bloquearlos?
Bloquear los bots de IA en robots.txt es tentador. Pero no todos hacen lo mismo: unos entrenan modelos, otros recuperan tu página para citarla en tiempo real. Confundirlos es hacerse invisible en las respuestas de IA para nada.
Una moda recorre los foros SEO: añadir una lista de líneas User-agent al robots.txt para « bloquear la IA ». La intención se entiende — ¿por qué dejar que los modelos se entrenen gratis con tu contenido? Pero aplicada sin criterio tiene un efecto perverso: también te borra de las respuestas que la gente lee de verdad.
La distinción que lo cambia todo: entrenamiento vs cita
Cada editor de IA opera dos familias de bots, que no tienen nada que ver:
- Los bots de entrenamiento aspiran contenido para alimentar los futuros modelos. Bloquearlos protege tu contenido del entrenamiento — sin cambiar tu presencia en las respuestas actuales.
- Los bots de cita recuperan tu página en el momento en que un usuario hace una pregunta, para resumirla y citarla como fuente. Bloquearlos es desaparecer de las respuestas.
De ahí viene todo el malentendido: GPTBot (entrenamiento de OpenAI) y OAI-SearchBot (cita en ChatGPT Search) llevan casi el mismo nombre, pero bloquear el primero no afecta al segundo.
La tabla de user-agents de IA (2026)
| User-agent | Editor | Función | Bloquearlo significa… |
|---|---|---|---|
GPTBot | OpenAI | Entrenamiento | Rechazar el entrenamiento — no salir de ChatGPT Search |
OAI-SearchBot | OpenAI | Índice ChatGPT Search | Volverse invisible en ChatGPT Search |
ChatGPT-User | OpenAI | Recuperación a demanda | Impedir que ChatGPT abra tu enlace |
ClaudeBot | Anthropic | Entrenamiento | Rechazar el entrenamiento |
Claude-User | Anthropic | Recuperación a demanda | Impedir que Claude te cite |
PerplexityBot | Perplexity | Índice | Salir del índice de Perplexity |
Perplexity-User | Perplexity | Recuperación a demanda | Impedir que Perplexity te cite |
Google-Extended | Entrenamiento Gemini | Rechazar el entrenamiento — ningún efecto en el SEO | |
Googlebot | SEO + AI Overviews | Desaparecer de Google (nunca hacerlo) | |
Applebot-Extended | Apple | Entrenamiento | Rechazar el entrenamiento de Apple Intelligence |
Bytespider | ByteDance | Entrenamiento (agresivo) | Rechazar el entrenamiento (a menudo deseado) |
Las funciones se basan en la documentación pública de los editores; nombres y comportamientos cambian — vuelve a comprobar antes de fijar tu archivo.
Entonces, ¿bloquear o no?
No es una cuestión técnica, sino editorial. Dos posturas coherentes:
- Quieres visibilidad en IA → deja pasar los bots de cita (OAI-SearchBot, ChatGPT-User, Perplexity*, Claude-User) y Googlebot. Bloquear los bots de entrenamiento sigue siendo posible sin perder citabilidad.
- Rechazas el entrenamiento gratuito → bloquea GPTBot, Google-Extended, ClaudeBot, Applebot-Extended, CCBot, Bytespider. No afecta a ser citado.
En Snorklee acogemos a todos los bots de IA: nuestro oficio es justamente medir la visibilidad en IA, no huir de ella.
Un ejemplo de robots.txt
# Rechazar el entrenamiento, conservar la cita User-agent: GPTBot User-agent: Google-Extended User-agent: CCBot User-agent: Bytespider Disallow: / # Dejar pasar la cita en tiempo real User-agent: OAI-SearchBot User-agent: ChatGPT-User User-agent: PerplexityBot User-agent: Perplexity-User User-agent: Claude-User Allow: /
User-agent seguidas de una regla se aplican a todo el grupo. Googlebot nunca se incluye aquí: no lo bloqueamos.Bloquear un bot de entrenamiento ≠ bloquear un bot de cita. Antes de añadir una línea a tu robots.txt, pregúntate: « ¿este bot sirve para entrenar un modelo o para citarme ahora? » Y no olvides nunca: robots.txt lo respetan los editores honestos, no es un muro.
Comprobar que funciona
Una vez tu robots.txt en su sitio, comprueba el resultado: ¿son tus páginas realmente accesibles para los bots correctos? Nuestro verificador de visibilidad en IA gratuito controla el acceso de los crawlers y las señales que la IA pondera. Y si aún dudas sobre el llms.txt, escribimos por qué pesa poco.
¿Bloquear GPTBot impide aparecer en ChatGPT?
No. GPTBot sirve al entrenamiento de los modelos. Las citas en ChatGPT Search pasan por OAI-SearchBot y ChatGPT-User. Puedes bloquear GPTBot (rechazar el entrenamiento) y seguir siendo citable, siempre que dejes pasar OAI-SearchBot.
¿Bloquear Google-Extended hunde mi SEO?
No. Google-Extended solo controla el uso de tu contenido para entrenar Gemini. El posicionamiento clásico y las AI Overviews dependen de Googlebot, que nunca debes bloquear.
¿robots.txt bloquea de verdad los bots de IA?
robots.txt es declarativo: los editores serios (OpenAI, Anthropic, Google, Perplexity) lo respetan, pero no es una barrera técnica. Un bot malicioso puede ignorarlo; para un bloqueo duro hace falta una regla de servidor.
¿Qué bots dejar pasar para la visibilidad en IA?
Los bots de cita a demanda: OAI-SearchBot y ChatGPT-User (OpenAI), Perplexity-User y PerplexityBot (Perplexity), Claude-User (Anthropic), más Googlebot. Un bot bloqueado no puede citarte.
Publicado en junio de 2026. Los nombres y comportamientos de los bots de IA cambian rápido; consulta la documentación de los editores antes de fijar una configuración. Información general, no un consejo individualizado.