Propósito
- Mantener el tono corporativo y la coherencia de estilo.
- Evitar respuestas inapropiadas o que contengan información sensible.
- Cumplir políticas y regulaciones (por ejemplo, protección de datos o normativas de privacidad).
- Servir como último control de calidad antes de entregar la respuesta final.
Herencia Equipo → Agente
Los guardrails pueden definirse en:- Nivel equipo
- Se aplican de forma automática a todos los agentes.
- Ejemplo: prohibir términos sensibles o forzar un tono formal.
- Nivel agente
- Se agregan guardrails adicionales o se ajustan los heredados.
- Útiles cuando un agente requiere filtros más estrictos (por ejemplo, un bot de finanzas).
La herencia asegura que las políticas corporativas se cumplan en todo el equipo,
permitiendo a la vez que cada agente defina reglas de seguridad o estilo específicas.
permitiendo a la vez que cada agente defina reglas de seguridad o estilo específicas.
Rol en el ciclo conversacional
Durante cada turno de conversación, los guardrails intervienen en la fase final:- Entrada del usuario
- Guion + Reglas: el agente decide responder, usar herramientas o transferir.
- Generación de la respuesta candidata
- Guardrails:
- Evalúan y, si es necesario, corrigen o bloquean la respuesta.
- Pueden solicitar una nueva redacción al modelo para cumplir las restricciones.
- Modificadores (si están habilitados)
- Entrega de la respuesta final
Advertencia de rendimientoCada guardrail implica una revisión extra de la respuesta, lo que:
- Aumenta el número de mensajes procesados.
- Incrementa la latencia de respuesta.
Ejemplos de moderadores más comunes
- Contenido sensible: bloquear datos personales, números de tarjetas o información confidencial.
- Tono y estilo: garantizar que las respuestas mantengan un estilo formal o un lenguaje inclusivo.
- Limitación de temas: impedir que el agente responda a consultas fuera de su dominio.
- Prevención de lenguaje inapropiado: filtrar insultos, lenguaje discriminatorio o expresiones violentas.
Buenas prácticas
- Configura en el equipo lo que es política global (privacidad, estilo corporativo).
- Define solo los guardrails necesarios: demasiados filtros pueden afectar la naturalidad de las respuestas.
- Prueba exhaustivamente en Playground: verifica que las correcciones se apliquen sin romper la intención original.
- Monitorea el impacto en latencia, especialmente si el canal principal es voz.
Utiliza testers guardados en el Playground para reproducir escenarios críticos y comprobar cómo actúan los guardrails en tiempo real.
Próximos pasos
- Define qué guardrails se aplican a nivel equipo y cuáles en cada agente.
- Documenta las políticas de contenido y estilo que se deben cumplir.
- Prueba y ajusta con el Playground para encontrar el equilibrio entre seguridad y fluidez.

