Amazon ha lanzado recientemente Amazon Bedrock Guardrails, una herramienta destinada a establecer salvaguardias configurables que permitan construir aplicaciones de inteligencia artificial generativa de confianza a gran escala. Esta tecnología integra medidas de seguridad y privacidad que funcionan con diversos modelos base, tanto aquellos disponibles en Amazon Bedrock como otros que se alojan fuera de su plataforma. A través de una API independiente llamada ApplyGuardrail, las organizaciones podrán implementar políticas de IA responsable de manera ágil y escalable.
Bedrock Guardrails introduce seis salvaguardias clave que incluyen filtros de contenido, temas denegados, filtros de palabras, filtros de información sensible, controles de contextualización y la opción de Checks de Razonamiento Automatizado, que busca evitar contenido no deseado y alinear las interacciones de IA con políticas responsables de cada empresa.
Uno de los desafíos que enfrentan las organizaciones es equilibrar los controles de seguridad con los diversos requisitos de rendimiento y de lenguaje que varían según las aplicaciones. Para ello, Amazon ha implementado un sistema de niveles de salvaguardia que permite elegir las medidas adecuadas dependiendo de las necesidades específicas de cada caso. Por ejemplo, una empresa de servicios financieros puede optar por una protección integral y multilingüe para asistentes de IA destinados al cliente y utilizar salvaguardias más específicas y rápidas para herramientas de análisis interno.
Las nuevas opciones de niveles de salvaguardia se dividen en dos categorías principales: el «nivel clásico», que mantiene el comportamiento actual de las Guardrails de Amazon Bedrock, y un «nivel estándar» que ofrece soporte multilingüe para más de 60 idiomas y mejoras en la detección de contenido potencialmente dañino.
La implementación de estos niveles de salvaguardia busca optimizar la protección basada en el contexto de uso. Las empresas pueden seleccionar configuraciones mixtas para diferentes políticas de control como filtros de contenido y temas prohibidos, permitiendo un enfoque más personalizado por aplicación.
En cuanto a la evaluación de los resultados, se recomienda la creación de conjuntos de datos de prueba que incluyan ejemplos seguros y dañinos, así como casos límite, para medir la efectividad de las guardrails. El uso de la API ApplyGuardrail permite verificar el comportamiento de las guardrails sin generar costos asociados a la respuesta de modelos de lenguaje de gran tamaño.
A medida que las organizaciones continúan adoptando la inteligencia artificial, la introducción de niveles de salvaguardia en Amazon Bedrock Guardrails representa un avance significativo. Proporciona a las empresas las herramientas necesarias para construir aplicaciones innovadoras, éticas y confiables que estén alineadas con sus valores y regulaciones, asegurando así la confianza del usuario.
vía: AWS machine learning blog