Hoy se ha anunciado la disponibilidad de las incrustaciones binarias para las Amazon Titan Text Embeddings V2, disponibles en las Amazon Bedrock Knowledge Bases y en Amazon OpenSearch Serverless. Con este nuevo soporte, las empresas podrán desarrollar aplicaciones de Recuperación y Generación Aumentada (RAG) más eficientes al reducir el uso de memoria y los costos asociados.
La nueva capacidad de Amazon Titan Text Embeddings V2 permite generar representaciones semánticas más significativas de documentos, párrafos y oraciones con dimensiones configurables de 1,024, 512 o 256 bits, ahora con la posibilidad de optar por incrustaciones binarias que almacenan datos como vectores binarios, haciendo el almacenamiento y la computación más eficientes.
Por su parte, la opción sin servidor de Amazon OpenSearch Service mejora la experiencia de búsqueda con support para algoritmos de vecino más cercano exactos y aproximados. Esto se traduce en búsqueda más rápida y almacenamiento de vectores más económico mediante la adopción de índices binarios.
Los beneficios de esta nueva funcionalidad han sido probados. Un benchmark con el conjunto de datos de recuperación Massive Text Embedding Benchmark (MTEB) mostró una mejora de 25 veces en la latencia y una precisión de recuperación que se mantiene al 98.5% con reordenamiento, y al 97% sin él. Estas cifras son casi comparables a las obtenidas con las incrustaciones de precisión completa.
Además, las pruebas con el algoritmo HNSW han demostrado una reducción del 50% en las Unidades Computacionales de OpenSearch, favoreciendo aún más los ahorros de costos. Este enfoque de distancias de Hamming maximiza la eficiencia, especialmente en comparación con los métodos tradicionales que demandan mayores recursos computacionales.
La nueva característica ya está disponible en todas las regiones de AWS donde están habilitados los servicios de Amazon Bedrock y Amazon OpenSearch Serverless. Los usuarios pueden comenzar a explorar los beneficios de esta tecnología visitando la consola de Amazon Bedrock y accediendo a la comunidad AWS para aportar retroalimentación y participar en la discusión sobre inteligencia artificial generativa.
Para más información sobre Amazon Bedrock y Amazon OpenSearch Serverless, así como detalles sobre cómo implementar estas soluciones, se puede consultar la documentación oficial y las páginas de productos correspondientes en el sitio web de AWS.
vía: AWS machine learning blog