Construcción de un Motor de Búsqueda Inversa de Imágenes con Amazon Titan Multimodal en Amazon Bedrock y Servicios Gestionados de AWS.

0
54
Build a reverse image search engine with Amazon Titan Multimodal Embeddings in Amazon Bedrock and AWS managed services

La tecnología de búsqueda visual está revolucionando el comercio electrónico, facilitando cómo los clientes encuentran productos mediante imágenes en lugar de texto. Esto es especialmente útil cuando los compradores tienen una idea visual clara de lo que desean, pero encuentran difícil describirlo con palabras. Un ejemplo común es buscar un bolso de cuero rojo con cadena dorada únicamente mediante texto, lo cual puede resultar ser un proceso impreciso y arduo. Sin embargo, con la búsqueda visual mediante imágenes, es posible obtener resultados más exactos y rápidos que mejoran significativamente la experiencia de compra.

En el ámbito del comercio electrónico, los motores de búsqueda de imágenes inversas permiten a los usuarios subir una imagen para encontrar información relacionada, analizando su contenido visual para localizar imágenes similares en su base de datos. Empresas como Amazon emplean esta tecnología para que los usuarios busquen productos similares en sus sitios web de ecommerce usando fotos. Además de su aplicación en comercio electrónico, estas herramientas son valiosas para cuerpos policiales que buscan identificar objetos ilegales en venta o sospechosos, para editores que verifican la autenticidad del contenido visual, en la salud para análisis médicos, y en la lucha contra la desinformación, infracciones de derechos de autor y productos falsificados.

Dentro del contexto de la inteligencia artificial generativa, se han desarrollado modelos de incrustación multimodal que integran diversos tipos de datos—como texto, imagen, video y audio—en un espacio vectorial compartido, permitiendo así comparar atributos visuales para obtener búsquedas más precisas y relevantes. Amazon Bedrock, por ejemplo, ofrece un servicio gestionado que pone a disposición varios modelos de inteligencia artificial de alto rendimiento a través de una única API, facilitando así la creación de aplicaciones de AI generativa de forma segura y responsable.

Además, una aplicación de esta tecnología es la creación de un motor de búsqueda inversa de imágenes usando incrustaciones multimodales de Amazon Titan, facilitando la búsqueda precisa de imágenes similares basadas en consultas visuales. Al subir datos a Amazon S3, generar incrustaciones mediante Amazon Titan, almacenarlas en un índice vectorial de OpenSearch Serverless, y analizar imágenes con Amazon Rekognition para extraer objetos clave, se puede realizar una búsqueda de similitud para encontrar coincidencias de productos en imágenes de manera eficaz.

El uso de estos recursos integrados no solo optimiza la precisión y relevancia de las recomendaciones de productos basadas en búsquedas visuales, sino que también mejora la experiencia del usuario en plataformas de ecommerce, potenciando la innovación y el manejo de datos con servicios como Amazon SageMaker y OpenSearch Service.
vía: AWS machine learning blog