Los desarrolladores de software enfrentan importantes desafíos al utilizar modelos fundamentales para extraer datos de activos no estructurados. Este proceso requiere una cuidadosa identificación de modelos que se ajusten a los requisitos específicos de precisión, costo y características del desarrollador. Además, la optimización del rendimiento de precios a través del ajuste fino y una extensa ingeniería de indicaciones consume considerable tiempo. La gestión de múltiples modelos, la implementación de salvaguardias de seguridad y la adaptación de salidas para alinearse con los requisitos de los sistemas posteriores pueden resultar complicadas y laboriosas.
Para ayudar a abordar estos retos, Amazon ha lanzado en vista previa pública Amazon Bedrock Data Automation. Esta nueva capacidad de Amazon Bedrock ofrece una experiencia unificada para desarrolladores de todos los niveles, facilitando la automatización de la extracción, transformación y generación de información relevante a partir de documentos, imágenes, audio y videos para la creación de aplicaciones impulsadas por inteligencia artificial generativa. Con Amazon Bedrock Data Automation, los clientes pueden aprovechar al máximo sus datos extrayendo conocimientos de su contenido multimodal no estructurado en un formato compatible con sus aplicaciones. La experiencia gestionada, la facilidad de uso y las capacidades de personalización de Amazon Bedrock Data Automation ayudan a los clientes a entregar valor comercial más rápidamente, eliminando la necesidad de dedicar tiempo y esfuerzo a orquestar múltiples modelos, diseñar indicaciones o unir salidas.
Esta herramienta permite generar salidas estándar y personalizadas. Las salidas estándar son conocimientos predeterminados específicos para cada modalidad, como resúmenes de video que capturan momentos clave, contenido tóxico visual y audible, y explicaciones de gráficos documentales. Por otro lado, las salidas personalizadas utilizan plantillas definidas por el cliente que especifican requisitos de salida mediante lenguaje natural o un editor de esquemas. Esto otorga a los clientes control total sobre la salida, facilitando su integración en aplicaciones existentes.
Amazon Bedrock Data Automation también se integra con Amazon Bedrock Knowledge Bases, lo que simplifica la generación de información significativa a partir de contenido multimodal no estructurado, brindando respuestas más relevantes para la Generación Aumentada por Recuperación (RAG).
Los clientes pueden comenzar a utilizar salidas estándar para cuatro modalidades: documentos, imágenes, videos y audio, junto con salidas personalizadas para documentos e imágenes. Las salidas personalizadas para video y audio se habilitarán cuando la capacidad esté disponible de forma general.
Un ejemplo concreto en la industria de medios y entretenimiento incluye la monetización de contenido de largo formato, como programas de televisión y películas, a través de la colocación contextual de anuncios. Para entregar los anuncios adecuados en los momentos precisos del video, es necesario extraer información significativa tanto de los anuncios como del contenido de video. Amazon Bedrock Data Automation permite a las aplicaciones de colocación de anuncios contextuales generar estas percepciones.
A medida que los desarrolladores buscan automatizar flujos de trabajo complejos de procesamiento de documentos, Amazon Bedrock Data Automation simplifica tareas como la extracción de datos, normalización y validación, lo que reduce la complejidad operativa y mejora la eficiencia del procesamiento. Esto les permite manejar mayores volúmenes de procesamiento de préstamos, minimizar errores y promover la excelencia operativa.
La herramienta está disponible en vista previa pública en la región de AWS Estados Unidos Oeste 2 (Oregón), brindando a todos los desarrolladores la oportunidad de explorar el poder de la automatización en el manejo de datos no estructurados. Con Amazon Bedrock Data Automation, la generación de información precisa y útil a partir de contenido no estructurado se convierte en una tarea más simple y efectiva para construir aplicaciones impulsadas por inteligencia artificial generativa.
vía: AWS machine learning blog