Cómo 123RF Ahorró Más del 90% en Costos de Traducción al Cambiar a Amazon Bedrock

0
116
How 123RF saved over 90% of their translation costs by switching to Amazon Bedrock

En un mundo donde la industria de contenido digital evoluciona rápidamente, la accesibilidad multilingüe se ha convertido en un componente crucial para el alcance global y el compromiso del usuario. Una de las empresas que ha dado un paso significativo hacia la democratización del acceso al contenido digital es 123RF, un proveedor líder de activos digitales libres de regalías. En 2023, esta empresa innovó al utilizar Amazon OpenSearch Service para mejorar la detección de imágenes mediante un sistema de búsqueda semántica basada en vectores. Este avance sentó las bases para la implementación de Amazon Bedrock y el modelo Claude 3 Haiku de Anthropic, mejoras que multiplicaron por cien la eficiencia de moderación de contenido y aceleraron notablemente la traducción de contenido.

No obstante, la compañía enfrentó obstáculos relacionados con la traducción y el descubrimiento de contenido en 15 idiomas adicionales. A pesar de su éxito entre los usuarios de habla inglesa, los títulos y palabras clave exclusivamente en inglés limitaron la accesibilidad a su vasta biblioteca de activos digitales, que incluye millones de imágenes y archivos de audio y gráficos en movimiento. La traducción ininterrumpida con Google Translate resultó ser financieramente prohibitiva, y otros modelos como Anthropic’s Claude Sonnet o OpenAI GPT-4 no resultaron rentables. Aunque OpenAI GPT-3.5 cumplía con los criterios de costo, no ofrecía una calidad de salida consistente, lo que llevó a 123RF a buscar una solución más fiable y asequible.

La solución se encontró en los avances tecnológicos proporcionados por Amazon Bedrock y Claude 3 Haiku, junto con un almacenamiento vectorial. Estos permitieron a 123RF traducir metadatos de contenido de manera eficaz, reduciendo significativamente los costos y mejorando la capacidad global de descubrimiento de contenido.

El desafío fundamental que 123RF enfrentó fue equilibrar calidad y costo en la traducción masiva. Dado que los activos digitales de la empresa dependen de títulos y descripciones generados por los usuarios, era esencial traducir este metadato a 15 idiomas diferentes para aprovechar al máximo su biblioteca. Sin embargo, esto presentó desafíos técnicos y financieros.

Uno de los principales retos fue la resolución de entidades nombradas (NER), que requería identificar y gestionar correctamente nombres propios, marcas y referencias específicas culturalmente a través de diferentes idiomas. Un ejemplo típico sería una foto de archivo de la Torre Eiffel, cuyo nombre debe mantenerse en todos los idiomas, en lugar de ser traducido literalmente.

123RF exploró diversos modelos de lenguaje, encontrando que los más grandes, como OpenAI GPT-4 y Anthropic’s Claude Sonnet, ofrecían alta calidad pero resultaban inviables económicamente. Los modelos más pequeños como GPT-3.5 eran asequibles pero presentaban traducciones inconsistentes. Finalmente, Amazon Bedrock proporcionó un equilibrio ideal entre calidad y costo.

El equipo también desarrolló técnicas avanzadas de ingeniería de prompts para maximizar el rendimiento del modelo de lenguaje, integrándolas con un almacenamiento vectorial para mejorar aún más los resultados. Gracias a estas innovaciones, 123RF logró reducir sus costos de traducción en un 95%, mejorando simultáneamente la calidad de las traducciones y permitiendo una rápida expansión a nuevos mercados lingüísticos.

Con miras al futuro, 123RF contempla expandir su cobertura idiomática más allá de los 15 idiomas iniciales y explorar mayores integraciones de IA generativa en sus operaciones, fortaleciendo la moderación de contenido y personalizando las recomendaciones de contenido a sus usuarios. Este avance sitúa a 123RF como un referente de cómo las empresas pueden aprovechar la IA para superar barreras lingüísticas y globalizar su contenido digital con éxito.
vía: AWS machine learning blog