La compañía Meta incursiona constantemente en el mundo de la inteligencia artificial y esta vez apuesta a la creación de un traductor capaz de transcribir y traducir de voz a texto, de voz a voz, de texto a texto y de texto a voz en 100 idiomas.
La empresa de tecnología e información lanzó un nuevo modelo de inteligencia artificial multilingüe y multimodal.
La compañía Meta incursiona constantemente en el mundo de la inteligencia artificial y esta vez apuesta a la creación de un traductor capaz de transcribir y traducir de voz a texto, de voz a voz, de texto a texto y de texto a voz en 100 idiomas.
El modelo, denominado "SeamlessM4T", funciona con inteligencia artificial y sigue un sistema único que busca reducir los errores y retrasos en los procesos de traducción.
Además, aprovecha los avances e información de otros modelos de la compañía, como No Language Left Behind, (ningún idioma se queda atrás), el traductor universal de voz con 200 idiomas.
Dentro de sus capacidades, el modelo cuenta con:
“Construir un traductor universal de idiomas, como el ficticio Babel Fish en The Hitchhiker's Guide to the Galaxy , es un desafío porque los sistemas existentes de voz a voz y de voz a texto solo cubren una pequeña fracción de los idiomas del mundo”, aseguró Meta en su página de lanzamiento.
Para crear la nueva IA, la compañía necesitó desarrollar un set de datos, bautizado como SeamlessAlign. El mismo está basado en miles de millones de oraciones de texto y 4 millones de horas de registros de voz extraídos de la web.
Además, bajo su enfoque de ciencia abierta, los metadatos del conjunto de datos de traducción multimodal comenzaron a ser liberados para que puedan seguirse desarrollando investigaciones. El conjunto de datos cuenta con un total de 270.000 horas de alineaciones de voz y texto.