Meta utiliza la Biblia para entrenar modelo de inteligencia artificial con idiomas

El Nuevo Testamento del manuscrito religioso es una de las fuentes de entrenamiento de la IA de Meta, la compañía dirigida por Mark Zuckerberg, creador de Facebook.
Ello, debido a que la Biblia es el texto traducido a más idiomas y cuya traducción se estudió con profundidad para investigar la correcta utilización de los textos lingüísticos. (Foto: Lionel BONAVENTURE / AFP)

La guerra de los de se continúa librando entre las compañías tecnológicas más importantes del mundo. Meta, empresa matriz de e Instagram, se encuentra actualmente entrenando su propia versión de IA con un método revolucionario: usando distintas versiones de la .

El proyecto Massively Multilingual Speech (MMS por sus siglas en inglés), se trata de un trabajo de aprendizaje autosupervisado por la tecnología, la cual proporciona datos etiquetados en más de 1,100 idiomas, y 4,000 sin etiquetar.

Es decir, que los resultados muestran que la inteligencia artificial de Meta ha logrado desempeñarse mejor en comparación con los modelos actuales de IA, cubriendo 10 veces más idiomas.

Ello, debido a que la Biblia es el texto traducido a más idiomas y cuya traducción se estudió con profundidad para investigar la correcta utilización de los textos lingüísticos.

LEA TAMBIÉN: ¿ChatGPT puede ayudar a hacer buenas inversiones en la bolsa?

Estas traducciones, que en ocasiones cuentan con grabaciones de audio, permitieron que la inteligencia artificial de estudiara el conjunto de datos de lecturas del Nuevo Testamento en más de 1,100 idiomas, lo que proporcionó un promedio de 32 horas de datos por idioma.

A través de estas grabaciones no etiquetadas de otras lecturas religiosas cristianas, los investigadores de Meta lograron incrementar el número de idiomas disponibles a más de 4,000.

“Y, si bien el contenido de las grabaciones de audio es religioso, nuestro análisis muestra que esto no sesga el modelo para producir un lenguaje más religioso. Creemos que esto se debe a que utilizamos un enfoque de clasificación temporal conexionista (CTC), que está mucho más restringido en comparación con los modelos de lenguaje grandes (LLM, por sus siglas en inglés) o los modelos secuencia a secuencia de reconocimiento de voz”, indicó la compañía en su blog oficial.

LEA TAMBIÉN: El impacto de la IA generativa en educación

¿Es la mejor inteligencia artificial en idiomas?

Los investigadores de Meta realizaron una comparación entre el modelo Whisper de OpenAI y los modelos entrenados con los datos del proyecto de inteligencia artificial de Meta.

Los resultados revelaron que los modelos de Meta logran reducir a la mitad el porcentaje de errores de palabras en comparación con Whisper, destacando que los modelos de Meta son capaces de abarcar 11 veces más idiomas que Whisper.

Estos hallazgos demuestran que el modelo de Meta muestra un rendimiento excepcional en comparación con los mejores modelos de voz disponibles en la actualidad.

Los investigadores de Meta también resaltan que, a pesar de haber entrenado el modelo en más de 4,000 idiomas, su rendimiento sigue siendo “excelente”, tras desarrollar un sistema de conversión de texto a voz para más de 1,100 idiomas, lo que amplía aún más la utilidad y versatilidad de su enfoque.

Estos avances en el campo de la y el procesamiento del lenguaje natural son prometedores y sugieren un gran potencial para mejorar la calidad y la accesibilidad de las tecnologías de voz en diversos idiomas alrededor del mundo.

LEA TAMBIÉN: Inteligencia Artificial en la selección de personal, ¿puede elegir mejores talentos?
¡Beneficios ilimitados con tu suscripción a Gestión! Disfruta de hasta 70% de dscto. en más de 300 promociones del Club de Suscriptores, que además podrás usar todas las veces que quieras. Conócelos aquí ¿Aún no eres suscriptor?, adquiere tu plan aquí.


NOTICIAS SUGERIDAS

Contenido GEC

Más en Tendencias Mix

Te puede interesar:

Suscríbete para tener acceso a este contenido.
Para seguir viendo el contenido que te gusta, adquiere uno de nuestros planes.
Por favor, regístrate para ver este contenido.
Completa tus datos para seguir leyendo noticias de tu interés.
Has superado el límite de páginas vistas.
Por favor suscríbete para tener acceso a contenido ilimitado.