El Litoral / Telam
El Litoral / Telam
La Real Academia Española (RAE) y la Asociación de Academias de la Lengua Española (ASALE) publicaron una nueva actualización del Corpus del Español del Siglo XXI (CORPES XXI) que incluye más de 10.000 formas respecto al anterior.
Los corpus son un conjunto formado por miles o cientos de miles de textos (novelas, obras de teatro, guiones de cine, noticias de prensa, ensayos, transcripciones de noticiarios radiofónicos o televisivos, transcripciones de conversaciones o discursos) y cientos o miles de millones de formas y son empleados para conocer el significado y características de palabras, expresiones y construcciones a partir de los usos reales registrados. A través de un corpus se pueden obtener las características globales que presenta una lengua en un momento determinado de su historia.
Según informó la agencia de noticias DPA, el CORPES XXI, dirigido por el académico Guillermo Rojo, cuenta en la actualidad con más 285.000 documentos que suman alrededor de 286 millones de formas, procedentes de textos escritos y de transcripciones de textos orales.
En relación a la versión anterior, que fue publicada en julio de 2018, la actual supone un incremento de 10 millones de formas.
Respecto al bloque de ficción (novelas, guiones, relatos, obras de teatro) las formas del CORPES XII sobrepasan los 81 millones, mientras que las contenidas en textos de libros de no ficción (ciencias sociales, salud, política, artes, tecnología) se acercan a los 207 millones.
Por otro lado, la prensa está representada con aproximadamente 142 millones de formas y cinco millones más provienen de blogs, entrevistas digitales y miscelánea.