Criterios de anotación léxica

por Marta Torres Martínez

La literatura de transmisión oral es una rica e inagotable fuente de léxico que va transmitiéndose de generación en generación y que, además, en muchas ocasiones, se circunscribe a áreas dialectales bastante acotadas que, por tanto, ya no recogen los diccionarios generales al uso.

Teniendo en cuenta esta circunstancia, a la hora de analizar el léxico documentado en las muestras del Corpus de Literatura Oral (CLO), no solo basta con consultar repertorios generales del español actual —como la última edición del Diccionario de la Lengua Española (DRAE, 2014) de la RAE o el Diccionario del Español Actual (DEA, 1999) de Seco, Andrés y Ramos— y los bancos de datos contemporáneos —como el Corpus de Referencia del Español Actual (CREA) o el Corpus del Español del Siglo XXI (CORPES XXI), ambos de la RAE—, sino también corpus y diccionarios o vocabularios adscritos a etapas anteriores de nuestra lengua así como de índole dialectal.

De un lado, en lo que respecta a la diacronía, es sabido que nuestra lengua aún no cuenta con un diccionario de carácter histórico que dé cuenta de los usos y modificaciones de las palabras a lo largo del tiempo, si bien se encuentra en elaboración el Nuevo diccionario histórico (NDH), que desde la RAE está dirigiendo el profesor José Antonio Pascual Rodríguez y cuya primera muestra de consulta electrónica ya está disponible en la Red. Este repertorio queda respaldado por el Corpus del Nuevo Diccionario Histórico del Español (CNDHE), que contiene más de 400 millones de registros y en el que se pueden obtener con gran facilidad datos relevantes para el estudio del léxico y la gramática del español desde el siglo XIII hasta la actualidad. No obstante, también contamos con el Diccionario Crítico Etimológico Castellano e Hispánico de Joan Corominas y José Antonio Pascual (DCECH, 1980-91), cuya función principal es indicar la procedencia de las voces que lematiza. Además, existen otros recursos que la RAE pone a disposición del usuario, tales como el Corpus Diacrónico del Español (CORDE), que recopila muestras de diferentes géneros desde los inicios del idioma hasta el año 1975; el Nuevo Tesoro Lexicográfico de la Lengua Española (NTLLE), que reúne una amplia selección de los repertorios lexicográficos que durante los últimos quinientos años han recogido, definido y consolidado el patrimonio léxico de nuestro idioma; el Mapa de Diccionarios (MdD), herramienta que permite consultar simultáneamente seis ediciones representativas del diccionario académico (1780, 1817, 1884, 1925, 1992 y 2001); y el Fichero General (FG), que consta de más de diez millones de papeletas, léxicas y lexicográficas, ordenadas alfabéticamente en gavetas que contienen, cada una, unas dos mil cédulas.

De otro lado, en cuanto a la variación diatópica, hemos de tener en cuenta algunos corpus y repertorios claves, tales como el Corpus Diacrónico y Diatópico del Español de América (CORDIAM), constituido por documentos escritos en español y en América exclusivamente, generados entre 1494 y 1905 y recabados directamente de archivos, de carácter no literario y no periodístico, que abarcan los actuales 19 países americanos hispanohablantes más el sur y oeste de Estados Unidos, Jamaica, Haití y Guyana; el Corpus Lingüístico de Inventarios (CorLexIn), formado a partir de documentos manuscritos e inéditos del siglo XVII; y el Tesoro Léxico de las Hablas Andaluzas (TLHA, 2000), elaborado por el profesor Manuel Alvar Ezquerra, nutrido de 146 fuentes —desde glosarios generales de la región hasta otros más específicos de las distintas actividades (minería, transporte  fluvial de la madera, cultivo del olivo o de la vid, léxico cofradiero, artesanía popular, explotación de las salinas, pesca, marinería, etc.) o localidades—, y que contiene unas 40.000 entradas diferentes, que suman más de 86.000 acepciones.

Al analizar y estudiar el léxico de las composiciones registradas en el Corpus de Literatura Oral (CLO), se pretende contribuir a un mejor conocimiento del léxico español, especialmente de índole popular y dialectal, pues las muestras objeto de investigación se adscriben al ámbito de la vida cotidiana de localidades concretas. En definitiva, se trata de garantizar la conservación de léxico que, en algunas ocasiones, no se registra ya en diccionarios de nuestra lengua y que, por tanto, está destinado al olvido.