LEDIGAL - Variación sociolingüística
no léxico dispoñible do galego

USC. Instituto da Lingua Galega

Sobre o Léxico dispoñible do galego (2014), Dispogal e LEDIGAL

Léxico dispoñible

O léxico dispoñible é o vocabulario que se presenta na mente dos falantes de xeito inmediato e natural cando se trata de determinado ámbito temático, denominado centro de interese (CI). Para obter o léxico dispoñible, trabállase con mostras representativas de informantes que escriben, nun tempo controlado, listaxes de palabras vinculadas con determinados temas (os CI). A dispoñibilidade léxica dos datos obtidos calcúlase tendo en conta non só a frecuencia das formas nas listaxes, senón tamén a orde de aparición nelas. Por suposto, as palabras máis frecuentes e que ocupan postos máis altos nas listaxes son as máis dispoñibles.

Léxico dispoñible do galego (2014). Descrición básica

No ano 2014 Belén López Meirama e María Álvarez de la Granja publicaron como anexo 71 da revista Verba o libro Léxico dispoñible do galego (LDG), que analiza o léxico dispoñible proporcionado no curso 2008-2009 por 800 estudantes de segundo de bacharelato para 18 ámbitos temáticos ou centros de interese (CI).

Os centros educativos que compoñen a mostra son os seguintes.

Centro escolar Localidade Poboac. Prov. Situac. Nº enq.
1 IES Agra do Orzán A Coruña Urbana CO costa 16
2 IES Salvador de Madariaga A Coruña Urbana CO costa 15
3 IES Eusebio da Guarda A Coruña Urbana CO costa 17
4 CPR Cristo Rey A Coruña Urbana CO costa 16
5 CPR Grande Obra de Atocha A Coruña Urbana CO costa 16
6 CPR Santo Domingo A Coruña Urbana CO costa 16
7 IES Saturnino Montojo Ferrol Urbana CO costa 17
8 IES Rodolfo Ucha Piñeiro Ferrol Urbana CO costa 15
9 IES Pontepedriña Santiago Urbana CO interior 14
10 IES Antonio Fraguas Fraguas Santiago Urbana CO interior 18
11 IES As Fontiñas Santiago Urbana CO interior 16
12 CPR La Salle Santiago Urbana CO interior 16
13 IES Fragas do Eume Pontedeume periurb. CO costa 19
14 IES Afonso X O Sabio Cambre periurb. CO costa 16
15 IES de Ames Bertamiráns periurb. CO interior 13
16 IES Isidro Parga Pondal Carballo Vila CO costa 16
17 IES Campo de San Alberto Noia Vila CO costa 16
18 IES Francisco Aguiar Betanzos Vila CO interior 16
19 IES Punta Candieira Cedeira Rural CO costa 16
20 IES Macías o Namorado Padrón Rural CO interior 16
21 IES Terra do Xallas Sta. Comba Rural CO interior 16
22 IES Politécnico de Lugo Lugo Urbana LU interior 16
23 IES Xoan Montes Lugo Urbana LU interior 16
24 IES Leiras Pulpeiro Lugo Urbana LU interior 16
25 IES Francisco Daviña Rei Monforte Vila LU interior 16
26 IES Pedregal de Irimia Meira Rural LU interior 16
27 IES Porta da Auga Ribadeo Rural LU costa 16
28 IES Otero Pedrayo Ourense Urbana OU interior 18
29 IES A Carballeira Ourense Urbana OU interior 14
30 CPR Santa María Ourense Urbana OU interior 16
31 IES Nº 1 do Carballiño O Carballiño Vila OU interior 16
32 IES Aquis Querquernis Bande Rural OU interior 16
33 IES do Castro Vigo Urbana PO costa 16
34 IES Alexandre Bóveda Vigo Urbana PO costa 16
35 IES de Beade Vigo Urbana PO costa 16
36 CPR María Inmaculada Vigo Urbana PO costa 16
37 CPR Las Acacias Vigo Urbana PO costa 16
38 CPR Apóstol Santiago Vigo Urbana PO costa 16
39 IES Sánchez Cantón Pontevedra Urbana PO costa 16
40 IES Gonzalo Torrente Ballester Pontevedra Urbana PO costa 16
41 IES A Xunqueira Pontevedra Urbana PO costa 16
42 IES Val Miñor Nigrán periurb. PO costa 16
43 IES Primeiro de Marzo Baiona periurb. PO costa 16
44 IES Ribeira do Louro O Porriño periurb. PO interior 16
45 IES de Rodeira Cangas Vila PO costa 16
46 IES Castro Alobre Vilagarcía Vila PO costa 16
47 IES Manuel García Barros A Estrada Vila PO interior 16
48 IES Pedra da Auga Ponteareas Vila PO interior 16
49 IES A Sangriña A Guarda Rural PO costa 20
50 IES de Valga Valga Rural PO interior 12

Táboa 1. Os centros de ensino do LDG

A enquisa

As enquisas constan de dúas partes. Na primeira recóllense os datos de tipo sociocultural e sociolingüístico das/dos estudantes; na segunda recóllese a información estritamente lingüística, a través de listaxes de palabras correspondentes aos 18 CI escritas polas/polos estudantes nun tempo de dous minutos para cada CI.

Os datos socioculturais e sociolingüísticos dos que se obtén información para cada estudante son os seguintes:

  1. Sexo
  2. Residencia familiar
  3. Lingua inicial
  4. Lingua habitual
  5. Estudos dos pais
  6. Profesión dos pais

A partir da información obtida sobre o lugar de residencia familiar, cada enquisa é asignada a un dos seguintes tipos de residencia: urbana, periurbana, vila e rural. A partir sobre todo dos estudos dos pais e, secundariamente da profesión dos pais, atribúeselle a cada estudante un determinado nivel sociocultural.

O tratamento dos datos lingüísticos. Criterios de lematización dos materiais

Ás diferentes palabras e expresións escritas polas/polos estudantes na segunda parte da enquisa (chamadas variantes) son lematizadas baixo unha forma normalizada (lema) que permite agrupar variantes flexivas (por exemplo ollo e ollos, variantes ortográficas, como abogado e avogado, variantes fónicas ou morfolóxicas, moitas veces dialectais, como pantalóns, pantalois e pantalós, así como formas convenientemente escritas con voces que conteñen erratas, lapsus etc.

Ademais, as frecuentes voces de orixe española que se encontran nas listaxes teñen un diferente tratamento en función da existencia ou non dun cognado galego.

  1. Se existe un cognado galego, a voz do español así como as voces adaptadas ou híbridas lematízanse baixo a forma estándar galega. Así, por exemplo, baixo o lema moa agrupamos as variantes moa, muela e mola.
  2. Contrariamente, se non existe un cognado galego, que comparta a mesma raíz ca a forma do español, esta lematízase en principio baixo a forma estándar do español. Por este motivo encontramos, por exemplo, o lema tobillo (separado do lema nocello e do lema tornecelo), que agrupa a tobillo, tobillos e tovillo. Con todo, dado que é habitual a adaptación ao galego das formas de orixe española, se nun determinado CI a forma adaptada é máis frecuente ca a forma sen adaptar, escóllese como lema a forma adaptada. Por este motivo, no CI A Cidade encontramos, por exemplo, o lema axuntamento.

Tal e como se pode observar nos seguintes exemplos, moi frecuentemente baixo un lema podemos encontrar un considerable número de variantes, que poden ser de moi distinto tipo:

óso 291

hosos 2

hueso 2

huesos 4

osiños 1

oso 33

óso 51

osos 88

osós 1

ósos 109

beirarrúa 208

beira rúas 1

beirarrua 9

beirarrúa 80

beirarruas 10

beirarrúas 35

beirarua 7

beirarúa 33

beiraruas 4

beirarúas 12

beirarús 1

beirrarúa 1

beirrarúas 1

veira rúa 4

veirarrua 1

veirarrúa 1

veirarrúas 2

veirarúa 2

veiraruas 2

veirarúas 2

carretera 162

caretera 1

carreteira 49

carreteiras 31

carretera 44

carreteras 36

moitas carreteiras 1

axuntamento 43

aiuntamento 1

alluntamiento 1

axuntamento 20

ayuntamento 10

ayuntamiento 10

ayuntamientos 1

Os criterios de edición detallados, así como a súa xustificación, poden consultarse no Léxico dispoñible do galego (López Meirama, Álvarez de la Granja 2014: 31-127).

Consulta dos datos en Dispogal

Na aplicación de acceso libre Dispogal <www.http://gramatica.usc.es/dispogal> (usuario e contrasinal: USC, datos: proxecto Léxico dispoñible do galego), deseñada por Guillermo Rojo, poden consultarse os lemas correspondentes a cada CI, ordenados por defecto de maior a menor dispoñibilidade léxica. Así mesmo, esta aplicación permite filtrar os datos polas diferentes variables sociais e sociolingüísticas a que fixemos referencia á hora de describir a enquisa (sexo, lingua inicial, lingua habitual, tipo de poboación da residencia familiar, nivel sociocultural), así como polas variables correspondentes ao centro de ensino (centro concreto, tipo de poboación do centro de ensino [urbana, periurbana, vila, rural]), tipo de centro [público, privado], provincia e situación xeográfica do centro [costa, interior].

Por exemplo, nesta consulta obtéñense, ordenados de maior a menor dispoñibilidade, os lemas proporcionados polas mulleres que só falan galego ou que falan máis galego ca castelán para o CI "O campo" (ofrécese un fragmento dos resultados).

Imaxe 1. Lemas proporcionados polas mulleres que só falan galego ou que falan máis galego ca castelán no CI "O campo"

Ademais a aplicación Dispogal ofrece outras posibilidades, como a de obter datos cuantitativos sobre produción de palabras dos grupos sociais que se escollan ou a de establecer comparacións entre diferentes grupos ou mesmo entre diferentes proxectos almacenados na aplicación.

LEDIGAL. Variación socio-lingüística no léxico dispoñible do galego

A aplicación Dispogal, tal e como acabamos de indicar, permite filtrar a información por diferentes variables, e obter a listaxe de lemas ofrecidos polo grupo de estudantes que se seleccione. Para completar as posibilidades de busca de Dispogal, e a partir dos datos obtidos no proceso de elaboración do Léxico dispoñible do galego, deseñamos no Instituto da Lingua Galega unha segunda aplicación, que complementa o tipo de buscas que ofrece Dispogal. Esta aplicación, chamada LEDIGAL. Variación socio-lingüística no léxico dispoñible do galego, serve para correlacionar os lemas e as variantes concretas escritas polas/polos estudantes coas diferentes variables sociais e sociolingüísticas referidas máis arriba, tal e como se pode comprobar nas seguintes imaxes. Nas dúas primeiras buscamos o lema rodilla en alumnado que ten o galego como lingua inicial e en alumnado que ten o castelán como lingua inicial, respectivamente.

Imaxe 2. Resultado da busca do lema rodilla en estudantes que teñen o galego como lingua inicial (fragmento)

Imaxe 3. Resultado da busca do lema rodilla en estudantes que teñen o castelán como lingua inicial (fragmento)

Nas seguintes imaxes, contrastamos a presenza da variante cóbado ou cóbados en alumnado de zona rural que fala exclusivamente galego coa presenza da variante codo(s) nese mesmo grupo de estudantes. Para máis detalles sobre o funcionamento da aplicación, vid. a Axuda.

Imaxe 4. Busca da variante cóbado(s) no CI "O corpo humano" en estudantes de zona rural que só falan galego (fragmento)

Imaxe 5. Busca da variante codo(s) no CI "O corpo humano" en estudantes de zona rural que só falan galego (fragmento)

Os lemas e variantes recollidos no Léxico dispoñible do galego dentro de cada CI poden consultarse no documento descargable no seguinte enlace: Lemas e variantes do LDG. O documento coincide case na súa totalidade co Apéndice 1 que publicamos en 2014 como anexo da obra citada. Con todo, no proceso de preparación de LEDIGAL identificamos algúns erros na lematización ou na transcrición, que foron corrixidos no novo documento. O libro contén outros tres apéndices, que poden encontrarse online:

  1. Listaxe xeral de lemas ordenados por frecuencia (Apéndice 2)
  2. Listaxe xeral de lemas ordenados alfabeticamente (Apéndice 3)
  3. Mostra da enquisa (Apéndice 4)