LEDIGAL - Variación sociolingüística
no léxico dispoñible do galego

USC. Instituto da Lingua Galega

Funcionamento de LEDIGAL

Buscas e resultados. Información básica

En LEDIGAL poden facerse buscas por lemas ou por variantes, isto é, pódense buscar as formas concretas (variantes) escritas polas/polos informantes nas listaxes do Léxico dispoñible do galego (LDG), ou ben as formas normalizadas (lemas) empregadas polas/polos editores para agrupar diferentes variantes ortográficas, fónicas, morfolóxicas etc. (ao respecto de lemas e variantes vid. Proxecto). A listaxe de lemas e variantes pode consultarse en Lemas e variantes do LDG.

O primeiro paso para realizar unha busca é seleccionar Lema ou Variante na casiña "Buscar en". Por defecto, as buscas realízanse sobre os lemas.

Imaxe 1. Selección de busca por Lema ou por Variante

A continuación escríbese na caixa de busca a forma que se desexa procurar (por exemplo, o lema xeonllo na imaxe 2) e presiónase no botón "Busca" situado na parte inferior do buscador. Como resultado obtense en primeiro lugar o número total de respostas, neste caso co lema xeonllo, que figuran no LDG (345) e a porcentaxe de estudantes que ofreceron unha resposta lematizada con esa forma (o 43,13% das/dos 800 informantes do LDG). A continuación ofrécense listadas as coincidencias encontradas con información sobre:

  1. Variante / lema / bloque temático (chamado centro de interese nos estudos de léxico dispoñible)
  2. Características do centro de estudos das/dos informantes que ofreceron a forma buscada (nome do centro, municipio, provincia, titularidade, situación e tipo de poboación).
  3. Características das/dos estudantes que proporcionaron a forma buscada (sexo, tipo de poboación da residencia familiar, lingua inicial, lingua habitual, anos de residencia en Galicia e nivel sociocultural).

Imaxe 2. Busca e resultados do lema xeonllo

No que respecta ao tempo de residencia (Vida en Galicia), a resposta "Si" indica que a/o estudante sempre residiu en Galicia. No caso de que non sexa así, a resposta é "Non" e a seguir indícase o número de anos de residencia en Galicia.

Imaxe 3. Tempo de residencia en Galicia

Nótese que, baixo a caixa onde escribimos o lema ou a variante, pode seleccionarse entre varias opcións de busca. Os resultados poden facerse coincidir exactamente coa forma escrita, ou ben pode marcarse a opción "comeza", "contén" ou "remata". A opción "comeza" é especialmente útil, por exemplo, se se desexa buscar unha variante fónica, ortográfica etc. con independencia da súa flexión. Así, por exemplo, se queremos ver as características das/dos estudantes que escribiron con <b> abogado (abogada, abogadas, abogado, abogados), teclearemos abogad na caixa de buscas e marcaremos a opción "comeza"; se nos interesa coñecer as características de quen empregou a terminación –bel, seleccionamos variante, escribimos bel na caixa de buscas e marcamos a opción "remata".

Imaxe 4. Resultados da busca das variantes que comezan por abogad-

Ordenación dos resultados

Os resultados aparecen ordenados en primeiro lugar por lema e en segundo lugar por variante. Deste modo, se a busca ofrece como resultado variantes pertencentes a diferentes lemas, encontraremos agrupadas as variantes pertencentes a cada un deles, ordenadas alfabeticamente entre si. Os lemas tamén se ordenan alfabeticamente. Así, se no bloque temático "O corpo humano" facemos unha busca de lemas que empecen por cardio-, primeiro obteremos as variantes correspondentes ao lema cardiopatía e a continuación, de acordo coa ordenacion alfabética dos lemas, as que teñen asignado o lema cardiovascular. As tres variantes diferentes correspondentes a este lema (cardiovascular, cardiovasculares e cardovascular) tamén se ordenan alfabeticamente entre si.

Imaxe 5. Resultado da busca dos lemas que comezan por cardio-

Acentuación gráfica

Por defecto, as buscas non son sensibles a acentos, de xeito que a procura pola variante cóbado ofrece tanto casos de cobado como de cóbado. O usuario que así o desexe, pode activar a opción "Sensible a acentos" para discriminar entre as formas con e sen acentuación gráfica

Imaxe 6. Sensibilidade a acentos

Filtraxe das buscas

LEDIGAL permite filtrar os resultados en función de diferentes variables. Por un lado, permite seleccionar o bloque temático ou centro de interese ao que se desexa cinguir a procura. Téñase en conta que se a busca non se limita a un bloque temático concreto, é posible que no resultado figuren máis coincidencias ca informantes, pois unha mesma / un mesmo estudante puido escribir a palabra en máis dun centro de interese. Así, por exemplo, se se busca o lema toupa sen restrinxirmos a busca a ningún centro de interese, obtéñense 107 repostas correspondentes a 98 persoas diferentes. Esta discrepancia entre coincidencias e informantes explícase porque 9 persoas escribiron a mesma palabra en dous bloques distintos, concretamente no bloque "Os animais" e no bloque "O campo".

Imaxe 7. Resultado das buscas do lema toupa

Por outro lado, as respostas pódense filtrar tendo en conta as características do alumnado, en función da súa lingua inicial (galego, castelán, as dúas, outra(s)), da súa lingua habitual (só galego, máis galego ca castelán, galego ou castelán indistintamente, máis castelán ca galego, só castelán, outra), do seu sexo, do seu nivel sociocultural (alto, medio, baixo) e do tipo de residencia (urbana, periurbana, vila, rural). O único trazo das/dos informantes polo que non se pode filtrar é o tempo de residencia en Galicia.

En terceiro lugar, pode realizarse a filtraxe a partir dos datos dos centros de ensino: tipo de centro (público ou privado), situación (costeira ou interior), tipo de poboación do centro (urbana, periurbana, vila, rural), provincia e localidade concreta (a nivel de concello). Non se pode filtrar, con todo, polo nome do centro de ensino.

Todas as posibilidades de filtraxe son combinables entre si. Por exemplo, nesta busca filtramos por bloque temático (as cores), nivel sociocultural (alto) e titularidade ou tipo de centro (privado):

Imaxe 8. Resultado da busca do lema vermello no bloque "As cores", entre alumnado de nivel sociocultural alto pertencente a centros privados

Cando se leva a cabo calquera filtraxe a partir das características do alumnado ou do centro de ensino, redúcese, obviamente, o tamaño do grupo de estudantes sobre o que se fai a busca en relación co total de informantes do LDG que, lembremos, é de 800. A información sobre o tamaño do grupo seleccionado obtense a partir dos resultados que ofrece a aplicación. Por exemplo, se buscamos calquera forma (por exemplo, o lema donicela) seleccionando as/os informantes que teñen o galego como lingua inicial, a aplicación infórmanos do tamaño deste grupo: entre as/os informantes do LDG hai 228 que declararon ter o galego como lingua inicial (Imaxe 9). Se combinamos lingua inicial galego con nivel sociocultural baixo, vemos que o grupo se reduce a 116 (Imaxe 10).

Imaxe 9. Información sobre o tamaño do grupo de estudantes que teñen o galego como L1

Imaxe 10. Información sobre o tamaño do grupo de estudantes que teñen o galego como L1 e que pertencen ao nivel sociocultural baixo

A porcentaxe de respostas (neste caso do lema donicela) determínase dentro do grupo seleccionado: 6 estudantes, o 2,63% daqueles que declararon ter o galego como lingua inicial, escribiron no bloque "Os animais" unha variante lematizada baixo donicela, entre o grupo de estudantes con lingua inicial galego e nivel sociocultural baixo, a porcentaxe sobe ao 3,45% (4 estudantes). Por suposto, non debe deducirse deste feito que as/os restantes informantes do grupo (respectivamente 222 e 112) escribiron algún outro sinónimo galego designador do mustélido ou a forma en español. A maior parte simplemente non introduciu o concepto no centro de interese en cuestión.