TECNOLOXÍAS E ANÁLISE DOS DATOS LINGÜÍSTICOS

Ver búsqueda de navegación

Navegación

Buscar

Logros no bienio 2012 - 2013

A) Simposio de Dialectoloxía Perceptiva, 17 e 18 de xaneiro, con participación de membros da Rede (Xulio Sousa, Elisa Fernández Rei, Rosa Crujeiras e Mª José Ginzo) e de investigadores estranxeiros (Albert Rilliard: LIMSI, CNRS, Francia; Antonio Romano: Università degli Studi di Torino, Italia; Lurdes de Castro Moutinho: Universidade de Aveiro) e españois (Victoria Marrero: UNED).

B) Colaboración GTM/FILGA: Desenvolvemento de ferramentas destinadas ó procesamento da linguaxe oral e ó desenvolvemento e explotación do Corpus Oral Informatizado da Lingua Galega (CORILGA). (http://firewall.teleco.uvigo.es:16101/corilga/. Elaborouse tamén a base de datos do proxecto CORILGA.

C) GSI. Descrición lingüística de datos. Aproximación encadrada no data mining, produción automatica de textos ou expresións lingüísticas nas que se recolla a información máis relevante implícita nun conxunto de datos, habitualmente numéricos.

D) GSI/TALG. Integración do Galnet nunha liña de investigación do GSI, consistente en desenvolver novos modelos para o razoamento aproximado con cuantificadores lingüísticos (siloxismo). Neste caso concreto estendeuse o modelo para permitir o proceso de razoamento entre proposicións cuantificadas nas que interveñen termos sinónimos (nunha liña innovadora non tratada ata o momento na bibliografía), dando lugar a un esquema de siloxismo aproximada. O uso directo do Galnet como fonte de sinonimia para a lingua galega permitiu definir graos de sinonimia entre termos lexicamente distintos pero semanticamente similares (aplicando métricas de distancia entre os synsets dos termos) e desta forma asignar un grao de confianza á conclusión do siloxismo.

E) Creación da ferramenta VisuGal de visualización para consultar os datos no Galnet. A navegación polo VisuGal adopta unha perspectiva conceptual: as buscas están guiadas polos significados das palabras. A visualización é en forma de grafo das relacións semánticas codificadas no Galnet (o WordNet do galego). Pode consultarse en http://tec.citius.usc.es/VISUGAL/

F) FILGA/MODESTYA/AMPER Port. Análise dialectométrica da prosodia galega (http://ilg.usc.es/amper/) e portuguesa (http://pfonetica.web.ua.pt/AMPER-POR.htm). Delimitación das áreas prosódicas dialectais do galego e do portugués, así como identificar zonas de Galicia e Portugal con entoacións próximas en termos de distancia prosódica. Os resultados da análise dialectométrica (baseada en técnicas estatísticas da análise multivariante) permitiron definir clústers de variedades segundo dita distancia prosódica e xerar un primeiro mapa das variedades prosódicas do galego e do portugués.

G) FILGA/MODESTYA. Aplicación exploratoria das técnicas estatísticas da FDA (Functional Data Analysis) para estudar os datos da prosodia galega desde o punto de vista funcional, é dicir, considerando que os datos (discretos) de frecuencia fundamental de cada frase corresponden a unha curva (continua) entoativa. Con este enfoque, realizouse unha análise descritiva e exploratoria dos datos mediante ferramentas da FDA.

H) FILGA/MODESTYA. Deseño dunha plataforma de produción e desenvolvemento de tests perceptivos (http://eio.usc.es/pub/testpercepcion/) que lle proporciona ó investigador unha ferramenta para desenvolver un experimento de tipo perceptivo en liña. Esta ferramenta achega a posibilidade de realizar estudos experimentais de alta calidade a investigadores sen coñecementos de programación, permitirá ademais proporcionar os resumos estatísticos.

I) FILGA/MODESTYA. A partir de datos do Atlas Lingüístico Galego deriváronse as análises estatísticas de dialectometría correlativa.

J) FILGA/MODESTYA. Análise da isonimia no corpus de apelidos de Galicia para descubrir padróns de distribucións xeográfica. A investigación fundaméntase nun corpus de apelidos extraído do padrón oficial de Galicia de 2011, facilitado polo IGE. O número total de apelidos diferentes en Galicia é 20.754, que se corresponde con 2.430.512 persoas dos 315 municipios. Consideramos unicamente os apelidos das persoas nacidas en Galicia.