TECNOLOXÍAS E ANÁLISE DOS DATOS LINGÜÍSTICOS

Ver búsqueda de navegación

Navegación

Buscar

Logros no bienio 2014 - 2015

A) Enriquecemento de programas de noticias con contexto xeográfico en televisión interactiva. Grupos: COGRADE, CITIUS-USC: José Ramón Ríos Viqueira; GSI, CITIUS-USC: Manuel Lama Penín; TALG, UVIGO: Xavier Gómez Guinovart. Descrición dos traballos realizados. Pretendeuse adaptar ao galego dun sistema de enriquecemento de programas de noticias en televisión con contexto xeográfico deseñado e implementado polo grupo COGRADE.

B) Ferramentas para o estudo da prosodia. Grupos: FILGA, GTM e MODESTYA. Descrición dos traballos. Este proxecto deseñou dúas ferramentas principalmente: FOLERPA é un paquete de scripts en R para a análise dialectométrica da entoación. Así mesmo, a partir dunha colaboración co grupo GTM-UVIGO e grazas aos traballos que se desenvolveron para o proxecto CORILGA (vid. máis abaixo), desenvolveuse unha terceira ferramenta, útil tamén para a análise da entoación: SEA_Ap. (http://ilg.usc.es/FOLERPA/)

C) Análise estatístico e xeográfico da onomástica galega. Grupos. FILGA e MODESTYA. Descrición dos resultados. Esta colaboración quere analizar a isonimia no corpus de apelidos de Galicia e intentar descubrir padróns de distribucións xeográfica. A investigación fundaméntase nun corpus de apelidos extraído do padrón oficial de Galicia de 2011, facilitado polo IGE. O número total de apelidos diferentes en Galicia é 20.754, que se corresponde con 2.430.512 persoas dos 315 municipios. Consideramos unicamente os apelidos das persoas nacidas en Galicia.

D) CORILGA. Grupos. GTM-FILGA. A inteface foi deseñada por Óscar Otero. Descrición dos resultados. Durante o período obxecto deste informe, CORILGAexperimentou un importante avance. As principais innovacións realizadas neste período foron: Ampliación do corpus de gravacións transcritas ortograficamente; Realización de transcricións fonéticas de 40 horas de gravacións; Perfeccionamento e mellora dunha ferramenta de aliñamento de segmentos fónicos co arquivo de audio; Perfeccionamento e mellora dunha ferramenta de etiquetaxe morfosintáctica automática; Perfeccionamento e mellora dunha ferramenta de aliñamento de etiquetas morfosintácticas co arquivo de son; Mellora e desenvolvemento dunha plataforma web para o tratamento (aliñamento) e xestión de audios e de arquivos de transcrición en formato eaf, realizados co programa Elan; Mellora e desenvolvemento do buscador Corilga; Elaboración dun Manual de Uso do Corilga; Deseño gráfico do recurso Corilga; Preparación do corpus para a súa posta en rede con acceso público, prevista para antes da fin deste ano

E) CORILSE. Grupos. GRADES e GTM. Descrición dos resultados. O Corpus Informatizado de Lengua de Signos española (CORILSE) consiste nun conxunto de gravacións en vídeo que foron obtidas en diferentes momentos no contorno do grupo GRADES e que pertencen a diferentes xéneros discursivos. O desenvolvemento do repositorio informático e da interfaz web de CORILSE é froito da colaboración dos grupos GTM e GRADES no contorno da rede interuniversitaria TECANDALI. http://firewall.teleco.uvigo.es:56236/corilse. Incrementouse o corpus de vídeo con gravacións Creouse a interface de CORILSE para consultas externas, tanto por parte de usuarios expertos como para non expertos. Desenvolveuse ferramentas de recoñecemento automático dos compoñentes non manuais da LSE.

F) Plataforma de documentación e análise de datos dialectais perceptivos. Grupos: FILGA, COGRADE e MODESTYA. Descrición dos resultados. Desenvolvemento dunha ferramenta que permita obter información sobre as percepcións que os falantes teñen en relación coas diferentes variedades dialectais galegas e que, ademais, facilite a análise e interpretación dos datos recadados. Os informantes emitirán xuízos de valor a partir de estímulos sonoros e tratarán de indicar a súa procedencia xeográfica. A comparación destes datos cos da dialectoloxía tradicional permitirá avaliar en que medida os falantes poden identificar diferentes variedades xeográficas no noso territorio e ata que punto as análises lingüísticas coinciden cos xuízos dos falantes.

G) CIRCULEX. Grupos Colaboradores. GRADES e GSI Descrición dos traballos realizados. A colaboración entre GRADES e GSI ten como obxectivo a confección da interface Circulex para a análise automática de textos como redes. Nesta primeira colaboración implementáronse as ferramentas necesarias para: A análise da circulación de significados no textos. A análise da cohesión a través do estudio da centralidade das colocacións léxicas na rede http://tec.citius.usc.es/circulex