Que é o Corpus CLUVI?
O Corpus CLUVI (ISLRN: 910-993-402-072-9) é unha colección aberta de corpus paralelos anotados manualmente coas equivalencias de tradución a nivel de frase, elaborado polo SLI da Universidade de Vigo, deseñado orixinalmente para documentar diferentes tipos de traducción entre o galego contemporáneo e outras linguas. Con ao redor de 49 millóns de palabras, a colección de traducións integrantes do CLUVI está repartida actualmente en vinte e tres corpus paralelos pertencentes a nove rexistros ou dominios especializados (ficción, informática, divulgación científica, textos bíblicos, dereito e administración pública, información ao consumo, economía, turismo e subtitulación) e distintas combinacións lingüísticas co galego, español, inglés, francés, portugués do Brasil, portugués de Portugal, catalán, italiano, éuscaro, alemán, latín, chinés simplificado e chinés tradicional.
Arestora, o CLUVI é o corpus paralelo que contén o maior número e o máis amplo abano temático de traducións do/ao galego. Os textos en galego incluídos na colección do CLUVI totalizan preto de 12 millóns de palabras, o que representa unha cuarta parte do total das palabras recollidas no corpus para todas as linguas e dominios de tradución.
Desde setembro de 2003, o SLI ofrece a posibilidade de realizar consultas en liña aos corpus paralelos recompilados no CLUVI no enderezo web http://sli.uvigo.gal/CLUVI/. A nosa aplicación de consulta permite buscas simples ou complexas de palabras illadas ou de secuencias de palabras, e amosa como resultado as equivalencias interlingüísticas dos termos achados no seu contexto oracional, tal como aparecen nas traducións reais documentadas no corpus. Cando a procura está constituída por un lema dunha lingua, os textos resultado da busca poden incluír mediante códigos de cores suxestións sobre as súas equivalencias léxicas nas distintas linguas da tradución.
Así mesmo, os corpus multimedia integrados no CLUVI (o corpus multimedia VEIGA de subtitulación de películas inglés-galego e o corpus audio-textual LITTERA de textos literarios inglés-español) permiten o acceso ás secuencias de vídeo ou fragmentos de son correspondentes ás traducións resultado da busca.
A causa dos dereitos de autoría, a aplicación nunca devolve máis de 1.500 resultados, coa intención de non exceder os límites do dereito á cita. Os termos buscados poden corresponder a calquera das linguas da tradución, sendo posible tamén realizar consultas autenticamente bilingües, isto é, consultas que conteñan simultaneamente un termo na lingua orixinal e outro na lingua de destino da tradución. Por outra banda, un dos meirandes corpus integrados no CLUVI, o Corpus LEGA de traducións xurídico-administrativas español-galego, duns 6 millóns de palabras, está dispoñíbel tamén para libre descarga en http://hdl.handle.net/10230/20051 con licenza aberta CC BY-NC-SA 3.0.
O número de obras aliñadas e os pares de linguas dispoñíbeis na páxina web aumentan con regularidade, xa que o CLUVI é un proxecto académico de investigación en curso de grande vitalidade.