logo sli

Termoteca - Banco de Datos Terminolóxico da Universidade de Vigo

Sobre a Termoteca


A Termoteca da Universidade de Vigo (https://ilg.usc.gal/termoteca/) está constituído por unha base de coñecementos terminolóxicos que se alicerza nun corpus textual de rexistros especializados do galego de máis de 30 millóns de palabras, formado polo Corpus Técnico do Galego (https://ilg.usc.gal/ctg/) e o Corpus Lingüístico da Universidade de Vigo (https://ilg.usc.gal/cluvi/).

A Termoteca tamén se pode consultar a través da plataforma RILG de Recursos Integrados da Lingua Galega (http://sli.uvigo.gal/RILG/) e está dispoñíbel tamén para descarga en formato SQL (http://sli.uvigo.gal/download/SLI_Termoteca/) e LMF (http://hdl.handle.net/10230/17104) a través da plataforma europea Meta-Share (http://metashare.elda.org/).

Os resultados das buscas efectuadas na Termoteca poden ser usados con fins educacionais e de investigación, sempre que se mencione a fonte. Para se referir á Termoteca como un todo, cite: Termoteca - Banco de Datos Terminolóxico da Universidade de Vigo - https://ilg.usc.gal/termoteca/.

Publicacións

Simões, Alberto e Xavier Gómez Guinovart (2019): Acquiring Domain-Specific Knowledge for WordNet from a Terminological Database. En Rodrigues, Ricardo, Jan Janousek, Luís Ferreira, Luísa Coheur, Fernando Batista e Hugo Gonçalo Oliveira (eds.). 8th Symposium on Languages, Applications and Technologies (SLATE 2019) (ISBN: 978-3-95977-114-6, ISSN: 2190-6807), Schloss Dagstuhl/Leibniz-Zentrum fuer Informatik, Dagstuhl, Germany, pp. 6:1-6:13. DOI: https://doi.org/10.4230/OASIcs.SLATE.2019.6

Gómez Guinovart, Xavier (2012): A Hybrid Corpus-Based Approach to Bilingual Terminology Extraction. En I. Moskowich-Spiegel Fandiño, B. Crespo (eds.). Encoding the Past, Decoding The Future: Corpora in the 21st Century. Cambridge Scholar Publishing: Newcastle upon Tyne, pp. 147-175 (ISBN 1-4438-3581-1).

Moreira, Adonay (2011): Turigal: compilation of a parallel corpus for bilingual terminology extraction. En Carrió, M. L. e Candel, M. A., Actas del III Congreso Internacional de Lingüística de Corpus. Las tecnologías de la información y las comunicaciones: presente y futuro en el análisis de corpus. Valencia: Universitat Politècnica de València, pp. 33-42.

Susana López Fernández, Xavier Gómez Guinovart, Xosé María Gómez Clemente e Ana Belén Crespo Bastos (2009): A avaliación da neoloxicidade en terminoloxía. En M. T. Cabré, O. Domènech, R. Estopà e J. Freixa (ed.). Actes de CINEO 2008: Actes del I Congrès Internacional de Neologia de les Llengües Romàniques. Universitat Pompeu Fabra, Barcelona.

Gómez Guinovart, Xavier e Alberto Simões (2009): Parallel corpus-based bilingual terminology extraction. En Proceedings of the 8th International Conference on Terminology and Artificial Intelligence, IRIT (Institut de recherche en Informatique de Toulouse), Université Paul Sabatier, Toulouse.

Simões, Alberto e Xavier Gómez Guinovart (2009): Terminology extraction from English-Portuguese and English-Galician parallel corpora based on probabilistic translation dictionaries and bilingual syntactic patterns. En António Teixeira, Miguel Sales Dias e Daniela Braga (eds.), Proceedings of the Iberian SLTech 2009 - I Joint SIG-IL/Microsoft Workshop on Speech and Language Technologies for Iberian Languages. Designeed, Porto Salvo (Portugal), pp. 13-16.

Gómez Guinovart, Xavier (2008): A investigación en lexicografía e terminoloxía no Corpus Lingüístico da Universidade de Vigo (CLUVI) e no Corpus Técnico do Galego (CTG). En González Seoane, Ernesto, Antón Santamarina e Xavier Varela Barreiro (eds.). A lexicografía galega moderna. Recursos e perspectivas. Santiago de Compostela: Consello da Cultura Galega / Instituto da Lingua Galega, pp. 197-216.

Crespo Bastos, Ana, Xosé María Gómez Clemente, Xavier Gómez Guinovart e Susana López Fernández (2008): XML-based Extraction of Terminological Information from Corpora. En José Carlos Ramalho, João Correia Lopes e Salvador Abreu (eds.). Actas da 6ª Conferência Nacional XATA2008. XML: Aplicações e Tecnologias Associadas. 14-15 Febreiro 2008, Universidade de Évora (Portugal), pp. 28-39.

Gómez Guinovart, Xavier and Ánxeles Torres Padín (2006): Extracción dun vocabulario xurídico-administrativo galego-castelán a partir dun corpus paralelo. En M. Teresa Cabré, Carme Bach e Jaume Martí (eds.). Terminología y derecho: la complejidad de la comunicación multilingüe, Universitat Pompeu Fabra (Institut Universitari de Lingüística Aplicada), Barcelona, pp. 175-188.

Como facer buscas

As buscas simples na Termoteca pódense facer doadamente escribindo na cela de busca a palabra ou secuencia de palabras que se queira consultar, e calcando despois no botón de "Vai". Pódese limitar a busca a unha área temática determinada, seleccionando o ámbito específico de consulta antes de calcar no botón de busca.

As buscas na Termoteca de expresións máis complexas pódense facer mediante as chamadas "expresións regulares" (POSIX 1003.2). As expresións regulares son secuencias de caracteres e símbolos que describen como é a cadea de texto buscada. Por exemplo: Os símbolos máis importantes que se poden utilizar para construír unha expresión regular de tipo POSIX 1003.2 son os seguintes:

Símbolos para caracteres

Símbolos de repetición



Inicio Corpus Técnico do Galego Corpus CLUVI Descargar


Seminario de Lingüística Informática - Grupo TALG, Universidade de Vigo, 2006-2018
Deseño e programación web: Xavier Gómez Guinovart