• Imprimir
Grupo de Tecnoloxías Multimedia

 
IP: Carmen García Mateo
http://gtm.uvigo.es

Este equipo investigador da Universidade de Vigo (UVIGO) ten unha ampla e contrastada experiencia nas liñas de investigación de conversión texto-voz (TTS), recoñecemento automático de voz (ASR), adquisición de recursos lingüísticos nos idiomas galego e castelán, detección facial mediante procesado de imaxe, e busca en contidos multimedia. Nestes campos participou nun bo número de proxectos financiados a nivel europeo, estatal e autonómico, ademais de asinar diversos contratos con empresas. Como resultado, dispón dos seus propios algoritmos e ferramentas software, aspecto que permite a súa adaptación a un novo marco experimental nun prazo breve.

Desde 2007 o GTM está considerado pola Xunta de Galicia como “Grupo de referencia competitivo” e desde entón os seus membros publicaron, en liñas de traballo relacionadas con este proxecto, 30 artigos en revistas do JCR e mais de 60 comunicacións en congresos internacionais. Unha fracción significativa desta produción científica ten a súa orixe en colaboracións establecidas con outros grupos investigadores, institucións, consorcios e empresas. A nivel español cabe destacar a longa e estreita relación que o GTM mantén con grupos investigadores da UPC e EHU-UPV, co resto de grupos estatais afíns no marco da Red Temática en Tecnología del Habla (RTTH), ademais de con lingüistas no marco dun convenio co Centro Ramón Piñeiro para a Investigación en Humanidades, centro dependente da Xunta de Galicia. A nivel internacional cabe mencionar a colaboración con outras universidades e empresas europeas no marco da Acción COST IC1206 “De-Identification for Privacy Protection in Multimedia Content”. Ademais, o GTM participou activamente na rede de excelencia BioSecure- Biometrics for Secure Authentication; na actualidade participa na rede de excelencia META-NET (A Network of Excellence forging the Multilingual Europe Technology Alliance) e na Acción COST IC1106.

Entre os proxectos relacionados coas tecnoloxías da fala merecen mención especial os proxectos coordinados máis recentes “SpeechTech4All: Investigacion avanzada en tecnologías del habla para aplicación a entornos audiovisuales de interacción hombre-máquina inclusiva TEC38939-C03-01 e o vixente “Detección multimedia y multilingüe de información sobre personas – TraceThem” de referencia TEC2015-65345-P. Nestes dous proxectos o GTM, ademais de mellorar os seus sistemas de TTS e ASR, adquire experiencia en tradución automática estatística (SMT) e no último reforza a súas liñas de extracción de información dos falantes mediante procesado do audio e do video.

A transferencia tecnolóxica do GTM no campo do recoñecemento e síntese de voz está articulada a través de acordos de licencia dos seus recursos (bases de datos vocais, lingüísticas, etc.) e dalgunhas das tecnoloxías desenvoltas. Polo que se refire a recoñecemento facial, mantivéronse contratos con varias empresas do ámbito da seguridade e licenciouse un SDK de análise demográfica (con estimación de sexo e idade) a unha terceira empresa do ámbito da publicidade. En canto a organización de congresos e escolas de verán internacionais, o grupo foi o organizador do congreso FALA2010: VI Jornadas en Tecnología del Habla and II Iberian SLTech Workshop, a AERFAI Summer School 2012 on Pattern Recognition in Multimodal Human Interaction, e a “2013 RTTH Summer School on Speech Technology Evaluation”.
Todos os membros do GTM participantes nesta solicitude están directamente involucrados no programa de doutoramento da Universidade de Vigo “DocTIC: Tecnoloxias da Información e as Comunicacións” do que a profesora Carmen García Mateo é a coordinadora. Durante os últimos años defendéronse diversas teses de doutoramento dirixidas por membros del GTM en tecnoloxía da fala e recoñecemento biométrico.

Das actividades previamente descritas conclúese que o GTM dispón das ferramentas necesarias para o desenvolvemento do proxecto proposto e, ademais, tamén dispón dos contactos con grupos de investigación, centros tecnolóxicos e empresas necesarios para permitir a adquisición de posibles recursos adicionais.

Membros

Os investigadores do grupo que traballan en tecnoloxía da fala e participarán na rede son:

  • Carmen García Mateo (CAT-UN)
  • Eduardo Rodríguez Banga (TIT-UN)
  • José Luis Alba Castro (TIT-UN)
  • Antonio Cardenal López (PCD)
  • Laura Docío Fernández (PCD)
  • Paula López Gómez (Contrato posdoutoral)
  • Carmen Magariños Iglesias (Bolseira FPI)