Sesión oral I: Modelado acústico

Generalized gaussians for continuous observation distributions in speech recognition
Antonio Miguel, Eduardo Lleida, Alfonso Ortega

Graphical models for discrete observation distributions in speech recognition
Antonio Miguel, Eduardo Lleida, Alfonso Ortega

Overcoming HMM time and paramenter independence assumptions using augmented models for ASR
Marta Casar, José A.R. Fonollosa

Support vector regression in NIST SRE 2008 multichannel core task
Ismael Mateos, Daniel Ramos, Ignacio López-Moreno y Joaquin González-Rodríguez

Training a robust command recognizer with the tecnovoz database
José David Águas Lopes, Cláudio Neves, Arlindo Veiga, Alexandre Maciel, Carla Lopes, Luís Sá, Fernando Perdigão


Sesión de poster I

Acoustic Event Recognition for Low Cost Language Identification
Danilo Spada, Ignacio Lopez, Doroteo T. Toledano, Joaquín González-Rodríguez

Applying feature reduction analysis to a PPRLM-multiple gaussian language identification system
Juan Manuel Lucas Cuesta, Ricardo de Córdoba Herralde, Luis Fernando D’Haro Enríquez

Bio-inspired dynamic formant tracking for phonetic labelling
Pedro Gómez Vilda, José Manuel Ferrández Vicente, Victoria Rodellar Biarge, Rafael Martínez Olalla, Cristina Muñoz Mulas, Agustín Álvarez Marquina, Luis Miguel Mazaira Fernández

COMUNICA - plataforma para el desarrollo, distribución y evaluación de herramientas logopédicas asistidas por ordenador
Oscar Saz, W.-Ricardo Rodríguez, Eduardo Lleida, Carlos Vaquero, Antonio Escartín

Detección de cambios de toma con información de contenido visual y auditivo
Alejandro Abejon e Ismael Mateos

Feature selection vs. Feature transformation in reducing dimensionality for speaker recognition
Maider Zamalloa, Luis Javier Rodríquez Fuentes, Mikel Peñagarikano, Germán Bordel, Juan Pedro Uribe

N-gram Frequency Ranking with additional sources of information in a multiple-Gaussian classifier for Language Identification
Ricardo de Córdoba Herralde

PRE-LINGUA - Una herramienta de apoyo para el pre-lenguaje
William Ricardo Rodríguez Dueñas, Eduardo Lleida

Procedimiento para la medida y la modificación del jitter y del shimmer aplicado a la síntesis del habla expresiva
Carlos Monzo Sánchez, Ignasi Iriondo Sanz, Elisa Martínez Marroquín

T-NORM y desajuste léxico y acústico en reconocimiento de locutor dependiente de texto
Daniel Hernández López, Doroteo Torre Toledano, Cristina Esteve Elizalde, Joaquín González Rodríguez, Rubén Fernández Pozo y Luis Hernández Gómez

Turning Wikipedia into a resource for language research
Alberto Montero-Asenjo, Carlos A. Iglesias

Using pitch and formants for order adaptation of fractional fourier transform in speech signal processing
Hui Yin, Climent Nadeu, Volker Hohmann

iATROS: A speech and handwriting recognition system
Míriam Luján, Vicent Tamarit, Vicent Alabau, Carlos-D. Martínez-Hinarejos, Moisés Pastor, Alberto Sanchis, Alejandro Toselli

Valoración del cierre neo-glótico en voz esofágica
Roberto Fernández-Baillo


Sesión especial 1 sobre la evaluación ALBAYZIN 08

Adaptación del CTH-URL para la competición ALBAYZIN 2008
Carlos Monzo, Lluís Formiga, Jordi Adell, Ignasi Iriondo, Francesc Alías y Joan Claudi Socoró

ATVS-UAM ALBAYZIN-VL08 system description
Doroteo T. Toledano, Ismael Mateos-Garcia, Alejandro Abejon-Gonzalez, Daniel Ramos, Juan Bonillo and Joaquin González-Rodríguez

Descripción de los sistemas presentados por IXA-EHU a la evaluación ALBAYCIN’08
Gorka Labaka, Arantza Díaz de Ilarraza, Kepa Sarasola

Descripción del conversor de texto a voz AHOTTS presentado a la evaluación ALBAYZIN TTS 2008
Iñaki Sainz, Inma Hernáez, Eva Navas, Jon Sanchez, Iker Luengo, Ibon Saratxaga, Igor Odriozola, Eneritz de Bilbao, Daniel Erro

Descripción del sintetizador de voz COTOVÍA para la evaluación ALBAYZIN TTS 2008
Eduardo R. Banga, Francisco Méndez, Francisco Campillo, Gonzalo Iglesias, Laura Docío

Descripción del sistema I de Telefónica I+D presentado a la evaluación ALBAYZIN’08 para CTV
M. Á. Rodríguez, J. G. Escalada y A. Armenta

Descripción del sistema II de Telefónica I+D presentado a la evaluación ALBAYZIN’08 para CTV
J. G. Escalada, A. Armenta y M. Á. Rodríguez

El sistema de identificación de la lengua de PRHLT
Míriam Luján-Mares, Vicent Tamarit, Roberto Paredes, Vicent Alabau, Carlos-D. Martínez-Hinarejos

Evaluación ALBAYZÍN-08 de sistemas de verificación de la lengua: sistema del grupo Softlab de la UC3M
M.J. Poza, B. Ruiz, L. Puente y D. Carrero

Generación de una voz sintética en castellano basada en HSMM para la evaluación ALBAYZÍN 2008: Conversión texto a voz
R. Barra-Chicote, J. Yamagishi, J. M. Montero, S. King, S. Lufti, J. Macias-Guarasa

Phrase segments obtained with stochastic inversion transduction grammars for spanish-basque translation
Germán Sanchis-Trilles, Joan Andreu Sánchez

The AVIVAVOZ phrase-based statistical machine translation system for ALBAYZIN 2008
Carlos A. Henríquez Q., Maxim Khalilov, José B. Mariño, Nerea Ezeiza

The CEREVOICE speech synthesiser
Juan María Garrido Almiñana, Juan María Garrido, Eva Bofias, Yesika Laplaza, Montserrat Marquina Matthew Aylett, Chris Pidcock

The UPC TTS system description
Antonio Bonafonte, Pablo Daniel Agüero

The L2F language verification systems for ALBAYZIN-08 evaluation
Alberto Abad and Isabel Trancoso


Sesión oral 2: Síntesis del habla

Bayes Optimal Classification for Corpus-Based Unit Selection in TTS Synthesis
Hamurabi Gamboa Rosales

Flexible harmonic/stochasticmodeling for HMM-based speech synthesis
Eleftherios Banos , Daniel Erro, Antonio Bonafonte, Asuncion Moreno

Further improvements to pronunciation by analogy
Tatyana Polyákova, Antonio Bonafonte

Modelo de síntesis de habla con disfluencias basado en modificaciones locales sobre frases constituyentes
Jordi Adell, David Escudero-Mancebo, Antonio Bonafonte

Nuevo módulo de análisis prosódico del conversor texto-voz multilingüe de Telefónica I+D
Miguel Ángel Rodríguez Crespo, José Gregorio Escalada Sardina, Ana Armenta López de Vicuña, Juan María Garrido Almiñana


Sesión de poster 2

Adquisición de un corpus de diálogos para un dominio de reservas de instalaciones deportivas
E. Segarra, M.J. Castro, I. Galiano, F. García, J. A. Gómez, D. Griol, L.F. Hurtado, E. Sanchis, F. Torres, F. Zamora

Adquisición y evaluación de un corpus de diálogos mediante una técnica de generación automática de diálogos
David Griol, Lluís F. Hurtado, Emilio Sanchis, Encarna Segarra

Arquitectura distrubuida para el desarrollo de sistemas de diálogo hablado, edecán
José Enrique García Lainez, Alfonso Ortega Giménez, Antonio Miguel Artiaga, Eduardo Lleida Solano

Arquitectura multimodal controlada por voz: revisión de metáforas de interacción
David Escudero-Mancebo, Héctor Olmedo-Rodríguez, Valentín Cardeñoso-Payo

Automatic word stress marker for portuguese TTS
Luis Pinto Coelho, Daniela Braga

Dialog ACT labeling in the DIHANA corpus using prosody information
Vicent Tamarit Ballester, Carlos-D. Martínez-Hinarejos

Evaluación de campo de un sistema de diálogo oral empleando relaciones estadísticas
Zoraida Callejas Carrión, Ramón López-Cózar Delgado

Evaluación subjetiva de una base de datos de habla emocional para euskara
Iñaki Sainz, Ibon Saratxaga, Eva Navas, Inmaculada Hernáez, Jon Sanchez, Iker Luengo, Igor Odriozola, Eneritz de Bilbao

Grabación de una base de datos bilingüe euskera/castellano para verificación de locutor
Iker Luengo, Eva Navas, Iñaki Sainz, Ibon Saratxaga, Jon Sánchez, Igor Odriozola, Juan José Igarza, Inmaculada Hernáez

Intelligibility of accented speech: the perception of word-final nasals by dutch and brazilians
Denise C. Kluge, Mara S. Reis, Denize Nobre-Oliveira, Andreia S. Rauber

Nueva técnica de post-corrección de errores de RAH para sistemas de diálogo oral
Ramón López-Cózar, Zoraida Callejas

Transcripción fonética en un entorno plurilingüe
Tatyana Polyákova, Antonio Bonafonte

Voice pleasantness: on the improvement of TTS voice quality
Luis Pinto Coelho, Daniela Braga, Carmen Garcia-Mateo8


Sesión proyectos/demos

A system architecture for multilingual spoken document retrieval
German Bordel, Arantza Casillas, Mikel Penagarikano, Luis Javier Rodríguez, Amparo Varona

Anhitz, development and integration of language, speech and visual technologies for Basque
Kutz Arrieta, Arantza Diaz de Ilarraza, Inma Hernáez, Urtza Iturraspe, Igor Leturia, Eva Navas, Kepa Sarasola

Arquitectura distribuida para un sistema de traducción del habla sobre la plataforma UIMA
Marc Poch, David Cuestas, José B. Mariño, Francisco Méndez, Iñaki Sainz

Computer-assisted handwritten text transcription using speech recognition
Antonio-L. Lagarda, Vicent Alabau, Carlos-D. Martínez-Hinarejos, Alejandro-H. Toselli, Verónica Romero, José-R. Navarro and Enrique Vidal

SAUTRELA: Un entorno de desarrollo versátil para las tecnologías del habla
Mikel Peñagarikano, German Bordel, Sonia Bilbao, Maider Zamalloa, Luis Javier Rodriguez

Servicio de Páginas Amarillas utilizando reconocimiento distribuido de voz
José A. González, Ángel M. Gómez, José L. Carmona y Antonio M. Peinado

Sistema de reconocimiento automático del habla distribuido aplicado a entornos logísticos
José Enrique García Laínez, Alfonso Ortega Giménez, Antonio Miguel Artiaga, Eduardo Lleida Solano


Sesión oral 3: Reconocimiento del habla

A two-level architecture plus confidence measures for a keyword spotting system
Javier Tejedor, Simon King, Joe Frankel, Dong Wang, José Colás y Javier Garrido

Cuantificación vectorial diferencial para la transmisión eficiente de parámetros acústicos en sistemas de reconocimiento automático del habla distribuido
José Enrique García Laínez, Alfonso Ortega Giménez, Antonio Miguel Artiaga, Eduardo Lleida Solano

Improved unsupervised speech recognition system using MLLR speaker adaptation and confidence measurement
Mukund Jha,Sourabh Sriom, Míriam Luján, Carlos D. Martínez-Hinarejos,Alberto Sanchís

New features for improving VAD when dealing with far-field and multi-speaker speech
Óscar Varela Serrano, Rubén San-Segundo Hernández, Luis Alfonso Hernández Gómez

SVM based posterior probabilities for syllable confidence annotation
Daniel Bolanos, Wayne Ward, Javier Tejedor


Sesión oral 4: Traducción automática

Deriving benefit from a generalized syntax-based reordering
Maxim Khalilov, José Adrián Rodríguez Fonollosa

Incorporación de información sintáctico-semántica en la traducción de voz a lengua de signos
B. Gallo, R. San-Segundo, J.M. Lucas, R. Barra, F. Fernández, L.F. D’Haro

N-II: Traductor automático estadístico basado en ngramas
Marta R. Costa-jussà, Mireia Farrús, Marc Poch, Adolfo Hernández y José B. Mariño

Statistical methods for speech technologies in basque language
M. Inés Torres, Víctor Guijarrubia, Raquel Justo, Alicia Pérez, Francisco Casacuberta

Técnicas estadísticas para el filtrado de un corpus bilingüe en traducción automática
Enrique Montolar, Marta R. Costa-jussà y José A. R. Fonollosa


Conferencias invitadas

Voice conversion: State of the art and perspectives
Yannis Styilianou

Embodied conversational agents in verbal and non-verbal communication
Björn Granstrom

Aplicaciones de las tecnologías del habla en sistemas CALL y CAPT
Néstor Becerra Yoma

Third-generation conversational interfaces
Giuseppe Riccardi

menu