Sesión oral I: Modelado acústico
Generalized gaussians for continuous observation
distributions in speech recognition
Antonio Miguel, Eduardo Lleida, Alfonso Ortega
Graphical models for discrete observation distributions in
speech recognition
Antonio Miguel, Eduardo Lleida, Alfonso Ortega
Overcoming HMM time and paramenter independence assumptions
using augmented models for ASR
Marta Casar, José A.R. Fonollosa
Support vector regression in NIST SRE 2008 multichannel core
task
Ismael Mateos, Daniel Ramos, Ignacio López-Moreno y Joaquin
González-Rodríguez
Training a robust command recognizer with the tecnovoz
database
José David Águas Lopes, Cláudio Neves, Arlindo Veiga,
Alexandre Maciel, Carla Lopes, Luís Sá, Fernando Perdigão
Sesión de poster I
Acoustic Event Recognition for Low Cost Language
Identification
Danilo Spada, Ignacio Lopez, Doroteo T. Toledano, Joaquín
González-Rodríguez
Applying feature reduction analysis to a PPRLM-multiple
gaussian language identification system
Juan Manuel Lucas Cuesta, Ricardo de Córdoba Herralde, Luis
Fernando D’Haro Enríquez
Bio-inspired dynamic formant tracking for phonetic labelling
Pedro Gómez Vilda, José Manuel Ferrández Vicente, Victoria
Rodellar Biarge, Rafael Martínez Olalla, Cristina Muñoz Mulas, Agustín Álvarez
Marquina, Luis Miguel Mazaira Fernández
COMUNICA - plataforma para el desarrollo, distribución y
evaluación de herramientas logopédicas asistidas por ordenador
Oscar Saz, W.-Ricardo Rodríguez, Eduardo Lleida, Carlos
Vaquero, Antonio Escartín
Detección de cambios de toma con información de contenido
visual y auditivo
Alejandro Abejon e Ismael Mateos
Feature selection vs. Feature transformation in reducing
dimensionality for speaker recognition
Maider Zamalloa, Luis Javier Rodríquez Fuentes, Mikel
Peñagarikano, Germán Bordel, Juan Pedro Uribe
N-gram Frequency Ranking with additional sources of
information in a multiple-Gaussian classifier for Language Identification
Ricardo de Córdoba Herralde
PRE-LINGUA - Una herramienta de apoyo para el pre-lenguaje
William Ricardo Rodríguez Dueñas, Eduardo Lleida
Procedimiento para la medida y la modificación del jitter y
del shimmer aplicado a la síntesis del habla expresiva
Carlos Monzo Sánchez, Ignasi Iriondo Sanz, Elisa Martínez
Marroquín
T-NORM y desajuste léxico y acústico en reconocimiento de
locutor dependiente de texto
Daniel Hernández López, Doroteo Torre Toledano, Cristina
Esteve Elizalde, Joaquín González Rodríguez, Rubén Fernández Pozo y Luis
Hernández Gómez
Turning Wikipedia into a resource for language research
Alberto Montero-Asenjo, Carlos A. Iglesias
Using pitch and formants for order adaptation of fractional
fourier transform in speech signal processing
Hui Yin, Climent Nadeu, Volker Hohmann
iATROS: A speech and handwriting recognition system
Míriam Luján, Vicent Tamarit, Vicent Alabau, Carlos-D.
Martínez-Hinarejos, Moisés Pastor, Alberto Sanchis, Alejandro Toselli
Valoración del cierre neo-glótico en voz esofágica
Roberto Fernández-Baillo
Sesión especial 1 sobre la evaluación ALBAYZIN 08
Adaptación del CTH-URL para la competición ALBAYZIN 2008
Carlos Monzo, Lluís Formiga, Jordi Adell, Ignasi Iriondo,
Francesc Alías y Joan Claudi Socoró
ATVS-UAM ALBAYZIN-VL08 system description
Doroteo T. Toledano, Ismael Mateos-Garcia, Alejandro
Abejon-Gonzalez, Daniel Ramos, Juan Bonillo and Joaquin González-Rodríguez
Descripción de los sistemas presentados por IXA-EHU a la
evaluación ALBAYCIN’08
Gorka Labaka, Arantza Díaz de Ilarraza, Kepa Sarasola
Descripción del conversor de texto a voz AHOTTS presentado a
la evaluación ALBAYZIN TTS 2008
Iñaki Sainz, Inma Hernáez, Eva Navas, Jon Sanchez, Iker
Luengo, Ibon Saratxaga, Igor Odriozola, Eneritz de Bilbao, Daniel Erro
Descripción del sintetizador de voz COTOVÍA para la
evaluación ALBAYZIN TTS 2008
Eduardo R. Banga, Francisco Méndez, Francisco Campillo,
Gonzalo Iglesias, Laura Docío
Descripción del sistema I de Telefónica I+D presentado a la
evaluación ALBAYZIN’08 para CTV
M. Á. Rodríguez, J. G. Escalada y A. Armenta
Descripción del sistema II de Telefónica I+D presentado a la
evaluación ALBAYZIN’08 para CTV
J. G. Escalada, A. Armenta y M. Á. Rodríguez
El sistema de identificación de la lengua de PRHLT
Míriam Luján-Mares, Vicent Tamarit, Roberto Paredes, Vicent
Alabau, Carlos-D. Martínez-Hinarejos
Evaluación ALBAYZÍN-08 de sistemas de verificación de la
lengua: sistema del grupo Softlab de la UC3M
M.J. Poza, B. Ruiz, L. Puente y D. Carrero
Generación de una voz sintética en castellano basada en HSMM
para la evaluación ALBAYZÍN 2008: Conversión texto a voz
R. Barra-Chicote, J. Yamagishi, J. M. Montero, S. King, S.
Lufti, J. Macias-Guarasa
Phrase segments obtained with stochastic inversion
transduction grammars for spanish-basque translation
Germán Sanchis-Trilles, Joan Andreu Sánchez
The AVIVAVOZ phrase-based statistical machine translation
system for ALBAYZIN 2008
Carlos A. Henríquez Q., Maxim Khalilov, José B. Mariño,
Nerea Ezeiza
The CEREVOICE speech synthesiser
Juan María Garrido Almiñana, Juan María Garrido, Eva Bofias,
Yesika Laplaza, Montserrat Marquina Matthew Aylett, Chris Pidcock
The UPC TTS system description
Antonio Bonafonte, Pablo Daniel Agüero
The L2F language verification systems for ALBAYZIN-08
evaluation
Alberto Abad and Isabel Trancoso
Sesión oral 2: Síntesis del habla
Bayes Optimal Classification for Corpus-Based Unit Selection
in TTS Synthesis
Hamurabi Gamboa Rosales
Flexible harmonic/stochasticmodeling for HMM-based speech
synthesis
Eleftherios Banos , Daniel Erro, Antonio Bonafonte, Asuncion
Moreno
Further improvements to pronunciation by analogy
Tatyana Polyákova, Antonio Bonafonte
Modelo de síntesis de habla con disfluencias basado en
modificaciones locales sobre frases constituyentes
Jordi Adell, David Escudero-Mancebo, Antonio Bonafonte
Nuevo módulo de análisis prosódico del conversor texto-voz multilingüe
de Telefónica I+D
Miguel Ángel Rodríguez Crespo, José Gregorio Escalada
Sardina, Ana Armenta López de Vicuña, Juan María Garrido Almiñana
Sesión de poster 2
Adquisición de un corpus de diálogos para un dominio de
reservas de instalaciones deportivas
E. Segarra, M.J. Castro, I. Galiano, F. García, J. A. Gómez,
D. Griol, L.F. Hurtado, E. Sanchis, F. Torres, F. Zamora
Adquisición y evaluación de un corpus de diálogos mediante
una técnica de generación automática de diálogos
David Griol, Lluís F. Hurtado, Emilio Sanchis, Encarna
Segarra
Arquitectura distrubuida para el desarrollo de sistemas de
diálogo hablado, edecán
José Enrique García Lainez, Alfonso Ortega Giménez, Antonio
Miguel Artiaga, Eduardo Lleida Solano
Arquitectura multimodal controlada por voz: revisión de
metáforas de interacción
David Escudero-Mancebo, Héctor Olmedo-Rodríguez, Valentín
Cardeñoso-Payo
Automatic word stress marker for portuguese TTS
Luis Pinto Coelho, Daniela Braga
Dialog ACT labeling in the DIHANA corpus using prosody
information
Vicent Tamarit Ballester, Carlos-D. Martínez-Hinarejos
Evaluación de campo de un sistema de diálogo oral empleando
relaciones estadísticas
Zoraida Callejas Carrión, Ramón López-Cózar Delgado
Evaluación subjetiva de una base de datos de habla emocional
para euskara
Iñaki Sainz, Ibon Saratxaga, Eva Navas, Inmaculada Hernáez,
Jon Sanchez, Iker Luengo, Igor Odriozola, Eneritz de Bilbao
Grabación de una base de datos bilingüe euskera/castellano
para verificación de locutor
Iker Luengo, Eva Navas, Iñaki Sainz, Ibon Saratxaga, Jon
Sánchez, Igor Odriozola, Juan José Igarza, Inmaculada Hernáez
Intelligibility of accented speech: the perception of
word-final nasals by dutch and brazilians
Denise C. Kluge, Mara S. Reis, Denize Nobre-Oliveira,
Andreia S. Rauber
Nueva técnica de post-corrección de errores de RAH para
sistemas de diálogo oral
Ramón López-Cózar, Zoraida Callejas
Transcripción fonética en un entorno plurilingüe
Tatyana Polyákova, Antonio Bonafonte
Voice pleasantness: on the improvement of TTS voice quality
Luis Pinto Coelho, Daniela Braga, Carmen Garcia-Mateo8
Sesión proyectos/demos
A system architecture for multilingual spoken document
retrieval
German Bordel, Arantza Casillas, Mikel Penagarikano, Luis
Javier Rodríguez, Amparo Varona
Anhitz, development and integration of language, speech and
visual technologies for Basque
Kutz Arrieta, Arantza Diaz de Ilarraza, Inma Hernáez, Urtza
Iturraspe, Igor Leturia, Eva Navas, Kepa Sarasola
Arquitectura distribuida para un sistema de traducción del
habla sobre la plataforma UIMA
Marc Poch, David Cuestas, José B. Mariño, Francisco Méndez, Iñaki Sainz
Computer-assisted handwritten text transcription using
speech recognition
Antonio-L. Lagarda, Vicent Alabau, Carlos-D. Martínez-Hinarejos,
Alejandro-H. Toselli, Verónica Romero, José-R. Navarro and Enrique Vidal
SAUTRELA: Un entorno de desarrollo versátil para las
tecnologías del habla
Mikel Peñagarikano, German Bordel, Sonia Bilbao, Maider
Zamalloa, Luis Javier Rodriguez
Servicio de Páginas Amarillas utilizando reconocimiento
distribuido de voz
José A. González, Ángel M. Gómez, José L. Carmona y Antonio
M. Peinado
Sistema de reconocimiento automático del habla distribuido
aplicado a entornos logísticos
José Enrique García Laínez, Alfonso Ortega Giménez, Antonio
Miguel Artiaga, Eduardo Lleida Solano
Sesión oral 3: Reconocimiento del habla
A two-level architecture plus confidence measures for a
keyword spotting system
Javier Tejedor, Simon King, Joe Frankel, Dong Wang, José
Colás y Javier Garrido
Cuantificación vectorial diferencial para la transmisión
eficiente de parámetros acústicos en sistemas de reconocimiento automático del
habla distribuido
José Enrique García Laínez, Alfonso Ortega Giménez, Antonio
Miguel Artiaga, Eduardo Lleida Solano
Improved unsupervised speech recognition system using MLLR
speaker adaptation and confidence measurement
Mukund Jha,Sourabh Sriom, Míriam Luján, Carlos D.
Martínez-Hinarejos,Alberto Sanchís
New features for improving VAD when dealing with far-field and
multi-speaker speech
Óscar Varela Serrano, Rubén San-Segundo Hernández, Luis
Alfonso Hernández Gómez
SVM based posterior probabilities for syllable confidence
annotation
Daniel Bolanos, Wayne Ward, Javier Tejedor
Sesión oral 4: Traducción automática
Deriving benefit from a generalized syntax-based reordering
Maxim Khalilov, José Adrián Rodríguez Fonollosa
Incorporación de información sintáctico-semántica en la
traducción de voz a lengua de signos
B. Gallo, R. San-Segundo, J.M. Lucas, R. Barra, F. Fernández,
L.F. D’Haro
N-II: Traductor automático estadístico basado en ngramas
Marta R. Costa-jussà, Mireia Farrús, Marc Poch, Adolfo
Hernández y José B. Mariño
Statistical methods for speech technologies in basque
language
M. Inés Torres, Víctor Guijarrubia, Raquel Justo, Alicia
Pérez, Francisco Casacuberta
Técnicas estadísticas para el filtrado de un corpus bilingüe
en traducción automática
Enrique Montolar, Marta R. Costa-jussà y José A. R.
Fonollosa
Conferencias invitadas
Voice conversion: State of the art and perspectives
Yannis Styilianou
Embodied conversational agents in verbal and non-verbal
communication
Björn Granstrom
Aplicaciones de las tecnologías del habla en sistemas CALL y
CAPT
Néstor Becerra Yoma
Third-generation conversational interfaces
Giuseppe Riccardi