eRTH: Revista Electrónica en Tecnologías del Habla (ISSN 1695-9914)

1. Hacia la predicción de rendimiento en sistemas de reconocimiento de habla. J. Macías-Guarasa, J. Ferreiros y J.M. Pardo.

Grupo de Tecnología del Habla. Departamento de Ingeniería Electrónica Universidad Politécnica de Madrid. {macias,jfl,pardo}@die.upm.es - http://www-gth.die.upm.es

Palabras clave: complejidad de diccionarios, comparación de tareas, predicción de rendimiento

Abstract:

En este artículo, y en la línea de trabajo del diseño de sistemas que dicen ser “independientes del vocabulario”, presentamos algunas ideas relativas a mecanismos de evaluación a priori del comportamiento de sistemas de reconocimiento al enfrentarse a diccionarios de distinta composición. Nuestro estudio muestra cómo, para sistemas de reconocimiento de gran vocabulario y con enfoques arquitecturales y de modelado distintos (con guiado léxico explícito o sin él, sistemas integrados y no integrados, modelado dependiente e independiente del contexto), la longitud media de las palabras de un diccionario es determinante de la tasa de reconocimiento final alcanzable y puede servir de punto de partida para evaluar la complejidad de diccionarios y hacer predicciones sobre tasas esperables.

2. A Predictive Left-Corner Parser for Tree Adjoining Grammars. Vicente Carrillo and Víctor J. Díaz, Miguel A. Alonso.

Department of Computer Languages and Systems, University of Seville Avda. Reina Mercedes s/n, Seville, 41012 Spain, Department of Computation, University of Coruñaa Campus de Elvña, La Coruña, 15071 S. {carrillo,vjdiaz}@lsi.us.es alonso@dc.fi.udc.es

Palabras clave: parsing, left corner, tree adjoining grammar

Abstract:

Tree Adjoining Grammar (TAG) is a formalism that has become very popular for the description of natural languages. However, the parsers for TAG that have been defined on the basis of the Earley’s costs. In this article, we propose to extend the left corner relation from Context Free Grammar (CFG) to TAG in order to define an efficient left corner parser for TAG that improves the performance of the Earley-like parsers guaranteeing the valid prefix property, due to a remarkable reduction in the number of predictions operations with respect to Earley-like parsing algorithms.

3. Auditory identification and acoustic representation of the voiceless fricatives and affrricates. Sergio Feijóo, Santiago Fernández.

Depa. de Física Aplicada , Universidad de Santiago de Compostela.

Palabras clave:

Abstract:

4. Frecuencia de fonemas. Hernán Emilio Pérez.

Laboratorio de Fonética - Universidad de Concepción – Chile. Voicenet Speech - Chile. heperez@udec.cl

Palabras clave: Frecuencia de fonemas

Abstract:

En este artículo se exponen los resultados de un recuento de frecuencia de fonemas en un corpus oral de lectura de noticias en la televisión chilena. Además dichos resultados se comparan con cuatro investigaciones del mismo tipo realizadas para otros dialectos del español. El corpus está constituido por 15.649 palabras (3.281 diferentes), lo que equivale a un total de 75.269

5. Estudio de la influencia del desplazamiento de trama en parametrización para sistemas de reconocimie. Javier Ordóñez Vázquez y Javier Macías Guarasa.

Grupo de Tecnología del Habla. Dpto. Ingeniería Electrónica Universidad Politécnica de Madrid. {jordonezv, macias} @die.upm.es - http://www-gth.die.upm.es

Palabras clave: parametrización, desplazamiento de trama variable

Abstract:

En nuestro Grupo estamos trabajando en un amplio estudio y evaluación de las alternativas disponibles en la literatura al respecto de parametrización de habla con desplazamiento de trama variable. En este artículo se describen algunos experimentos iniciales en esta línea, que pretenden evaluar el efecto de utilizar distintos valores del desplazamiento de trama en parametrización con un amplio rango de condiciones de experimentación: distintos modelos acústicos, diferentes arquitecturas en cuanto al sistema de reconocimiento, etc., buscando propuestas de prometedoras variantes de la algorítmica al respecto

6. A Proposal of Algorithm for Solving Definite Descriptions through Dialogue Structure. Borja Navarro, Patricio Martínez-Barco and Rafael Muñoz.

Departamento de Lenguajes y Sistemas Informáticos. Universidad de Alicante, Campus de San Vicente, Alicante. fborja,patricio,rafaelg@dlsi.ua.es

Palabras clave: Resolución de la anáfora, discurso, estructura del texto.

Abstract:

En este trabajo proponemos un algoritmo para la resolución de las descripciones definidas en español a través de la estructura del diálogo, mediante la definición de un espacio de accesibilidad anafórico. Este algoritmo está basado en la hipótesis de que la resolución de la anáfora está relacionada con la estructura del diálogo. Así, la resolución de la anáfora mejora si se especifica un espacio de accesibilidad para cada tipo descripción definida según la estructura del diálogo. La utilización de este espacio de accesibilidad anafóico reduce tanto el tiempo de procesamiento como la posibilidad de obtener un antecedente erróneo. Además, la definición de este espacio de accesibilidad depende únicamente de la propia estructura textual del diálogo.

7. Aplicación del análisis ROC a la evaluación de la voz humana: Obtención de evaluadores fiables. M. Pelegrina, J.A. Adrián y M.J. Rodríguez-Parra.

Universidad de Málaga y Universidad de Granada.

Palabras clave: ROC, evaluación fiable

Abstract:

Este trabajo evalúa un conjunto de ítems que hace referencia a la calidad de la voz humana. Se aplican dos modelos: La evaluación de las características de la voz mediante la característica operativa del receptor (o análisis ROC) y la obtención de la fiabilidad de “jueces” (evaluadores múltiples). Como material objeto de la evaluación hemos utilizado un cuestionario para el diagnóstico de la voz (Casado y Adrián, 2002) que incorpora variables físicas, fisiológicas, psicológicas y lingüísticas. Estas variables (y sus correspondientes interacciones) se encuentran incluidas en los siguientes constructos teóricos: Fatiga vocal, tensión muscular, extensión vocal (o escala de la voz), higiene vocal, ansiedad (y estrés), antecedentes de riesgo, procesos anteriores ante una disfonía, factores subjetivos asociados y factores hormonales. Los datos obtenidos nos permiten obtener una muestra sistemática de evaluadores fiables y un material (o conjunto de ítems) que permitirán a su vez diagnosticar la calidad de la voz, prevenir y evitar daños y controlar la evolución de los pacientes. Una vez que hemos obtenido un modelo válido y fiable, sería conveniente aplicarlo para evaluar modelos artificiales de voz, mutatis mutandis, De hecho, dependiendo de los objetivos que pretendamos, esta metodología podría ser usada para llevar a cabo aproximaciones más claras a un modelo de funcionamiento de voz , formas o estilos de comunicación o cambios de actitudes del oyente.

Revista Electrónica en Tecnologías del Habla (ISSN 1695-9914)

Publicación electrónica de la Red temática en Tecnologías del Habla

Contenidos

12 / 07 / 2025

Novedades

Ya se dispone del primer número de la revista.

Para contactar con el webmaster. Fecha de actualización: 07/06/2006