# Nombre de Propuesta Descripción Directores de tesis
1.- Reconocimiento de voz para frases acotadas en español. Aquí se trabajará en habla continua, hay que crear los corpus, y hacer el diseño y validación de los algoritmos. Los resultados se podrán utilizar para el Náhuatl.
Las frases acotadas significan que la información a reconocer está previamente elaborada y entrenada en el sistema. De ocurrir una frase fuera del contexto que se entrena, la respuesta del sistema puede ser: 'No entiendo, repita la frase'.

Dr. Sergio Suárez y Dr. José Luis Oropeza Rodríguez.

2.- Reconocimiento de voz para frases acotadas en español utilizando la red telefónica. Aquí se trabajará en habla continua, hay que crear los corpus, y hacer el diseño y validación de los algoritmos. Los resultados se podrán utilizar para el Náhuatl.
Las frases acotadas significan que la información a reconocer está previamente elaborada y entrenada en el sistema. De ocurrir una frase fuera del contexto que se entrena, la respuesta del sistema puede ser: 'No entiendo, repita la frase'.
Dr. Sergio Suárez y Dr. José Luis Oropeza Rodríguez.
3.- Sintetizador de voz emotiva. Se pretende diseñar y realizar un sintetizador de voz que realice la lectura de un texto en español y le incorpore a la emisión de voz la emoción que se señale en el texto indicado, además de las expresiones señaladas por los signos de interrogación y admiración que son cotidianos en los textos. El sintetizador a utilizar será del tipo PSOLA en primera instancia.
La teoría de 'texto emotivo' es el resultado de la tesis del alumno de Doctorado Ismael Díaz Rangel.
Los resultados alcanzados en esta tesis podrán ser utilizados en otras aplicaciones de órdenes mediante comandos verbales y respuesta en diferentes aplicaciones, incluyendo las telefónicas.
Dr. Sergio Suárez y Dr. José Luis Oropeza Rodríguez.
4.- Separación e identificación de locutores en una conversación. Se pretende estudiar, diseñar y realizar una aplicación que a partir de voz mezclada y usando un solo micrófono, pueda separar e identificar el (los) locutor(es) que está(n) hablando, inicialmente dos. Las características que identifican a cada locutor (persona) son un conjunto discriminatorio que las define, aunque el porciento de identificación disminuye en la medida que la población crece. Es por ello que este estudio parte de separar al menos dos personas y plantear como extender el problema de separación y seguimiento a más de dos locutores.
Los resultados alcanzados en esta tesis podrán ser utilizados en otras aplicaciones para seguridad de acceso y respuesta en diferentes aplicaciones, incluyendo las telefónicas.
Dr. Sergio Suárez y Dr. José Luis Oropeza Rodríguez.
5.- Reconocimiento de voz multi locutor por elección de semejanza en las características del habla.
(Doctorado)
Se pretende estudiar y proponer un método que permita el reconocimiento de voz para múltiples locutores a partir de un conjunto mínimo de corpus de voces de locutores seleccionados. La idea es que se caractericen los diferentes locutores que intervienen en el entrenamiento de reconocimiento de voz del sistema multi locutor. Se realice la prueba de reconocimiento general y la individual de los diferentes locutores. Al hablar un locutor del grupo, este se reconoce y el sistema personaliza el reconocimiento de voz del que está hablando y procede al reconocimiento de voz según el conjunto de parámetros característicos del mismo. Al entrar a ser reconocida la voz de un locutor externo al grupo de entrenamiento, se extraen los parámetros característicos del locutor nuevo, se comparan con los de los locutores que intervinieron en el entrenamiento y se realiza el reconocimiento de voz personalizando el mismo como si fuera el locutor elegido por su semejanza en las características.
Los resultados alcanzados en esta tesis podrán ser utilizados en aplicaciones para seguridad de acceso y respuesta en diferentes aplicaciones, incluyendo las telefónicas.
Dr. Sergio Suárez y Dr. José Luis Oropeza Rodríguez.
6.- Reconocimiento del idioma hablado.
(Doctorado)
Se pretende estudiar y proponer un método que permita el reconocimiento del idioma en que se está hablando. Cada idioma tiene sus fonemas y concatena los mismos de forma diferente según las reglas de producción del mismo, así es posible que se utilicen: difonemas o sílabas según la estructura gramatical y léxica de cada idioma. Los resultados alcanzados en esta tesis podrán ser utilizados en aplicaciones para seguridad de acceso y respuesta en diferentes aplicaciones, incluyendo las telefónicas. Dr. Sergio Suárez y Dr. José Luis Oropeza Rodríguez.
7.- Modelo artificial de la cóclea humana mediante MEM's. Aquí se trabajará en la modelación y creación de un prototipo de resonadores sub bandas, según la respuesta caracterizada por el modelo de Bark. Como entrada de señal se utilizará un micro micrófono no polarizado que suministrará su salida al modelo sub bandas, este dará la respuesta de señal en la sub bandas correspondientes, las cuales coincidirán con las que reciben los nervios ciliares del sistema auditivo. Hay que crear el diseño y validación de los algoritmos. Los resultados se podrán utilizar como propuesta para implantes cocleares sin baterías. Dr. Sergio Suárez y Dr. José Luis Oropeza Rodríguez.