Por favor, use este identificador para citar o enlazar este ítem:
https://ri-ng.uaq.mx/handle/123456789/3799
Título : | "Sistema de reconocimiento del Lenguaje de Señas Mexicano basado en una cámara RGB-D y aprendizaje automático " |
Autor(es): | Kenneth Mejía Pérez |
Palabras clave: | LSM Clasificación Redes neuronales Cámara RGB-D |
Área: | INGENIERÍA Y TECNOLOGÍA |
Fecha de publicación : | 1-sep-2022 |
Facultad: | Facultad de Informática |
Programa académico: | Maestría en Ciencias de la Computación |
Resumen: | "El reconocimiento automático de la lengua de señas es una tarea compleja en el área de visión por computadora y aprendizaje automático. La mayoría de los trabajos que se encuentran en la literatura se han centrado en reconocer la lengua de señas usando solo gestos con las manos. Sin embargo, el movimiento del cuerpo y los gestos faciales juegan un papel esencial en la interacción de la lengua de señas. Teniendo esto en cuenta, en este proyecto de investigación se desarrolló un sistema de reconocimiento de la lengua de señas basado en la detección de puntos característicos de las manos, el cuerpo y la cara que se emplean al realizar una seña. Para la adquisición de las señas se utilizó una cámara de profundidad con el propósito de obtener las coordenadas 3D que caracterizan cada seña, capturando un total de 3000 secuencias de datos que corresponden a 30 señas estáticas y dinámicas de la Lengua de Señas Mexicana. Para la clasificación automática del conjunto de señas, se evaluaron tres arquitecturas diferentes que permiten el tratamiento de secuencias temporales: la red neuronal recurrente (RNN, por sus siglas en inglés), la memoria a corto y largo plazo (LSTM, por sus siglas en inglés) y la unidad recurrente cerrada (GRU, por sus siglas en inglés). Para evaluar el rendimiento de cada clasificador se calculó la precisión, la recuperación y la exactitud. Al finalizar la etapa de experimentación y validación de resultados, se puede concluir que la memoria a corto plazo (LSTM) funcionó mejor con entradas ruidosas y la unidad recurrente cerrada (GRU) funcionó mejor sin entradas ruidosas y con menos parámetros entrenables." |
URI: | http://ri-ng.uaq.mx/handle/123456789/3799 |
Aparece en: | Maestría en Ciencias de la Computación |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
RI006822.pdf | 2.59 MB | Adobe PDF | Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.