Por favor, use este identificador para citar o enlazar este ítem: https://ri-ng.uaq.mx/handle/123456789/3799
Título : "Sistema de reconocimiento del Lenguaje de Señas Mexicano basado en una cámara RGB-D y aprendizaje automático "
Autor: Kenneth Mejía Pérez
Palabras clave : INGENIERÍA Y TECNOLOGÍA
CIENCIAS TECNOLÓGICAS
CIENCIA DE LOS ORDENADORES
Fecha de publicación : 1-sep-2022
Facultad: Facultad de Informática
Prográma académico: Maestría en Ciencias de la Computación
Resumen: "El reconocimiento automático de la lengua de señas es una tarea compleja en el área de visión por computadora y aprendizaje automático. La mayoría de los trabajos que se encuentran en la literatura se han centrado en reconocer la lengua de señas usando solo gestos con las manos. Sin embargo, el movimiento del cuerpo y los gestos faciales juegan un papel esencial en la interacción de la lengua de señas. Teniendo esto en cuenta, en este proyecto de investigación se desarrolló un sistema de reconocimiento de la lengua de señas basado en la detección de puntos característicos de las manos, el cuerpo y la cara que se emplean al realizar una seña. Para la adquisición de las señas se utilizó una cámara de profundidad con el propósito de obtener las coordenadas 3D que caracterizan cada seña, capturando un total de 3000 secuencias de datos que corresponden a 30 señas estáticas y dinámicas de la Lengua de Señas Mexicana. Para la clasificación automática del conjunto de señas, se evaluaron tres arquitecturas diferentes que permiten el tratamiento de secuencias temporales: la red neuronal recurrente (RNN, por sus siglas en inglés), la memoria a corto y largo plazo (LSTM, por sus siglas en inglés) y la unidad recurrente cerrada (GRU, por sus siglas en inglés). Para evaluar el rendimiento de cada clasificador se calculó la precisión, la recuperación y la exactitud. Al finalizar la etapa de experimentación y validación de resultados, se puede concluir que la memoria a corto plazo (LSTM) funcionó mejor con entradas ruidosas y la unidad recurrente cerrada (GRU) funcionó mejor sin entradas ruidosas y con menos parámetros entrenables."
URI : http://ri-ng.uaq.mx/handle/123456789/3799
Otros identificadores : LSM
Clasificación
Redes neuronales
Cámara RGB-D
Aparece en las colecciones: Maestría en Ciencias de la Computación

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
RI006822.pdf2.59 MBAdobe PDFVista previa
Visualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.