Por favor, use este identificador para citar o enlazar este ítem: https://ri-ng.uaq.mx/handle/123456789/1884
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.rights.licensehttp://creativecommons.org/licenses/by-nc-nd/4.0es_ES
dc.contributorWilfrido Jacobo Paredes Garcíaes_ES
dc.creatorOscar Cano Félixes_ES
dc.date2020-01-12-
dc.date.accessioned2020-01-16T16:28:59Z-
dc.date.available2020-01-16T16:28:59Z-
dc.date.issued2020-01-12-
dc.identifier.urihttp://ri-ng.uaq.mx/handle/123456789/1884-
dc.descriptionEl procesamiento del lenguaje natural es una herramienta ampliamente utilizada hoy en día dentro de la web, así como en aplicaciones móviles entablando interacciones naturales entre humanos y computadoras. Apesar de que muchos estudios han sido publicados y el auge de las inteligencias artificiales para el entendimiento del lenguaje ha permitido desarrollar modelos que logren determinar el sentido de la oración, el análisis morfológico, etc. el procesamiento del lenguaje natural tiene mucho trabajo por delante. Un área un poco olvidada dentro del procesamiento del lenguaje natural es el preprocesamiento de los textos, ya que se supone que la entrada del texto a examinar es un texto limpio y solo con ciertos errores ya identificados, aunque esto no es cierto en el mundo real, ya que en el texto informal en el que el ser humano se comunica, tiene presente errores inherentes y diferentes, que, además de ser difíciles de identificar, estos errores evolucionan con el tiempo, por lo que suponer que el preprocesamiento de un texto informal es una tarea ya estudiada es un error. En el presente trabajo se propone una aproximación para inferir los puntos clave de una tarea del preprocesamiento del lenguaje natural que es la identificación de unidades léxicas y sintácticas en el idioma español mexicano, mediante la subtarea de la segmentación de oraciones, siendo el que se determine una propiedad de existencia o que se acople a un modelo de palabra desconocidas basado en n-gramas para la manipulación de estos. La característica primordial de la investigación se centra en el modelo de ordenamiento y selección, sin olvidar que el modelo para puntuar probabilísticamente una palabra desconocida, en si es una innovación en el lenguaje español. El modelo para el ordenamiento y selección consiste en la aplicación de algoritmos de árboles binarios basados en reglas de composición, complementado con algoritmos de optimización de creación y selección de candidatos tal como el algoritmo voraz o la propiedad de Markov.es_ES
dc.formatAdobe PDFes_ES
dc.language.isoEspañoles_ES
dc.relation.requiresSies_ES
dc.rightsAcceso Abiertoes_ES
dc.subjectProcesamiento del lenguaje naturales_ES
dc.subjectOptimizaciónes_ES
dc.subjectn-gramases_ES
dc.subjectÁrboles binarioses_ES
dc.subject.classificationINGENIERÍA Y TECNOLOGÍAes_ES
dc.titleIdentificación de unidades léxicas y sintácticas de texto informal en españoles_ES
dc.typeTesis de maestríaes_ES
dc.creator.tidCURPes_ES
dc.contributor.tidcurpes_ES
dc.creator.identificadorCAFO911101HMSNLS08es_ES
dc.contributor.identificadorPAGW890917HGTRRL07es_ES
dc.contributor.roleDirectores_ES
dc.degree.nameMaestría en Ciencias (Ingeniería Matemática)es_ES
dc.degree.departmentFacultad de Ingenieríaes_ES
dc.degree.levelMaestríaes_ES
Aparece en: Maestría en Ciencias (Ingeniería Matemática)

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
RI004948.pdf2.61 MBAdobe PDFPortada
Visualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.