Por favor, use este identificador para citar o enlazar este ítem: https://ri-ng.uaq.mx/handle/123456789/4427
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.rights.licensehttp://creativecommons.org/licenses/by-nc-nd/4.0es_ES
dc.contributorIgnacio Rodríguez Sánchezes_ES
dc.creatorHéctor Castro Mosquedaes_ES
dc.date2023-01-02-
dc.date.accessioned2023-02-27T18:40:24Z-
dc.date.available2023-02-27T18:40:24Z-
dc.date.issued2023-01-02-
dc.identifier.urihttps://ri-ng.uaq.mx/handle/123456789/4427-
dc.descriptionEsta tesis emplea herramientas de análisis léxico, métodos de procesamiento cuantitativo y procedimientos propios del procesamiento del lenguaje natural para analizar muestras de lenguaje con el fin de identificar, analizar y clasificar la presencia, a veces sutil y a veces flagrante, del sexismo lingüístico en nuestra vida cotidiana. Esta tesis inicia realizando un análisis de colocaciones para investigar cómo se representan lingüísticamente a las mujeres y a los hombres en la prensa en línea en español. Posteriormente, esta investigación analiza cómo la extracción de palabras clave, una técnica propia de la Lingüística de Corpus, puede emplearse en la obtención de rasgos para mejorar la precisión de los algoritmos en tareas de Clasificación Automática de Texto en el campo del Procesamiento del Lenguaje Natural; en particular, esta tesis se ocupa de extraer palabras clave de un corpus obtenido de las redes sociales para clasificar el lenguaje misógino. En estas investigaciones, comenzamos basándonos en un corpus de cuarta generación y eventualmente en textos de comunicación mediada por ordenador. Concretamente, el corpus NOW, que contiene 7,200 millones de palabras, fue consultado en un inicio para identificar representaciones lingüísticas de género mediante un análisis de colocaciones adjetivas y verbales; asimismo, después se recopiló un corpus de comentarios en redes sociales de 1,841,385 palabras para extraer palabras clave, las cuales se utilizaron como rasgos para mejorar la precisión de los algoritmos en tareas de clasificación automática. El análisis de los datos mostró que algunos adjetivos y verbos se relacionan exclusivamente o con mayor intensidad con el lema HOMBRE o con MUJER; los hombres se relacionan con mayor intensidad con adjetivos relacionados con la agudeza mental, la sexualidad y la fertilidad, mientras que las mujeres se relacionan con adjetivos relacionados con la salud, el estado civil y las afiliaciones religiosas. Con respecto a las colocaciones verbales, las mujeres se asocian más fuertemente con verbos relacionados con expresiones de emociones y los hombres con verbos que denotan un comportamiento violento. Posteriormente, en las tareas de clasificación que se realizaron con el corpus extraído de las redes sociales, las palabras clave obtuvieron un 98% de precisión al clasificar los textos y un 92% al clasificar casi 7,500 comentarios. Cuando se eliminaron las palabras clave de la tarea de clasificación y se utilizaron todas las palabras para llevar a cabo dicha tarea, la precisión descendió en promedio 17 %.es_ES
dc.formatAdobe PDFes_ES
dc.language.isospaes_ES
dc.publisherLenguas y letrases_ES
dc.relation.requiresSies_ES
dc.rightsAcceso Abiertoes_ES
dc.subjectHumanidades y Ciencias de la Conductaes_ES
dc.subjectLingüísticaes_ES
dc.subjectLingüística aplicadaes_ES
dc.titleUso de palabras clave para la detección automática del discurso sexista en prensa y redes socialeses_ES
dc.typeTesis de doctoradoes_ES
dc.creator.tidcurpes_ES
dc.creator.identificadorCAMH790325HGTSSC09es_ES
dc.contributor.roleDirectores_ES
dc.degree.nameDoctorado en Lingüísticaes_ES
dc.degree.departmentFacultad de Lenguas y Letrases_ES
dc.degree.levelDoctoradoes_ES
Aparece en las colecciones: Doctorado en Lingüística

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
RI007148.pdf3.87 MBAdobe PDFVista previa
Visualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.