Show simple item record

dc.contributor.advisorCardellino, Cristian Adrián
dc.contributor.authorKokic, Emiliano
dc.date.accessioned2021-08-26T19:27:27Z
dc.date.available2021-08-26T19:27:27Z
dc.date.issued2019
dc.identifier.urihttp://hdl.handle.net/11086/19966
dc.descriptionTesis (Lic. en Cs. de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2019.es
dc.description.abstractEl presente trabajo de tesis consiste en la exploración de un método de aprendizaje automático semi-supervisado llamado Redes Convolucionales en Escalera. La problemática que se decide abordar para la evaluación de dicho modelo es el Reconocimiento de Entidades Nombradas, una tarea muy relevante dentro del área de Procesamiento del Lenguaje Natural. Para realizar el estudio fue indispensable contar con WiNER, un corpus anotado de Wikipedia de gran calidad y fácil acceso. A su vez se estudian alternativas de representación de las palabras de acuerdo a su contexto. Se utiliza el bien conocido modelo Word2Vec para la generación de \textit{embeddings} de palabras junto con la aplicación de estrategias que los combinan. En particular, resulta que el uso de capas convolucionales es una gran herramienta para la extracción de atributos del contexto. Se implementaron distintas arquitecturas de modelos, cada una de ellas con su versión supervisada (a modo de baseline) y semi-supervisada (al agregar las redes en escalera). Cada arquitectura tiene distintos tipos de instancias de entrenamiento, en algunos casos utilizando el etiquetado de palabras así como también el etiquetado de secuencias. Finalmente, luego de definir las métricas de evaluación se realizaron los experimentos pertinentes encontrando el modelo de Redes Convolucionales en Amplitud en Escalera como el más prometedor. Si bien los resultados obtenidos no son del estado del arte en cuanto a la tarea de reconocimiento de entidades nombradas, se visualiza que los modelos semi-supervisados de redes neuronales en escalera generalizan mejor y su performance no disminuye en gran medida al de los supervisados gracias al uso complementario de datos no anotados.es
dc.description.abstractThe present work consists in the exploration of a semi-supervised machine learning method called Convolutional Ladder Networks. A very relevant task within the Natural Language Processing area is the Named-entity recognition, this is the problem that is decided to deal for the model evaluation. In order to carry out this study, it was essential to have WiNER, an annotated corpus of Wikipedia of great quality and easy access. At the same time, alternative strategies for the word representations according to their context are studied. The well-known Word2Vec model is used to generate word embeddings along with the application of strategies that combine them. In particular, it turns out that the use of convolutional layers is a great tool for context features extraction. Different model architectures were implemented, each of them with their supervised version (as a baseline) and the semi-supervised one (when adding ladder networks). Each architecture has different types of training instances, in some cases using word tagging as well as sequence tagging. Finally, once the experiments were executed, we found the Wide Convolutional Ladder Networks model as the most promising. Although the results obtained are not from the state of the art in terms of the task of recognising named entities, it is found that semi-supervised models of ladder neural networks generalize better and their performance does not decrease greatly to that of supervised ones thanks to the complementary use of unlabeled data.en
dc.language.isospaes
dc.rightsAtribución-CompartirIgual 4.0 Internacional*
dc.rights.urihttp://creativecommons.org/licenses/by-sa/4.0/*
dc.subjectRedes en escaleraes
dc.subjectAprendizaje automáticoes
dc.subjectEntidades nombradases
dc.subjectPLNes
dc.subjectComputing methodologiesen
dc.titleReconocimiento semi-supervisado de entidades nombradas mediante redes convolucionales en escaleraes
dc.typebachelorThesises
dc.description.versionpublishedVersion
dc.description.filFil: Kokic, Emiliano. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.es


Files in this item

Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record

Atribución-CompartirIgual 4.0 Internacional
Except where otherwise noted, this item's license is described as Atribución-CompartirIgual 4.0 Internacional