Reconocimiento de entidades nombradas en texto de dominio legal
Fecha
2019Autor
Haag, Karen Yanet
Director/a
Cardellino, Cristian Adrián
Metadatos
Mostrar el registro completo del ítemResumen
Este trabajo se centra en la detección, clasificación y anotación de entidades nombradas (como Leyes, Resoluciones o Decretos, entre otros) para el corpus de InfoLEG, una base de datos que contiene los documentos de todas las leyes de la República Argentina. En primera instancia se hizo reconocimiento mediante patrones definidos por expresiones regulares. Luego, se entrenó y evaluó un modelo basado en aprendizaje automático para tratar entidades que no eran regulares y así poder ampliar la cantidad de instancias capturadas. Por último, se realizó una aproximación utilizando anotación semántica para cada entidad y obtener así el acceso a la fuente de información correspondiente.
This work focuses on detection, classification and annotation of named entities (such as laws, resolutions or decrees, among others) for the corpus of InfoLEG, a database that contains the documents of all the laws of the Argentine Republic. In the first instance, recognition was done using patterns defined by regular expressions. Then, a model based on machine learning was trained and evaluated to deal with entities that were not regular and thus be able to expand the number of captured instances. Finally, an approximation was made using semantic annotation for each entity and thus obtain access to the corresponding information source.
El ítem tiene asociados los siguientes ficheros de licencia: