Aprendizaje activo para la extracción de relaciones en textos
Abstract
A la hora de realizar un trabajo de aprendizaje automático, podemos encontrarnos con una fuente abundante de datos sin etiquetar y que su etiquetado manual sea un proceso costoso. Una técnica útil en estos casos es permitir que el algoritmo de aprendizaje consulte a un oráculo sobre las etiquetas de ciertos datos seleccionados que el algoritmo considere importantes. Este tipo de aprendizaje semi‐supervisado iterativo se llama aprendizaje activo. Utilizando IEPY, un framework de extracción de información orientado a extracción de relaciones, construiremos un sistema de extracción de relaciones con aprendizaje activo. Realizaremos una serie de experimentos sobre selección de instancias y etiquetado de features sobre un corpus basándonos en el trabajo de Settles 2011 con el objetivo de acelerar inicialmente el desempeño del modelo.
When working on some machine learning tasks, we may have to deal with large pool of unlabeled data and the labeling process to be manual and resource‐intensive. A useful technique in these cases is to allow the learning algorithm to query an oracle about the labels of certain data selected as important by the algorithm. This kind of iterative semi‐supervised learning is known as active learning. Using IEPY, an information extraction framework oriented towards relationship extraction, we will build a relationship extractor system with active learning. We will also perform a series of experiments about instance selection and feature labeling on a corpus, based on the work from Settles 2011 with the mission of accelerating the model's initial performance.
The following license files are associated with this item: