Métodos clásicos de clasificación : comparación y aplicación
Date
2021Author
Godoy, Facundo Eduardo
Advisor
González Montoro, Aldana María
Metadata
Show full item recordAbstract
Los problemas de clasificación o discriminación son aquellos en los que se dispone de un conjunto de elementos que provienen de dos o más poblaciones conocidas y para cada uno se ha observado una serie de variables explicativas o predictoras. Se desea clasificar un nuevo elemento en alguna de esas poblaciones utilizando los valores, conocidos, de las variables explicativas. Actualmente, los métodos de clasificación son muy estudiados y utilizados en Aprendizaje Automático y Ciencia de Datos pero aparecen en estadística desde los años 30. En este trabajo se estudió el marco teórico de los métodos clásicos de clasificación: Análisis Discriminante Lineal, Análisis Discriminante Cuadrático, Regresión logística y k - vecinos más próximos. Luego, se ideó y llevó a cabo un estudio de simulación para compararlos en distintos escenarios. Por último, se aplicaron y compararon los métodos utilizando un conjunto de datos reales en el contexto la utilización de señales Bluetooth para la trazabilidad de contactos estrechos.
Classification or discrimination problems are a set of elements that come from two or more known populations, and for each one a series of explanatory or predictable variables has been observed. The aim is to classify a new element in any of these populations using the known values of the explanatory variables. Currently, classification methods are widely studied and used in Machine Learning and Data Science; however, they have appeared in statistics since the 30s. In this research, the theoretical framework of the classic classification methods was studied: Linear Discriminant Analysis, Quadratic Discriminant Analysis, Logistic regression and k - nearest neighbors. Afterwards, a simulation study was devised and carried out to compare them in different scenarios. Lastly, these methods were applied and compared using a set of real data in the context of the use of Bluetooth signals for traceability of close contacts.
The following license files are associated with this item: