Predicción de tendencias en redes sociales basada en características sociales y contenido

Silva, Martín Gastón

dc.contributor	Celayes, Pablo Gabriel, co dir.
dc.contributor.advisor	Domínguez, Martín Ariel, dir.
dc.contributor.author	Silva, Martín Gastón
dc.date.accessioned	2018-05-29T15:21:11Z
dc.date.available	2018-05-29T15:21:11Z
dc.date.issued	2018-04-30
dc.identifier.uri	http://hdl.handle.net/11086/6245
dc.description	Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2018.	es
dc.description.abstract	En el marco del análisis de redes sociales éste trabajo busca capturar el comportamiento de los usuarios influyentes sobre una publicación determinada. Con esta información, la intención es generar un modelo de aprendizaje automático capaz de predecir si un determinado tweet será “popular” o no. La construcción del conjunto de datos (dataset) fue realizada a través de la API pública de Twitter obteniendo un volumen final de más de 5,000 usuarios y 5,000,000 de publicaciones. Con esta información se entrenaron y evaluaron diversos modelos de aprendizaje auto- mático con múltiples configuraciones, con el objetivo encontrar así el mejor rendimiento. En este sentido, en un primer experimento, se logró inferir un modelo de clasificación binaria basado en SVM (Support Vector Machines) sólo utilizando información social, qué obtuvo un 77 % de certeza, basado en la métrica F1, para predecir si una publicación es considerada “popular”. En una segunda etapa, se decidió agregar técnicas de Procesamiento de Lenguaje Natural aplicadas sobre el contenido de las publicaciones, logrando algunas mejoras sig- nificativas en los casos donde el modelo anterior se veía disminuido. Dicho análisis de los tweets fue realizado utilizando detección de tópicos, mediante algoritmos tipo LDA (Latent Dirichlet Allocation).	es
dc.description.abstract	n the framework of social network analysis, this work seeks to capture the behavior of influential users about a specific publication. With this information, the intention is to generate an automatic learning model capable of predicting if a certain tweet is popular or not. The construction of the dataset was made through the public Twitter API obtaining a final volume of more than 5,000 users and 5,000,000 publications. With this information, different models of machine learning with multiple configurations were trained and evaluated, in order to obtain the best performance. In this sense, in a database we can infer a classification model based on SVM (Support Vector Machines) only using social information, which obtained a 77% certainty, based on the F1 metric, for predict whether a publication is considered "popular". In a second stage, it was decided to add Natural Language Processing techniques, earning significant improvements in the cases where the previous model was reduced. This analysis of the tweets was done by detection of topics, through LDA(Latent Dirichlet Allocation) algorithms.	en
dc.language.iso	spa	es
dc.rights	Atribución-NoComercial-CompartirIgual 4.0 Internacional	*
dc.rights.uri	http://creativecommons.org/licenses/by-nc-sa/4.0/	*
dc.subject	Applied computing - Sociology	en
dc.subject	Computing methodologies - Natural language processing	en
dc.subject	Computing methodologies - Support vector machines	en
dc.subject	Computing methodologies - Latent Dirichlet allocation	en
dc.subject.other	Computación aplicada	es
dc.subject.other	Metodologías de computación	es
dc.subject.other	Análisis de redes sociales	es
dc.subject.other	Aprendizaje automático	es
dc.subject.other	Detección de influenciadores	es
dc.subject.other	Modelos de predicción	es
dc.subject.other	Twitter
dc.subject.other	LDA	en
dc.title	Predicción de tendencias en redes sociales basada en características sociales y contenido	es
dc.type	bachelorThesis	es

Files in this item

Name:: Tesis-Final_Silva.pdf
Size:: 1.913Mb
Format:: PDF
Description:: Trabajo final Licenciatura en ...

View/Open

Name:: license_rdf
Size:: 1.491Kb
Format:: application/rdf+xml

View/Open

This item appears in the following Collection(s)

Trabajos Especiales de Licenciatura en Ciencias de la Computación

Show simple item record

Except where otherwise noted, this item's license is described as Atribución-NoComercial-CompartirIgual 4.0 Internacional