Show simple item record

dc.contributorDi Rienzo, Julio
dc.contributor.advisorBramardi, Sergio J.
dc.contributor.authorReeb, Pablo Daniel
dc.date.accessioned2018-06-29T14:24:30Z
dc.date.available2018-06-29T14:24:30Z
dc.date.issued2017
dc.identifier.urihttp://hdl.handle.net/11086/6366
dc.descriptionTesis (Maestría en Estadística Aplicada) -- Universidad Nacional de Córdoba. Facultad de Ciencias Económicas. Escuela de Graduados; Argentina, 2017.es
dc.description.abstractLa secuenciación de alto rendimiento de ARN genera grandes bases de datos con información que puede ser utilizada con diferentes objetivos. Una de las aplicaciones más utilizada consiste en resumir las lecturas de las secuencias agregándolas en función de una unidad de interés tal como gen, exón o transcript . En este tipo de análisis se obtienen matrices con datos de conteos correspondientes a cada individuo en estudio (filas) y asignados a una particular unidad de interés (columnas). En general el número de individuos es muy pequeño en relación al número de variables y los conteos presentan un rango de dispersión muy amplio. En esta tesis se comparan técnicas de análisis multivariado exploratorio a 2 y 3 vías de clasificación que contemplan la naturaleza de los datos obtenidos en experimentos de secuenciación de ARN. Utilizando datos sintéticos generados con la técnica de plasmodios se comparan transformaciones a los datos y medidas de disimilaridad empleadas en el análisis de cluster jerárquico, análisis de escalamiento multidimensional métrico y no métrico y en el análisis factorial multiple. La transformación de los conteos originales a través de funciones que utilizan logaritmo o el uso de disimilaridades basadas en correlacion de Spearman o disimilaridad Poisson rescata la estructura natural de las muestras en todos los métodos de análisis utilizados. La mera estandarización o normalización de los conteos no genera representaciones confiables. La elección de la mejor medida debe considerar el nivel de relación señal-ruido ya que no todas las medidas muestran la configuración natural de la muestras en función de la cantidad de transcripts expresados o no diferencialmente. Este aspecto debe considerarse al momento de representar las muestras utilizando todos transcripts obtenidos o filtrando por expresión diferencial.es
dc.language.isospaes
dc.rightsAtribución 4.0 Internacional*
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/*
dc.subjectAnálisis multivariantees
dc.subjectAnálisis factoriales
dc.subjectPlasmodioses
dc.subjectRNA-seqes
dc.subjectMedidas de disimilaridades
dc.subjectDatos genómicoses
dc.subjectGenómica estadísticaes
dc.titleAnálisis multivariado aplicado a la representación de datos sintéticos de secuenciación de ARNes
dc.typemasterThesises
dc.description.filFil: Reeb, Pablo Daniel. Universidad Nacional de Córdoba. Facultad de Ciencias Económicas. Escuela de Graduados; Argentina.


Files in this item

Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record

Atribución 4.0 Internacional
Except where otherwise noted, this item's license is described as Atribución 4.0 Internacional