Herramientas estadísticas para el análisis de datos en estudios de asociación genómica
Date
2020Author
Rueda Calderón, María Angélica
Advisor
Bruno, Cecilia Inés
Metadata
Show full item recordAbstract
El mapeo asociativo (MA) o GWAS (por sus siglas en inglés, Genome Wide Association Study) es usado para encontrar lugares específicos del genoma relacionados con la variación de un caracter fenotípico. En el mejoramiento vegetal posibilita el uso de poblaciones no diseñadas experimentalmente. Los marcadores significativos pueden ser usados en selección asistida por marcadores. Se supone que la modelación estadística que incorpora información sobre el parentesco y correlaciones ambientales hace más eficiente el MA. Un objetivo de esta tesis es comparar el desempeño, en términos de la estimación de las componentes de varianza, las puntuaciones de los marcadores y los BLUP (best linear unbiased predictor) de los efectos de genotipo, de los modelos por ambiente y multiambientales para GWAS que incluyen correlaciones genéticas a través de un pedigrí o una matriz de similitud de marcadores moleculares. Los modelos multiambientales produjeron estimaciones más precisas de la variabilidad genética y ofrecen una estimación de la varianza de la interacción genotipo-ambiente (G×E), razón por la cual son preferidos a la modelación por ambiente. Dada la abundancia de estudios de selección genómica (SG) en vegetales, otros objetivos de la tesis fueron, i) realizar una revisión sistemática de literatura científica publicada sobre SG en vegetales, ii) identificar las principales metodologías de estimación usadas en el contexto de SG, iii) aplicar técnicas propias del meta-análisis para obtener medidas globales de la eficiencia de los modelos SG usados con mayor frecuencia en vegetales y iv) desarrollar un protocolo para meta-análisis orientado a identificar loci de efecto mayor en estudios de asociación genómica. Los resultados del meta-análisis sugirieron que la eficiencia de la SG en promedio es del 60% tanto en cereales como en otras especies de importancia agrícola. Respecto al análisis de QTL tradicional donde existen numerosas publicaciones el protocolo propuesto para la identificación de loci de efecto mayor representa una herramienta potente para la síntesis de resultados. Implementado en la búsqueda de QTL para resistencia/tolerancia a enfermedades virales en maíz identificó consensos en las publicaciones que sugieren QTL posicionados en el cromosoma 1 con efecto aditivo relativamente importante, mientras que aquellos presentes en los cromosomas 3, 4 y 10 se corresponden con loci de efecto relativamente menor.
Association mapping (AM) or GWAS (Genome Wide Association Study), is used to find specific genomic regions related to phenotypic trait variation. In plant breeding it enables the use of populations not experimentally designed. Significant markers can be used in marker-assisted selection. It is assumed that statistical modeling that incorporates information about kinship and environmental correlations makes the AM more efficient. An objective of this thesis is to compare the performance, in terms of the estimation of the variance components, marker scores, and BLUP (Best Linear Unbiased Predictor) of the genotype effects, in single-environment and multienvironmental models for GWAS which including genetic correlations through a pedigree or a similarity matrix of molecular markers. Multienvironmental models produced more accurate estimates of genetic variability and offered an estimate of the variance of the genotype-environment interaction (G×E), which is why they are preferred to modeling by environment. Given the abundance of Genomic Selection studies (GS) in vegetables, other objectives of the thesis were, i) to conduct a systematic review of published scientific literature on GS in vegetables, ii) to identify the main estimation methodologies used in the context of GS, iii) to apply meta-analysis techniques to obtain global measures of the efficiency of the most frequently used GS models in vegetables, and iv) to develop a protocol for meta-analysis aimed at identifying major-effect loci in genomic association studies. Meta-analysis results suggested that on average of GS efficiency is 60% in both cereals and other species of agricultural importance. Regarding traditional QTL analysis where there are numerous publications, the proposed protocol for the identification of the major-effect loci represents a powerful tool for the synthesis of results. Implemented in the search for resistance/tolerance's QTL to viral diseases in maize, it identified consensus in the publications that suggest QTL positioned on chromosome 1 with a relatively important additive effect, while those present on chromosomes 3, 4, and 10 correspond to loci of relatively minor effect.
Collections
The following license files are associated with this item: