Aspectos generales
Responsable
Métodos de evaluación
Método |
Cantidad |
Porcentaje |
Asistencia |
13 |
20% |
Participación en clase |
13 |
30% |
Proyecto final |
1 |
50% |
Integrantes
Integrante |
Rol |
Horas |
Actividad complementaria |
ROMERO CORDOBA SANDRA LORENA |
Responsable |
26.00 |
|
ALBERTO IVAN SALIDO GUADARRAMA |
Profesor invitado (Externo) |
26.00 |
|
Introducción
Las nuevas técnicas de secuenciación de nueva generación y otras tecnologías de alto rendimiento han revolucionado el estudio de la genómica del cáncer con numerosos descubrimientos que han sido relevantes para el entendimiento, el diagnóstico y el tratamiento. Las tecnologías masivas y el análisis computacional han permitido identificar con éxito alteraciones somáticas, incluidas mutaciones, inserciones y deleciones, aberraciones de número de copia, variantes estructurales y fusiones de genes, así como alteraciones en los paisajes transcripcionales y los estados epigenéticos tanto de las células tumorales, como del microambiente tumoral. Este curso cubrirá diversas herramientas bioinformáticas para el estudio de las alteraciones genómicas y transcriptómicas en el cáncer, y su asociación con características clínicas. Los alumnos tendrán la oportunidad de aprender sobre las herramientas en línea y su utilización, a través de demostraciones y ejercicios. Se espera que los estudiantes tengan un conocimiento básico de cáncer y genómica del cáncer. Dado la naturaleza del curso teórico-práctico se requiere que el alumno cuente con computadora personal
Objetivos
A través de los temas abordados se introducirá al alumno a la biología básica de la genómica moderna y las herramientas para su análisis a través de la discusión de conceptos claves en bioinformática y ciencia de datos, es decir revisaremos herramientas y aplicaciones públicas para poder analizar los datos y obtener resultados que puedan ser interpretados y utilizados para diferentes propósitos.
Dinámica de la clase
-Introducción de los temas a través de exposición de conceptos y en algunas ocasiones discusión de artículos científicos. - Realización de ejercicios basados en problemas y su análisis a través de herramientas públicas.
- Realización de proyecto final donde se apliquen los conocimientos obtenidos
Temario
Módulo 1:
1. Introducción (4 h, Sandra Romero 2h, Ivan Salido 2h)
• ¿Qué es un genoma del cáncer y por qué nos importa?
• ¿Cómo podemos usar los genomas para comprender el cuerpo sano y combatir las enfermedades?
• ¿Cómo podrían los genomas permitirnos predecir problemas de salud antes de que ocurran?
• ¿Cómo funcionan las tecnologías masivas?: secuenciación de nueva generación, microarreglos, nanostring, PCR digital, análisis de célula única. • Repositorios públicos: Geo omnibus, TCGA (gdac, cbioportal, UCSC Xena), ICGC, Genome Browser
• Tipo de datos, accesibilidad
• Como obtener datos de bases públicas (abiertos o bajo autorización)
• Bases de datos especializadas
2. Análisis de microarreglos con herramientas públicas (4 h Sandra Romero)
Normalización, expresión diferencial visualización.
Introducción a GenePattern y BART
Módulo 2: Uso de la plataforma bioinformática Galaxy
3. Introducción a Galaxy (4 hrs: Iván Salido 2h, Sandra Romero 2h)
• Presentación de la interface de Galaxy
• Preparación y carga de archivos
• Uso de herramientas y módulos de análisis bioinformáticos
• Manejo de historias
• Visualización y extracción de flujos de trabajo
4. Manejo de datos de NGS (4 hrs: Iván Salido 2h, Sandra Romero 2h)
• Exploración y manejo de archivos FASTQ
• Evaluación de la calidad de alineamiento a partir de archivos FASTQ
• Mapeo de secuencias genómicas usando un genoma de refencia
• Evaluación de la profundidad de secuenciación
• Remoción de duplicados y recalibración y filtrado de bases
• Exploración y manejo de archivos BAM
• Visualización de resultados del alineamiento
• Procesamiento de datos de secuenciación Pair-end y Single-end
5. Introducción al análisis de datos trascriptomicos usando datos de RNA-seq I (4 hrs Ivan Salido)
• Introducción a la Transcriptómica
• Preparación de archivos
• Evaluación de la calidad de la secuenciación usando archivos FASTQ
• Preprocesamiento de lecturas (Trimming) • Mapeo de lecturas
6. Introducción al análisis de datos trascriptómicos usando datos de RNA-seq II (4 hrs: : Ivan Salido 2h, Sandra Romero 2h)
• Detección y cuantificación de transcritos
• Análisis de expresión diferencial
• Análisis de Enriquecimiento de genes
7. Análisis downstream (4 hrs Sandra Romero)
- Análisis de enriquecimiento de vías
- GSEA
- Visualización gráfica de Resultados usando Volcano plot y heatmap2
Módulo 3
8. Descubrimiento de variantes de un solo nucleótido (SNP) y deleciones e inserciones cortas (Indels) con datos de NGS I (4 hrs Ivan Salido )
• Introducción al análisis de SPNs e Indels
• Llamado de SPNs e Indels en genomas diploides
9. Descubrimiento de variantes de un solo nucleótido (SNP) y deleciones e inserciones cortas (Indels) con datos de NGS I (4 hrs Iván Salido )
• Identificación de variantes germinales y somáticas
• Exploración y manipulación de archivos VCF
• Anotación funcional de SNPs e Indels
10. Análisis downstream (4 hrs Sandra Romero )
Visualización y análisis en IGV
Mutaciones significantes
Firmas mutacionales
GISTIC
Módulo 4
11. Métodos bioinformáticos para el análisis de datos de chip-seq (4 hrs: Iván Salido)
12. Análisis dedicados (4 hrs Sandra Romero)
Clustering: caso de estudio a través de definir infiltración inmune de tumores Herramientas de deconvolución.
Visualización dedicada
Análisis de datos en plataforma cBioportal y Xena
Módulo 5
13. Presentación de proyectos finales (4 hrs: Iván Salido 2h, Sandra Romero 2h)
Descargables