Título:	Análisis ómico de datos masivos en cáncer: herramientas y aplicaciones bioinformáticas para su análisis
Semestre:	2024-2
Sede:	Instituto de Investigaciones Biomedicas
Horario:	Miércoles 9:30 a 1:30
No. de sesiones:	13
Duración de la sesión:	4.00
Cupo total:	15
Observaciones:	Los estudios del genoma del cáncer han explorado las alteraciones moleculares como las mutaciones, el cambio somático en el número de copias, los rearreglos estructurales, la expresión génica de las diversas especies de RNA, los cambios epigenéticos, entro otros niveles de información biológica. Estos estudios han revelado decenas de nuevos genes asociados al establecimiento y progresión del cáncer, incluidos muchos procesos que no se conocían previamente.. Este relevante avance en el estudio básico, clínico y traslacional del cáncer ha sido sólo posible gracias a una gama de tecnologías que proporcionan información que permite una visión holística de cómo las aberraciones genómicas y epigenéticas pueden alterar la homeostasis de las redes de señalización celular, entre las células cancerosas y el microambiente local, y a nivel de órganos y organismos. La combinación de la secuenciación de próxima generación y los enfoques de análisis de datos computacionales ha revolucionado nuestra comprensión de los fundamentos genómicos del desarrollo y la progresión del cáncer, por ello es relevante que los estudiantes tengan un primer acercamiento a las herramientas públicas que permiten explotar la basta información de la genómica del cáncer tanto de repositorios públicos como de datos generados en sus laboratorios, y estrategias de como aprovechar estos valiosos recursos para su propia investigación.

Responsable

Nombre:	SANDRA LORENA ROMERO CORDOBA
Entidad:	Instituto de Investigaciones Biomédicas
Email:	sromero@iibiomedicas.unam.mx

Métodos de evaluación

Método	Cantidad	Porcentaje
Asistencia	13	20%
Participación en clase	13	30%
Proyecto final	1	50%

Integrantes

Integrante	Rol	Horas	Actividad complementaria
ROMERO CORDOBA SANDRA LORENA	Responsable	26.00
ALBERTO IVAN SALIDO GUADARRAMA	Profesor invitado (Externo)	26.00

Introducción

Las nuevas técnicas de secuenciación de nueva generación y otras tecnologías de alto rendimiento han revolucionado el estudio de la genómica del cáncer con numerosos descubrimientos que han sido relevantes para el entendimiento, el diagnóstico y el tratamiento. Las tecnologías masivas y el análisis computacional han permitido identificar con éxito alteraciones somáticas, incluidas mutaciones, inserciones y deleciones, aberraciones de número de copia, variantes estructurales y fusiones de genes, así como alteraciones en los paisajes transcripcionales y los estados epigenéticos tanto de las células tumorales, como del microambiente tumoral. Este curso cubrirá diversas herramientas bioinformáticas para el estudio de las alteraciones genómicas y transcriptómicas en el cáncer, y su asociación con características clínicas. Los alumnos tendrán la oportunidad de aprender sobre las herramientas en línea y su utilización, a través de demostraciones y ejercicios. Se espera que los estudiantes tengan un conocimiento básico de cáncer y genómica del cáncer. Dado la naturaleza del curso teórico-práctico se requiere que el alumno cuente con computadora personal

Objetivos

A través de los temas abordados se introducirá al alumno a la biología básica de la genómica moderna y las herramientas para su análisis a través de la discusión de conceptos claves en bioinformática y ciencia de datos, es decir revisaremos herramientas y aplicaciones públicas para poder analizar los datos y obtener resultados que puedan ser interpretados y utilizados para diferentes propósitos.

Dinámica de la clase
-Introducción de los temas a través de exposición de conceptos y en algunas ocasiones discusión de artículos científicos. - Realización de ejercicios basados en problemas y su análisis a través de herramientas públicas.
- Realización de proyecto final donde se apliquen los conocimientos obtenidos

Temario

Módulo 1:
1. Introducción (4 h, Sandra Romero 2h, Ivan Salido 2h)
• ¿Qué es un genoma del cáncer y por qué nos importa?
• ¿Cómo podemos usar los genomas para comprender el cuerpo sano y combatir las enfermedades?
• ¿Cómo podrían los genomas permitirnos predecir problemas de salud antes de que ocurran?
• ¿Cómo funcionan las tecnologías masivas?: secuenciación de nueva generación, microarreglos, nanostring, PCR digital, análisis de célula única. • Repositorios públicos: Geo omnibus, TCGA (gdac, cbioportal, UCSC Xena), ICGC, Genome Browser
• Tipo de datos, accesibilidad
• Como obtener datos de bases públicas (abiertos o bajo autorización)
• Bases de datos especializadas

2. Análisis de microarreglos con herramientas públicas (4 h Sandra Romero)

Normalización, expresión diferencial visualización.

Introducción a GenePattern y BART

Módulo 2: Uso de la plataforma bioinformática Galaxy

3. Introducción a Galaxy (4 hrs: Iván Salido 2h, Sandra Romero 2h)

• Presentación de la interface de Galaxy
• Preparación y carga de archivos
• Uso de herramientas y módulos de análisis bioinformáticos

• Manejo de historias
• Visualización y extracción de flujos de trabajo

4. Manejo de datos de NGS (4 hrs: Iván Salido 2h, Sandra Romero 2h)

• Exploración y manejo de archivos FASTQ
• Evaluación de la calidad de alineamiento a partir de archivos FASTQ

• Mapeo de secuencias genómicas usando un genoma de refencia
• Evaluación de la profundidad de secuenciación
• Remoción de duplicados y recalibración y filtrado de bases
• Exploración y manejo de archivos BAM
• Visualización de resultados del alineamiento
• Procesamiento de datos de secuenciación Pair-end y Single-end

5. Introducción al análisis de datos trascriptomicos usando datos de RNA-seq I (4 hrs Ivan Salido)

• Introducción a la Transcriptómica
• Preparación de archivos
• Evaluación de la calidad de la secuenciación usando archivos FASTQ

• Preprocesamiento de lecturas (Trimming) • Mapeo de lecturas

6. Introducción al análisis de datos trascriptómicos usando datos de RNA-seq II (4 hrs: : Ivan Salido 2h, Sandra Romero 2h)

• Detección y cuantificación de transcritos
• Análisis de expresión diferencial
• Análisis de Enriquecimiento de genes

7. Análisis downstream (4 hrs Sandra Romero)

Análisis de enriquecimiento de vías
GSEA
Visualización gráfica de Resultados usando Volcano plot y heatmap2

Módulo 3

8. Descubrimiento de variantes de un solo nucleótido (SNP) y deleciones e inserciones cortas (Indels) con datos de NGS I (4 hrs Ivan Salido )

• Introducción al análisis de SPNs e Indels
• Llamado de SPNs e Indels en genomas diploides

9. Descubrimiento de variantes de un solo nucleótido (SNP) y deleciones e inserciones cortas (Indels) con datos de NGS I (4 hrs Iván Salido )

• Identificación de variantes germinales y somáticas
• Exploración y manipulación de archivos VCF
• Anotación funcional de SNPs e Indels

10. Análisis downstream (4 hrs Sandra Romero )

Visualización y análisis en IGV

Mutaciones significantes

Firmas mutacionales

GISTIC

Módulo 4

11. Métodos bioinformáticos para el análisis de datos de chip-seq (4 hrs: Iván Salido)

12. Análisis dedicados (4 hrs Sandra Romero)

Clustering: caso de estudio a través de definir infiltración inmune de tumores Herramientas de deconvolución.
Visualización dedicada
Análisis de datos en plataforma cBioportal y Xena

Módulo 5
13. Presentación de proyectos finales (4 hrs: Iván Salido 2h, Sandra Romero 2h)

Descargables

Descargar curso o tópico

Circuito de Posgrado, Ciudad Universitaria
Alcaldía Coyoacán, C.P. 04510, México, CDMX

55 5623 7006
mdcbq@posgrado.unam.mx