Acceso a usuarios
Bienvenid@

Cursos y tópicos

Análisis ómico de datos masivos en cáncer: herramientas y aplicaciones bioinformáticas para su análisis

Aspectos generales

Título: Análisis ómico de datos masivos en cáncer: herramientas y aplicaciones bioinformáticas para su análisis
Semestre: 2024-2
Sede: Instituto de Investigaciones Biomedicas
Horario: Miércoles 9:30 a 1:30
No. de sesiones: 13
Duración de la sesión: 4.00
Cupo total: 15
Observaciones: Los estudios del genoma del cáncer han explorado las alteraciones moleculares como las mutaciones, el cambio somático en el número de copias, los rearreglos estructurales, la expresión génica de las diversas especies de RNA, los cambios epigenéticos, entro otros niveles de información biológica. Estos estudios han revelado decenas de nuevos genes asociados al establecimiento y progresión del cáncer, incluidos muchos procesos que no se conocían previamente.. Este relevante avance en el estudio básico, clínico y traslacional del cáncer ha sido sólo posible gracias a una gama de tecnologías que proporcionan información que permite una visión holística de cómo las aberraciones genómicas y epigenéticas pueden alterar la homeostasis de las redes de señalización celular, entre las células cancerosas y el microambiente local, y a nivel de órganos y organismos. La combinación de la secuenciación de próxima generación y los enfoques de análisis de datos computacionales ha revolucionado nuestra comprensión de los fundamentos genómicos del desarrollo y la progresión del cáncer, por ello es relevante que los estudiantes tengan un primer acercamiento a las herramientas públicas que permiten explotar la basta información de la genómica del cáncer tanto de repositorios públicos como de datos generados en sus laboratorios, y estrategias de como aprovechar estos valiosos recursos para su propia investigación.

Responsable

Nombre: SANDRA LORENA ROMERO CORDOBA
Entidad: Instituto de Investigaciones Biomédicas
Email: sromero@iibiomedicas.unam.mx

Métodos de evaluación

Método Cantidad Porcentaje
Asistencia 13 20%
Participación en clase 13 30%
Proyecto final 1 50%

Integrantes

Integrante Rol Horas Actividad complementaria
ROMERO CORDOBA SANDRA LORENA Responsable 26.00
ALBERTO IVAN SALIDO GUADARRAMA Profesor invitado (Externo) 26.00

Introducción

Las nuevas técnicas de secuenciación de nueva generación y otras tecnologías de alto rendimiento han revolucionado el estudio de la genómica del cáncer con numerosos descubrimientos que han sido relevantes para el entendimiento, el diagnóstico y el tratamiento. Las tecnologías masivas y el análisis computacional han permitido identificar con éxito alteraciones somáticas, incluidas mutaciones, inserciones y deleciones, aberraciones de número de copia, variantes estructurales y fusiones de genes, así como alteraciones en los paisajes transcripcionales y los estados epigenéticos tanto de las células tumorales, como del microambiente tumoral. Este curso cubrirá diversas herramientas bioinformáticas para el estudio de las alteraciones genómicas y transcriptómicas en el cáncer, y su asociación con características clínicas. Los alumnos tendrán la oportunidad de aprender sobre las herramientas en línea y su utilización, a través de demostraciones y ejercicios. Se espera que los estudiantes tengan un conocimiento básico de cáncer y genómica del cáncer. Dado la naturaleza del curso teórico-práctico se requiere que el alumno cuente con computadora personal

Objetivos

A través de los temas abordados se introducirá al alumno a la biología básica de la genómica moderna y las herramientas para su análisis a través de la discusión de conceptos claves en bioinformática y ciencia de datos, es decir revisaremos herramientas y aplicaciones públicas para poder analizar los datos y obtener resultados que puedan ser interpretados y utilizados para diferentes propósitos.

Dinámica de la clase
-Introducción de los temas a través de exposición de conceptos y en algunas ocasiones discusión de artículos científicos. - Realización de ejercicios basados en problemas y su análisis a través de herramientas públicas.
- Realización de proyecto final donde se apliquen los conocimientos obtenidos

Temario

Módulo 1: 
1. Introducción (4 h, Sandra Romero 2h, Ivan Salido 2h)
• ¿Qué es un genoma del cáncer y por qué nos importa?
• ¿Cómo podemos usar los genomas para comprender el cuerpo sano y combatir las enfermedades?
• ¿Cómo podrían los genomas permitirnos predecir problemas de salud antes de que ocurran?
• ¿Cómo funcionan las tecnologías masivas?: secuenciación de nueva generación, microarreglos, nanostring, PCR digital, análisis de célula única. • Repositorios públicos: Geo omnibus, TCGA (gdac, cbioportal, UCSC Xena), ICGC, Genome Browser
• Tipo de datos, accesibilidad
• Como obtener datos de bases públicas (abiertos o bajo autorización)
• Bases de datos especializadas

2. Análisis de microarreglos con herramientas públicas (4 h Sandra Romero)

Normalización, expresión diferencial visualización.

Introducción a GenePattern y BART

 

Módulo 2: Uso de la plataforma bioinformática Galaxy

3. Introducción a Galaxy (4 hrs: Iván Salido 2h, Sandra Romero 2h)

• Presentación de la interface de Galaxy
• Preparación y carga de archivos
• Uso de herramientas y módulos de análisis bioinformáticos

• Manejo de historias
• Visualización y extracción de flujos de trabajo

 

4. Manejo de datos de NGS (4 hrs: Iván Salido 2h, Sandra Romero 2h)

• Exploración y manejo de archivos FASTQ
• Evaluación de la calidad de alineamiento a partir de archivos FASTQ

• Mapeo de secuencias genómicas usando un genoma de refencia
• Evaluación de la profundidad de secuenciación
• Remoción de duplicados y recalibración y filtrado de bases
• Exploración y manejo de archivos BAM
• Visualización de resultados del alineamiento
• Procesamiento de datos de secuenciación Pair-end y Single-end

 

5. Introducción al análisis de datos trascriptomicos usando datos de RNA-seq I (4 hrs Ivan Salido)

 • Introducción a la Transcriptómica
• Preparación de archivos
• Evaluación de la calidad de la secuenciación usando archivos FASTQ

• Preprocesamiento de lecturas (Trimming) • Mapeo de lecturas

6. Introducción al análisis de datos trascriptómicos usando datos de RNA-seq II (4 hrs: : Ivan Salido 2h, Sandra Romero 2h)

• Detección y cuantificación de transcritos
• Análisis de expresión diferencial
• Análisis de Enriquecimiento de genes

 

7. Análisis downstream (4 hrs Sandra Romero)

  • Análisis de enriquecimiento de vías
  • GSEA
  • Visualización gráfica de Resultados usando Volcano plot y heatmap2

 

Módulo 3

8. Descubrimiento de variantes de un solo nucleótido (SNP) y deleciones e inserciones cortas (Indels) con datos de NGS I (4 hrs Ivan Salido )

• Introducción al análisis de SPNs e Indels
• Llamado de SPNs e Indels en genomas diploides
 

9. Descubrimiento de variantes de un solo nucleótido (SNP) y deleciones e inserciones cortas (Indels) con datos de NGS I (4 hrs Iván Salido )

• Identificación de variantes germinales y somáticas
• Exploración y manipulación de archivos VCF
• Anotación funcional de SNPs e Indels

10. Análisis downstream  (4 hrs Sandra Romero )

Visualización y análisis en IGV

Mutaciones significantes

Firmas mutacionales

GISTIC

 

Módulo 4

11. Métodos bioinformáticos para el análisis de datos de chip-seq (4 hrs: Iván Salido)

12. Análisis dedicados (4 hrs Sandra Romero)

Clustering: caso de estudio a través de definir infiltración inmune de tumores Herramientas de deconvolución.
Visualización dedicada
Análisis de datos en plataforma cBioportal y Xena

Módulo 5
13. Presentación de proyectos finales (4 hrs: Iván Salido 2h, Sandra Romero 2h)

Descargables

Circuito de Posgrado, Ciudad Universitaria
Alcaldía Coyoacán, C.P. 04510, México, CDMX

55 5623 7006
mdcbq@posgrado.unam.mx
UNAM Posgrado