Ensamble y Anotación de Genomas y Metagenomas
Datos generales
Código: ENSAMBLE
Duración: 40 horas
Nivel: básico
Idioma: español
Fecha: del 23 al 27 de noviembre de 2020
Horario: lunes a jueves 9:00 -17:00, viernes 9:00-14:00
Modalidad: Online
¿Qué aprenderás?
Al final del curso los participantes:
- Tendrán conocimientos teóricos sobre las principales tecnologías de secuenciación de DNA.
- Adquirirán conocimientos teóricos y prácticos sobre:
- las metodologías para realizar análisis de calidad y de limpieza de lecturas de secuenciación (archivos fastq),
- el ensamble y anotación de genomas y metagenomas,
- análisis de clasificación taxonómica de lecturas y contigs (regiones genómicas ensambladas) de origen metagenómico (no se considera análisis de datos de 16S).
Pre-requisitos
Requisitos de conocimientos previos
- Unix a nivel intermedio. Todas las demostraciones de software se harán en este sistema operativo.
Los participantes necesitan tener conocimientos de nivel intermedio en la línea de comandos de UNIX/Linux, entre los cuales se encuentran los comandos de manejo de archivos y directorios (rm, mkdir, cd, less, cut, sort,uniq, etc), formateo de datos (awk o perl command line, sed). - Estadística básica.
Se requieren conocimientos básicos de estadística (conceptos básicos: media, mediana, desviación estándar, distribuciones estadísticas, pruebas de hipótesis, logaritmos).
Requisitos técnicos
- El alumno deberá usar su computadora personal. Ésta deberá tener instalado MobaXterm (Windows), o alguna otra herramienta que nos permita realizar conexión SSH al servidor.
- Aplicación Zoom instalada en la computadora que será utilizada durante el curso. Se puede descargar de la página de descargas del cliente de reuniones Zoom (requisitos del sistema).
- Conexión a Internet
Descripción
El taller presenta las tecnologías de NGS y las metodologías para el ensamblado de genomas y metagenomas, de novo, así como su anotación. Así mismo, se abordará la clasificación taxonómica de lecturas y contigs de origen metagenómico (no se considera análisis de datos de 16S). Este curso está enfocado primordialmente en el manejo práctico de las herramientas computacionales y la correcta interpretación de los resultados.
Contenido*
El contenido del curso consiste en los siguientes temas:
- Unidad 1
- Bienvenida
- Conexión al servidor, creación de directorios, y archivos de trabajo.
- Unidad 2
- Análisis de Calidad: FastQC
- Limpieza de secuencias: Trimmomatic
- Limpieza de secuencias: Trim Galore
- Unidad 3
- Ensamble de genomas: Lecturas cortas (Velvet)
- Ensamble de genomas: Lecturas cortas (SPAdes)
- Ensamble de genomas: Lecturas largas (Canu)
- Ensamble de genomas: Lecturas largas y cortas (SPAdes)
- Unidad 4
- Comparación y validación de ensambles: QUAST
- Mapeo y visualización: Bowtie 2
- Mapeo y visualización: SAMtools y Artemis
- Unidad 5
- Anotación funcional: Glimmer3
- Anotación funcional: BLAST
- Anotación funcional: Prokka
- Unidad 6
- Ensamble de metagenomas: metaSPAdes
- Ensamble de metagenomas: MEGAHIT
- Ensamble de metagenomas: IDBA_UD
- Anotación de ensambles metagenómicos: Prokka
- Comparación de ensambles metagenómicos: QUAST
- Unidad 7
- Clasificación taxonómica: MetaPhlAn2
- Clasificación taxonómica: KRAKEN
- Clasificación taxonómica: Kaiju
- Comparación de clasificaciones taxonómicas
- Unidad 8
- Conclusiones y despedida
* Sujeto a cambios
Software usado
- Velvet
- IDBA_UD
- Spades
- Megahit
- MUMMER
- BOWTIE
- Quast
- SMALT
- Artemis
- FastQC
- IGV
- AUGUSTUS
- Glimmer3
- Artemis
- Kraken2
- Metaphlan2
- Kaiju
- MaxBin
¿Quién es nuestra audiencia?
El curso va dirigido a estudiantes e investigadores en genómica, genética, bioinformática o ciencias computacionales, con especial interés en el manejo de datos genómicos y ensamblado de genomas, y/o que sus proyectos de investigación se vean beneficiados con este conocimiento.
Formato del curso: en línea
Este es un curso digital. Las sesiones y material del curso serán presentados en línea. Esta modalidad incluirá grabaciones de video o audio del material, intercambio de archivos y sesiones de discusión temáticos, ejercicios de auto-evaluación y acceso a los instructores para comentarios durante el curso.
Profesores

Dr. Luis Lozano
Unidad de Análisis Bioinformáticos (UAB)
Centro de Ciencias Genómicas
UNAM