El curso es eminentemente práctico
y el programa tiene en cuenta 2,5 días de trabajo con una duración total de 16
horas de trabajo presencial. Los aspectos a tratar serán:
1- Trabajar
en entorno Linux/Unix. Tutorial interactivo (4 horas)
·
Fundamentos de Linux
·
Gestión de archivos grandes
·
Ejecutar grandes trabajos
·
Ejecución de Linux desde su PC
2- Bioinformática
básica. Introducción: Formato de ficheros NGS. Uso de ficheros de bases de
datos públicas (formato SRA).
3- Workflow de análisis WGSeq para identificación
de variantes en secuencias genómicas
·
Trabajo con
ficheros SRA
·
Control de calidad (QC) de los datos brutos: Trimmomatic
·
Alineación de secuencia frente al genoma de
referencia
·
Manipulación de ficheros con Samtools
·
Identificación de SNVs con GATK
·
Anotación funcional con VEP
·
Manejo de archivos vcf y utilización de la
herramienta PLINK