Exercice 4 : visualisation - IGV
La visualisation se fait à l'aide du logiciel IGV sur votre ordinateur. Pour cela, il vous faut disposer :
- du fasta du génome de référence et son index (
.faet.fai), - des fichiers d'alignements et leur index (
.bamet.bai).
Le logiciel IGV permet de charger des données à partir d'une URL, c'est l'option que nous allons choisir en utilisant de nouveau notre répertoire public_html.
Copier dans votre public_html les fichiers nécessaires :
cp *.fa *.fai *.bam *.bai ~/public_html- du fasta du génome de référence et son index (
Si non-installé, télécharger IGV : http://www.broadinstitute.org/software/igv/download comme décrit dans la page ressources d'une autre formation.
Lancer IGV et charger les données (inspirez-vous du mode d'emploi décrit sur cette page ressources mais en utilisant les fonctions de chargement à partir d'URL et non de fichier).
- Charger le génome en indiquant l'URL du fichier fasta, IGV chargera l'index trouvé dans le même répertoire.
- Charger les alignements en indiquant les URL des
.bamet des.bai.
Explorer les résultats :
Afficher les informations relatives à une lecture.
SolutionClic sur une lecture : affichage des informations contenues dans le bam.
Quels sont les champs du format SAM qui ne sont pas affichés dans ce menu ?
SolutionHidden tags: XA, MD, RG.
Afficher les lectures afin de visualiser les paires.
SolutionClic droit sur la piste du bam et sélectionner « View as pairs ».
Afficher de nouveau les informations relatives à une lecture. Quel est l'avantage du mode « Vue par paire » ?
SolutionLe menu affiche les données des deux lectures de la paire.
Rendez-vous en position 25:13,657-15,407. Pourquoi certaines lectures ne sont-elles pas colorées ? A quoi cela est-il dû ?
SolutionLes lectures non colorées ont une MAPQ égale à zéro. Classiquement, cela est dû au fait que plusieurs localisations équiprobables ont été trouvées pour cette paire. Les autres localisations sont indiquées dans le tag XA qui n'est pas présenté dans le menu. Il faut donc rechercher les données de localisations alternatives dans le bam. Exemple :
samtools view SRR7062654.bam | grep SRR7062654.79295892Quel est le type de subtitution à la position 25:5,825 ?
SolutionC/T
Trouver un SNP qui discrime les deux individus.
Solution25:13,066
- SRR7062654 C/C
- SRR7062655 G/G
25:21,156
- SRR7062654 A/A
- SRR7062655 C/C