Exercice 4 : visualisation - IGV


  1. La visualisation se fait à l'aide du logiciel IGV sur votre ordinateur. Pour cela, il vous faut disposer :

    • du fasta du génome de référence et son index (.fa et .fai),
    • des fichiers d'alignements et leur index (.bam et .bai).

    Le logiciel IGV permet de charger des données à partir d'une URL, c'est l'option que nous allons choisir en utilisant de nouveau notre répertoire public_html.

    Copier dans votre public_html les fichiers nécessaires :

    cp *.fa *.fai *.bam *.bai ~/public_html
    
  2. Si non-installé, télécharger IGV : http://www.broadinstitute.org/software/igv/download comme décrit dans la page ressources d'une autre formation.

  3. Lancer IGV et charger les données (inspirez-vous du mode d'emploi décrit sur cette page ressources mais en utilisant les fonctions de chargement à partir d'URL et non de fichier).

    • Charger le génome en indiquant l'URL du fichier fasta, IGV chargera l'index trouvé dans le même répertoire.
    • Charger les alignements en indiquant les URL des .bam et des .bai.
  4. Explorer les résultats :

    • Afficher les informations relatives à une lecture.

      Solution

      Clic sur une lecture : affichage des informations contenues dans le bam.

    • Quels sont les champs du format SAM qui ne sont pas affichés dans ce menu ?

      Solution

      Hidden tags: XA, MD, RG.

    • Afficher les lectures afin de visualiser les paires.

      Solution

      Clic droit sur la piste du bam et sélectionner « View as pairs ».

    • Afficher de nouveau les informations relatives à une lecture. Quel est l'avantage du mode « Vue par paire » ?

      Solution

      Le menu affiche les données des deux lectures de la paire.

    • Rendez-vous en position 25:13,657-15,407. Pourquoi certaines lectures ne sont-elles pas colorées ? A quoi cela est-il dû ?

      Solution

      Les lectures non colorées ont une MAPQ égale à zéro. Classiquement, cela est dû au fait que plusieurs localisations équiprobables ont été trouvées pour cette paire. Les autres localisations sont indiquées dans le tag XA qui n'est pas présenté dans le menu. Il faut donc rechercher les données de localisations alternatives dans le bam. Exemple :
      samtools view SRR7062654.bam | grep SRR7062654.79295892

    • Quel est le type de subtitution à la position 25:5,825 ?

      Solution

      C/T

    • Trouver un SNP qui discrime les deux individus.

      Solution
      • 25:13,066

        • SRR7062654 C/C
        • SRR7062655 G/G
      • 25:21,156

        • SRR7062654 A/A
        • SRR7062655 C/C

results matching ""

    No results matching ""