Configuration nécessaire pour l’analyse et le stockage des données. illumina Covaris LE220, Caliper GX, Instrument HiSeq X, M, Hamilton Microlab STAR, Gemini XPS, HiSeq X Five, cBot, LightCycler 480, HiSeq X Ten
Configuration nécessaire pour l’analyse et le stockage des données
Pour chaque Flow Cell, une analyse de séquençage ainsi qu’une analyse secondaire ultérieure génèrent des fichiers dont les tailles approximatives sont les suivantes :
} Fichiers BCL : 620 Go
}
Dossier Thumbnail Images (Vignettes) : 60 Go
}
Dossier InterOp : 75 à 80 Mo
}
Fichiers FASTQ : 700 Go
} Fichiers BAM : 600 Go
}
Fichiers VCF : 28 Go
Les renseignements suivants sont fournis pour vous guider dans la construction d’une infrastructure destinée à prendre en charge les données créées grâce au système HiSeq X.
Les délais d’analyse fournis sont des exemples et ne représentent pas les spécifications
Illumina.
REMARQUE
Étant donné que la rétention effective de données peut faire l’objet de politiques locales, confirmez les conditions avant de calculer les besoins en matière de stockage.
Ces renseignements se basent sur le fait qu’une analyse de double Flow Cell génère
1,8 térabase (Tb) de données pour une utilisation à 100 % sur chaque instrument. Ajustez les chiffres fournis par le tableau pour un taux d’utilisation inférieur. Si vous envisagez d’effectuer une analyse répétée d’ensembles de données, augmentez le nombre de nœuds de calcul et le stockage de manière proportionnelle.
REMARQUE
Les recommandations suivantes ne comprennent pas le stockage destiné à la sauvegarde et à l’archivage des données.
Nombre de nœuds de calcul³
Durée de l’analyse de séquençage du génome entier 30X
Stockage en ligne
BAM
10 analyses/mois par système¹
Stockage en ligne VCF
10 analyses/mois par système
Stockage d’archives
BAM
120 analyses/an par système⁴
Stockage d’archives
VCF
120 analyses/an par système
Cinq
Algorithmes Illumina¹ instruments
Dix instruments
Par instrument supplémentaire
7 14 2
6 heures
60 To
1,5 To
720 To
18 To
6 heures
120 To
3 To
1 440 To
36 To
6 heures
12 To
0,3 To
144 To
3,6 To
Cinq instruments
43
BWA + GATK²
Dix instruments
85
Par instrument supplémentaire
9
38 heures
60 To
1,5 To
720 To
18 To
38 heures
120 To
3 To
1 440 To
36 To
38 heures
12 To
0,3 To
144 To
3,6 To
¹ Analyse de séquençage du génome entier à l’aide de HiSeq Analysis Software v2.0.
Guide d’aménagement du laboratoire et de préparation du site du système HiSeq X
23
² BWA v 0.7.9a; GATK v1.6.
³ Par nœud, 20 cœurs de processeur à 2,8 GHz, 128 Go de mémoire, 6 disques durs de
1 téraoctet (To). Améliorez la vitesse en augmentant le nombre de cœurs ou la vitesse d’horloge du processeur. La couverture maximale prise en charge est > 240X.
⁴ Le stockage de données de séquençage brutes sous forme de fichiers BCL et FASTQ à long terme n’est pas nécessaire. Ces fichiers peuvent être supprimés après la création des fichiers
BAM/VCF. Si nécessaire, il est possible de recréer les fichiers FASTQ à partir des fichiers BAM.
24
Document nº 15050093 v02 FRA

Enlace público actualizado
El enlace público a tu chat ha sido actualizado.