Bases de données de puces à ADN - Microarray databases
Une base de données de microréseaux est un référentiel contenant des données d' expression génique de microréseaux . Les principales utilisations d'une base de données de puces à ADN sont de stocker les données de mesure, de gérer un index interrogeable et de mettre les données à la disposition d'autres applications pour analyse et interprétation (soit directement, soit via des téléchargements d'utilisateurs).
Les bases de données de puces à ADN peuvent appartenir à deux classes distinctes:
- Un référentiel public révisé par des pairs qui adhère aux normes académiques ou industrielles et est conçu pour être utilisé par de nombreuses applications et groupes d'analyse. Un bon exemple de ceci est le Gene Expression Omnibus (GEO) de NCBI ou ArrayExpress d' EBI .
- Un référentiel spécialisé associé principalement à la marque d'une entité particulière (laboratoire, entreprise, université, consortium, groupe), une suite d'applications, un sujet ou une méthode d'analyse, qu'elle soit commerciale, à but non lucratif ou académique. Ces bases de données peuvent présenter une ou plusieurs des caractéristiques suivantes:
- Un abonnement ou une licence peut être nécessaire pour obtenir un accès complet,
- Le contenu peut provenir principalement d'un groupe spécifique (par exemple SMD ou UPSC-BASE), le projet du génome immunologique
- Il peut y avoir des contraintes sur qui peut utiliser les données ou à quelles fins les données peuvent être utilisées,
- Une autorisation spéciale peut être requise pour soumettre de nouvelles données, ou il peut n'y avoir aucun processus évident du tout,
- Seules certaines applications peuvent être équipées pour utiliser les données, souvent également associées à la même entité (par exemple, caArray au NCI est spécialisé pour le caBIG ),
- Un traitement supplémentaire ou un reformatage des données peut être nécessaire pour des applications ou une analyse standard,
- Ils prétendent répondre au «besoin urgent» d'avoir un référentiel standard et centralisé pour les données des puces à ADN. (Voir YMD, dernière mise à jour en 2003, par exemple),
- Il y a une revendication d'une amélioration progressive par rapport à l'un des référentiels publics,
- Une application de méta-analyse , qui intègre des études d'une ou plusieurs bases de données publiques (par exemple, Gemma utilise principalement des études GEO ; NextBio utilise diverses sources)
Certaines des bases de données de puces à ADN publiques les plus connues sont:
| Base de données | Portée | Ensembles d'expérimentation sur microréseau | Exemples de profils | À la date |
|---|---|---|---|---|
| ArrayTrack | ArrayTrack héberge des données publiques et privées, y compris des données de référence MAQC, avec des outils d'analyse intégrés | 1622 | 50 093 | Février 2012 |
| NCI mAdb | Héberge les données NCI avec des outils d'analyse et de statistiques intégrés | ? | 105 000 | Mars 2012 |
| Base de données ImmGen | Accès ouvert à toutes les cellules du système immunitaire; données d'expression, expression différentielle, clusters corégulés, régulation | 267 | 1059 | Janvier 2012 |
| Genevestigator | Moteur de recherche d'expression génique basé sur des jeux de données de puces à ADN publics et propriétaires et d'ARN-seq sélectionnés manuellement, bien annotés | 3228 | 232 855 | Octobre 2016 |
| Omnibus d'expression génique - NCBI | toute étude d'abondance moléculaire conforme à MIAME | 25859 | 641770 | 28 octobre 2011 |
| ArrayExpress chez EBI | Toute donnée de transcriptomique conforme MIAME ou MINSEQE organisée | 24838 | 708914 | 28 octobre 2011 |
| Base de données Stanford Microarray | base de données privée et publiée sur l'abondance des microréseaux et des molécules | 82542 | ? | 23 octobre 2011 |
| L'Atlas du génome du cancer (TCGA) | collecte de données d'expression pour différents cancers | 21229 | ? | 30 août 2013 |
| Système GeneNetwork | Tableaux standard en libre accès, tableaux d'exons et données RNA-seq pour l'analyse génétique (études eQTL) avec suite d'analyse | ~ 100 | ~ 10 000 | Juillet 2010 |
| Base de données des microréseaux modENCODE UNC | Client Nimblegen 2,1 millions de baies | ~ 6 | 180 | 17 juillet 2009 |
| UPSC-BASE | données générées par l'analyse de puces à ADN au Umeå Plant Science Center (UPSC). | ~ 100 | ? | 15 novembre 2007 |
| Base de données UPenn RAD | Études publiques et privées conformes à MIAME , associées à ArrayExpress | ~ 100 | ~ 2500 | 1 septembre 2007 |
| Base de données UNC Microarray | fournit le service pour le stockage, la récupération, l'analyse et la visualisation de données de puces à ADN | ~ 31 | 2093 | 1 avril 2007 |
| Base de données MUSC | La base de données est un référentiel de données de puces à ADN générées par les chercheurs MUSC ainsi que par les chercheurs de la communauté mondiale de la recherche. | ~ 45 | 555 | 1 avril 2007 |
| caArray chez NCI | Données sur le cancer, préparées pour analyse sur caBIG | 41 | 1741 | 15 novembre 2006 |
Voir également
- Base de données biologique
- Liste des bases de données biologiques
- Puce ADN
- Techniques d'analyse des puces à ADN
Liens externes
- ArrayExpress: visite rapide sur EBI Train OnLine
- Exploration des données génomiques fonctionnelles avec l'ArrayExpress Archive sur EBI Train OnLine
- Étude des modèles d'expression génique avec l'Atlas d'expression génique sur EBI Train OnLine
- ArrayExpress: Soumission de données à l'aide de MAGE-TAB sur EBI Train OnLine
- ArrayExplorer - Un outil gratuit pour comparer les microarrays côte à côte.