Bases de datos de microarrays - Microarray databases
Una base de datos de microarrays es un depósito que contiene datos de expresión génica de microarrays . Los usos clave de una base de datos de microarrays son almacenar los datos de medición, administrar un índice de búsqueda y hacer que los datos estén disponibles para otras aplicaciones para su análisis e interpretación (ya sea directamente o mediante descargas del usuario).
Las bases de datos de microarrays pueden clasificarse en dos clases distintas:
- Un repositorio público revisado por pares que se adhiere a los estándares académicos o de la industria y está diseñado para ser utilizado por muchas aplicaciones y grupos de análisis. Un buen ejemplo de esto es el Gene Expression Omnibus (GEO) de NCBI o ArrayExpress de EBI .
- Un repositorio especializado asociado principalmente con la marca de una entidad en particular (laboratorio, empresa, universidad, consorcio, grupo), un conjunto de aplicaciones, un tema o un método de análisis, ya sea comercial, sin fines de lucro o académico. Estas bases de datos pueden tener una o más de las siguientes características:
- Es posible que se necesite una suscripción o licencia para obtener acceso completo,
- El contenido puede provenir principalmente de un grupo específico (por ejemplo, SMD o UPSC-BASE), el Immunological Genome Project
- Puede haber restricciones sobre quién puede usar los datos o con qué propósito se pueden usar los datos,
- Es posible que se requiera un permiso especial para enviar nuevos datos, o puede que no haya ningún proceso obvio en absoluto,
- Solo ciertas aplicaciones pueden estar equipadas para usar los datos, a menudo también asociadas con la misma entidad (por ejemplo, caArray en NCI está especializado para caBIG ),
- Es posible que se requiera procesamiento adicional o reformateo de los datos para aplicaciones estándar o análisis,
- Afirman abordar la 'necesidad urgente' de tener un repositorio centralizado estándar para datos de microarrays. (Ver YMD, actualizado por última vez en 2003, por ejemplo),
- Existe un reclamo de una mejora incremental sobre uno de los repositorios públicos,
- Una aplicación de metanálisis , que incorpora estudios de una o más bases de datos públicas (por ejemplo, Gemma usa principalmente estudios GEO ; NextBio usa varias fuentes)
Algunas de las bases de datos de microarrays seleccionadas y públicas más conocidas son:
| Base de datos | Alcance | Conjuntos de experimentos de microarrays | Perfiles de muestra | A partir de la fecha |
|---|---|---|---|---|
| ArrayTrack | ArrayTrack aloja datos tanto públicos como privados, incluidos los datos de referencia MAQC, con herramientas de análisis integradas | 1622 | 50,093 | Febrero de 2012 |
| MAdb NCI | Aloja datos del NCI con herramientas integradas de análisis y estadísticas | ? | 105.000 | Mar. De 2012 |
| Base de datos ImmGen | Acceso abierto a todas las células del sistema inmunológico; datos de expresión, expresión diferencial, agrupaciones correguladas, regulación | 267 | 1059 | Ene. De 2012 |
| Genevestigador | Motor de búsqueda de expresión génica basado en conjuntos de datos de RNA-seq y microarrays públicos y patentados seleccionados manualmente y bien anotados | 3228 | 232,855 | Octubre de 2016 |
| Ómnibus de expresión genética - NCBI | cualquier estudio curado de abundancia molecular compatible con MIAME | 25859 | 641770 | 28 de octubre de 2011 |
| ArrayExpress en EBI | Cualquier dato de transcriptómica curado compatible con MIAME o MINSEQE | 24838 | 708914 | 28 de octubre de 2011 |
| Base de datos de microarrays de Stanford | microarrays privados y publicados y base de datos de abundancia de moléculas (ahora desaparecida) | 82542 | ? | 23 de octubre de 2011 |
| Atlas del genoma del cáncer (TCGA) | recopilación de datos de expresión para diferentes cánceres | 21229 | ? | 30 de agosto de 2013 |
| Sistema GeneNetwork | Matrices estándar de acceso abierto, matrices de exones y datos de RNA-seq para análisis genético (estudios eQTL) con suite de análisis | ~ 100 | ~ 10000 | Julio de 2010 |
| Base de datos de microarrays UNC modENCODE | Cliente de Nimblegen 2,1 millones de arreglos | ~ 6 | 180 | 17 de julio de 2009 |
| UPSC-BASE | datos generados por análisis de microarrays dentro del Centro de Ciencias Vegetales de Umeå (UPSC). | ~ 100 | ? | 15 de noviembre de 2007 |
| Base de datos UPenn RAD | Estudios públicos y privados compatibles con MIAME , asociados con ArrayExpress | ~ 100 | ~ 2500 | 1 de septiembre de 2007 |
| Base de datos de microarrays UNC | proporciona el servicio de almacenamiento, recuperación, análisis y visualización de datos de microarrays | ~ 31 | 2093 | 1 de abril de 2007 |
| Base de datos MUSC | La base de datos es un depósito de datos de microarrays de ADN generados por investigadores de MUSC, así como por investigadores de la comunidad de investigación global. | ~ 45 | 555 | 1 de abril de 2007 |
| caArray en NCI | Datos sobre el cáncer, preparados para su análisis en caBIG | 41 | 1741 | 15 de noviembre de 2006 |
Ver también
- Base de datos biológica
- Lista de bases de datos biológicas
- Micromatriz de ADN
- Técnicas de análisis de microarrays
enlaces externos
- ArrayExpress: recorrido rápido en EBI Train OnLine
- Exploración de datos genómicos funcionales con ArrayExpress Archive en EBI Train OnLine
- Investigando patrones de expresión génica con el Atlas de expresión génica en EBI Train OnLine
- ArrayExpress: envío de datos mediante MAGE-TAB en EBI Train OnLine
- ArrayExplorer : una herramienta gratuita para comparar microarrays uno al lado del otro.