MoDa-A Data Warehouse pour les donnandeacute;es multi-andlaquo; omiques andraquo;

Sudeshna Guha Neogi; Maria Krestyaninova; Misha Kapushesky; Ibrahim Emam; Alvis Brazma; Ugis Sarkans

Indexé dans

Base de données des revues académiques
Ouvrir la porte J
Genamics JournalSeek
JournalTOCs
RechercheBible
Répertoire des périodiques d'Ulrich
Bibliothèque des revues électroniques
RechercheRef
Université Hamdard
EBSCO AZ
OCLC - WorldCat
érudit
Catalogue en ligne SWB
Bibliothèque virtuelle de biologie (vifabio)
Publions
MIAR
Fondation genevoise pour la formation et la recherche médicales
Pub européen
Google Scholar

Liens utiles

Partager cette page

Dépliant de journal

Revues en libre accès

Abstrait

MoDa-A Data Warehouse pour les données multi-« omiques »

Sudeshna Guha Neogi, Maria Krestyaninova, Misha Kapushesky, Ibrahim Emam, Alvis Brazma, Ugis Sarkans

La gamme de diverses technologies « omiques » pour mesurer les propriétés des entités biomoléculaires (par exemple, les transcriptions, les protéines, les métabolites) dans des échantillons biologiques de manière à haut débit continue de s'élargir. Des systèmes d'information permettant une exploration intégrative des résultats de telles expériences sont nécessaires. Nous avons développé un système, MoDa (Molecular Data warehouse), qui fournit un cadre unifié pour la recherche et la visualisation des résultats de diverses techniques expérimentales de biologie moléculaire. L'architecture de l'entrepôt est optimisée pour divers types de filtrage et d'interrogation des annotations d'échantillons, des résultats expérimentaux et des propriétés des gènes et d'autres entités moléculaires. La mise en œuvre est basée sur la technologie BioMart, avec des moyens améliorés pour manipuler des données multidimensionnelles. L'interface utilisateur est une application Web. Une considération importante pour chaque projet d'entreposage de données est l'acquisition et le nettoyage des données. Pour garantir que les données téléchargées dans l'entrepôt sont cohérentes et suffisamment bien annotées pour des analyses statistiques ultérieures, nous avons mis en place un référentiel pour les données d'échantillons et de sujets de recherche, les métadonnées expérimentales et les résultats expérimentaux. Un pipeline de réannotation de gènes a été utilisé pour fournir un système de référence uniforme pour les données collectées selon la dimension bioentité (« gène »). Nous espérons que l'infrastructure d'entreposage de données développée pourra être utile pour les projets collaboratifs utilisant des technologies de biologie moléculaire à haut débit.

Avertissement: Ce résumé a été traduit à l'aide d'outils d'intelligence artificielle et n'a pas encore été examiné ni vérifié

Journal of Data Mining en génomique et protéomique