Gonapa Vasudha
L'exploration de données est un processus de découverte de modèles dans de grands ensembles de données impliquant des méthodes à l'intersection de l'apprentissage automatique, des statistiques et des systèmes de bases de données. L'exploration de données est un sous-domaine interdisciplinaire de l'informatique et des statistiques dont l'objectif général est d'extraire des informations (avec des méthodes intelligentes) d'un ensemble de données et de transformer les informations en une structure compréhensible pour une utilisation ultérieure. L'exploration de données est l'étape d'analyse du processus de « découverte de connaissances dans les bases de données », ou KDD. Outre l'étape d'analyse brute, elle implique également des aspects de gestion des bases de données et des données, le prétraitement des données, les considérations relatives aux modèles et aux inférences, les mesures d'intérêt, les considérations de complexité, le post-traitement des structures découvertes, la visualisation et la mise à jour en ligne.