Sandeacute;lection de caractandeacute;ristiques basandeacute;e sur la thandeacute;orie de land#39;information pour un classificateur bayandeacute;sien naandiuml;f multi-relationnel

Vimalkumar B Vaghela; Kalpesh H V; ra et Nilesh K Modi

Indexé dans

Base de données des revues académiques
Ouvrir la porte J
Genamics JournalSeek
JournalTOCs
RechercheBible
Répertoire des périodiques d'Ulrich
Bibliothèque des revues électroniques
RechercheRef
Université Hamdard
EBSCO AZ
OCLC - WorldCat
érudit
Catalogue en ligne SWB
Bibliothèque virtuelle de biologie (vifabio)
Publions
MIAR
Fondation genevoise pour la formation et la recherche médicales
Pub européen
Google Scholar

Liens utiles

Partager cette page

Dépliant de journal

Revues en libre accès

Abstrait

Sélection de caractéristiques basée sur la théorie de l'information pour un classificateur bayésien naïf multi-relationnel

Vimalkumar B Vaghela, Kalpesh H Vandra et Nilesh K Modi

Aujourd'hui, les données sont stockées dans des structures relationnelles. Dans l'approche habituelle pour exploiter ces données, nous utilisons souvent la jonction de plusieurs relations pour former une seule relation à l'aide de liens de clé étrangère, ce qui est connu sous le nom d'aplatissement. L'aplatissement peut entraîner des problèmes tels que la perte de temps, la redondance des données et l'asymétrie statistique des données. Par conséquent, des problèmes critiques se posent quant à la manière d'exploiter directement les données sur de nombreuses relations. La solution au problème donné est l'approche appelée exploration de données multi-relationnelles (MRDM). D'autres problèmes sont que les attributs non pertinents ou redondants dans une relation peuvent ne pas contribuer à la précision de la classification. Ainsi, la sélection des caractéristiques est une étape essentielle de prétraitement des données dans l'exploration de données multi-relationnelles. En filtrant les caractéristiques non pertinentes ou redondantes des relations pour l'exploration de données, nous améliorons la précision de la classification, obtenons de bonnes performances temporelles et améliorons la compréhensibilité des modèles. Nous avons proposé la méthode de sélection de caractéristiques basée sur l'entropie pour le classificateur bayésien naïf multi-relationnel. Nous avons utilisé la méthode InfoDist et les paramètres de corrélation de Pearson, qui seront utilisés pour filtrer les fonctionnalités non pertinentes et redondantes de la base de données multi-relationnelle et amélioreront la précision de la classification. Nous avons analysé notre algorithme sur l'ensemble de données financières PKDD et avons obtenu une meilleure précision par rapport aux méthodes de sélection de fonctionnalités existantes.

Avertissement: Ce résumé a été traduit à l'aide d'outils d'intelligence artificielle et n'a pas encore été examiné ni vérifié

Journal of Data Mining en génomique et protéomique