Mon profil

Sipina

Sipina

Mon blog

Sipina - Arbres de décision

sipina (Sipina - Arbres de décision)

Créé le 11/03/2008

Catégorie : science

Sipina : fonctionnalités et références
  • Arbres de décision,
  • Data mining,
  • Sipina

Mes derniers articles

  • Publié il y a 1 mois

    Description. Dans une analyse, les coûts de mauvais classement sont rarement unitaires et symétriques. Dans un problème à 2 classes (malade vs. non-malade par exemple), diagnostiquer l'absence de...

  • Publié il y a 1 mois

    Description. C'est une généralisation de C4.5 où, plutôt que d'utiliser l'entropie de Shannon pour le calcul du gain ratio, nous introduisons les entropies généralisées de type beta. L'algorithme...

  • Publié il y a 1 mois

    Description. La méthode de référence au sein de la communauté « apprentissage automatique ». Vers la fin des années 1980, Quinlan a publié d'innombrables variantes de son algorithme de base, Id3...

  • Publié il y a 1 mois

    Description. Ma méthode préférée, celle que je présente en priorité dans mes enseignements. Elle est directement dérivée de Chaid. Elle apporte quelques améliorations : le critère t de Tschuprow...

  • Publié il y a 1 mois

    Description. Chaid est la variante supervisée (variable à prédire catégorielle) des techniques issues de Aid (morgan et Sonquist, 1963), considérée comme l'ancêtre de toutes les méthodes de...

  • Publié il y a 1 mois

    Description. Assistant 86 fait partie des méthodes dérivées de Id3 (quinlan, 1979). Elle introduit un certain nombre d'améliorations destinées à mieux guider l'induction. L'arbre construit est...

  • Publié il y a 1 mois

    Description. Gid3 est une " généralisation " de Id3 dans le sens où, lors d'une segmentation, les modalités non informatives de la variable de partitionnement sont fusionnées. L'objectif est de ne...

  • Publié il y a 1 mois

    Description. Id3-iv (1986) est la (une des) dernière version de Id3, avant que Quinlan ne se tourne vers le post-élagage avec C4 puis C4.5 (et les autres versions commerciales, non publiées qui...

  • Publié il y a 1 mois

    Description. Catlett (1991) est certainement un des premiers data miner de l’histoire. Son seul tort est d’avoir eu raison trop tôt. En effet, plusieurs années avant la grande vague du data mining...

  • Publié il y a 1 mois

    Stratégie d'échantillonnage pour les arbres de décision. Dans tous les algorithmes d'induction d'arbres, Sipina introduit une option d'échantillonnage. L'idée est la suivante : plutôt que de...

La page que vous lisez est réalisée automatiquement à partir de l’ensemble des contenus publiés sur les blogs hebergés par overblog. En savoir plus sur les algorithmes d’overblog