Quelle est la différence entre le regroupement hiérarchique et la classification aléatoire des forêts?


Réponse 1:

Premièrement, le clustering est un algorithme ML non supervisé, il fonctionne sur des données non étiquetées. Random Forest est un algorithme d'apprentissage supervisé, il fonctionne sur des données étiquetées (à la fois la régression et la classification).

Deuxièmement, voici comment ils fonctionnent

Le clustering hiérarchique regroupe les données dans les hiérarchies, de deux manières: de haut en bas, de bas en haut.

Top Down - Nous commençons par un cluster (contenant toutes les données) et descendons, créant un nouveau cluster qui correspond le moins aux autres données à chaque étape de manière itérative jusqu'à ce que nous ayons un cluster pour chaque point de données.

De bas en haut - Nous commençons par n clusters pour n points de données à puis combinons 2 clusters ayant une similitude maximale en un seul à chaque étape de manière itérative, jusqu'à ce que nous ayons un seul cluster.

Voici comment fonctionne Random Forest-

सौरभ Réponse de Singh à Comment fonctionne la forêt aléatoire pour la régression?