Uncategorized

Gradient Boosting, comment ça marche?

Après le Bagging et l’algorithme Random Forest j’avais envie de creuser un peu plus le boosting avec le cas particulier de l’algorithme Gradient Boosting Machine (GBM). Il s’agit là encore d’une méthode d’agrégation de modèles et je vous propose de découvrir le principe de fonctionnement de cet algorithme.

k-means, comment ça marche?

Le k-means est un algorithme de clustering, en d’autres termes il permet de réaliser des analyses non supervisées, d’identifier un pattern au sein des données et de regrouper les individus ayant des caractéristiques similaires. C’est une méthode simple et rapide. Le cas d’usage le plus classique pour les méthodes de clustering c’est la segmentation client. …

k-means, comment ça marche? Lire la suite »

Random Forest, comment ça marche?

Dans cet article je vous explique simplement comment fonctionne un algorithme de Random Forest (forêt aléatoire) pour faire de la prédiction. Quand et comment l’utiliser, c’est par ici …

Un arbre de décision avec R

Après mon article sur le fonctionnement de l’algorithme Decision Tree (disponible ici), voici une manière de le mettre en oeuvre sous R.   Nous allons implémenter un arbre CART. Dans mon précédent article j’utilisais l’entropie comme critère de sélection, ici avec l’arbre CART, c’est l’indice de Gini qui est utilisé.   Chargement des librairies On …

Un arbre de décision avec R Lire la suite »

Arbre de décision, comment ça marche?

L’arbre de décision (decision tree en anglais) c’est un algorithme de machine learning facile et interprétable, idéal quand on débute en Data Science. Nous allons voir quels sont ses avantages et inconvénients, quand l’utiliser avec des explications simples sur son fonctionnement.