
Cet article concernant lesmathématiques doit êtrerecyclé().

Leclassement automatique ouclassification supervisée est la catégorisationalgorithmique d'objets. Elle consiste àattribuer une classe ou catégorie à chaque objet (ou individu) à classer, en se fondant sur des données statistiques. Elle fait couramment appel à l'apprentissage automatique et est largement utilisée enreconnaissance de formes.
En français, le classement fait référence à l'action de classer donc de « ranger dans une classe ». La classification fait référence à l'action de classifier donc de « déterminer des critères de classement, définir des classes »[1],[2],[3]. En anglais, le termeclassification correspond au premier sens (classement) tandis que le second sens correspond plutôt auclustering.
La littérature scientifique francophone, et l'enseignement académique correspondant, utilisent néanmoins le terme « classification ». On distingue alors la « classification supervisée » qui correspond au classement automatique et la « classification non supervisée »[4].
Nos moyens limités d'entendement nous obligent, pour tenter de comprendre quelque chose au réel, à effectuer desclassifications des objets que nous devons traiter encatégories. Celles-ci ont été considérées par laphilosophie :
La classification automatique vise à créer ces catégories à partir de procédés ne faisant intervenir que les données et pas la subjectivité de l'expérimentateur. Il serait d'ailleurs plus exact de dire : « ne faisant pas intervenir la subjectivité de l'expérimentateur par autre chose que le choix des représentations qu'il utilise » : si l'on classe des objets selon leur plus grande dimension, on n'obtiendra pas en général le même classement qu'en les classant selon leur poids.
Bien que les premières bases de l'approche algorithmique de la classification automatique soient relativement anciennes, ce n'est qu'avec le développement de l'informatique qu'il est devenu possible de les mettre en œuvre sur de grands échantillons de données. Le résultat d'une classification peut être soit unepartition mathématique soit unehiérarchie (mathématiques).
Parmi les différentes méthodes, on peut considérer deux grands types d'approches.
Les approches dites non paramétriques (classification hiérarchique,méthode des centres mobiles) ne considèrent qu'une seule hypothèse : plus deux individus sont proches, plus ils ont de chances de faire partie de la même classe.
La seconde grande famille de méthodes de classification automatique, dites probabilistes, utilise une hypothèse sur la distribution des individus à classifier. Par exemple, on peut considérer que les individus de chacune des classes suivent uneloi normale. Le problème qui se pose alors est de déterminer quels sont les paramètres des lois (moyenne,variance) et à quelle classe les individus ont le plus de chances d'appartenir. Les paramètres d'une loi peuvent être déterminés de maintes façons, et notamment en utilisant l'algorithme espérance-maximisation.
| Paradigmes | |||||||||
|---|---|---|---|---|---|---|---|---|---|
| Problèmes | |||||||||
| Supervisé |
| ||||||||
| Non supervisé et auto-supervisé |
| ||||||||
| Métaheuristique d'optimisation | |||||||||
| Théorie | |||||||||
| Logiciels | |||||||||