Lucie Verret et le Paris Saint-Germain: Comprendre son rôle

La classification automatique binaire permet de répondre à une question simple : oui ou non ? L’objectif est de déterminer si un élément appartient à une catégorie précise.

Pour que l’intelligence artificielle sache répondre correctement, on doit d’abord lui montrer des exemples : des cas qui appartiennent à la catégorie (oui) et d’autres qui n’y appartiennent pas (non). À partir de ces exemples, la machine apprend à reconnaître les caractéristiques importantes et peut ensuite prendre des décisions seule.

La classification automatique binaire permet de répondre à des questions telles que :

  • Cet article concerne-t-il le sport ?
  • Cette tumeur est-elle maligne ?
  • Cette transaction est-elle frauduleuse ?

Pour garantir le bon fonctionnement du test, veillez à respecter le format attendu en vous basant sur les jeux de données proposés en exemple. Les résultats présentés sont générés à partir de paramètres par défaut.

Classification Automatique et Segmentation

La tâche de segmentation est réputée plus difficile que la tâche de classification automatique. Il s’agit toujours de classer des objets dont on possède une description mais cette fois-ci, on ne fournit pas d’exemples. La machine crée ses propres classes et range les différents objets dans chacune des classes créées.

Cela permettra par exemple de répondre à des questions du type :

  • Quels sont les domaines couverts par ces différents documents ?
  • Comment puis-je segmenter ma clientèle ou mon marché ?
  • Quels types de commentaires sont laissés par les internautes sur mon site ?

Régression logistique : les bases | Réseaux de neurones 9

Étapes et Données

1. Données d'apprentissage : Ajoutez ici les données qui permettront d’apprendre à distinguer les éléments appartenant à la classe (OUI) de ceux qui n’y appartiennent pas (NON). Des exemples sont déjà fournis (« sport », « politique », …), mais vous pouvez saisir vos propres données en cliquant sur « ma classe».

2. Données à classer : Ici, il faut placer les données que l’on cherche à classer (OUI ou NON ?) sur la base des données d’apprentissage fournies ci-dessus. Cliquez sur « lancer le tri… » pour faire afficher les données par ordre décroissant de probabilités d’appartenance à la classe.

Ici, il faut placer les données que l’on cherche à partitionner. Les données pré-saisies à titre d’exemple (« Le Monde », « Iris », …) correspondent aux jeux de données utilisés dans la démonstration pour la classification automatique (sans l’information sur les classes bien sûr). L’algorithme arrivera-t-il à reconstruire des groupes correspondant aux classes ?

Plusieurs partitions variant sur le nombre de groupes sont proposées (pour la démonstration on se limite à 10 maximum). Le meilleur découpage est sélectionné par défaut, mais vous pouvez en choisir un autre en cliquant sur le bouton correspondant au nombre de groupes que vous cherchez.

Fiabilité du modèle

Obtenez une estimation du taux de bonnes réponses que le système devrait fournir pour de nouvelles données. Utile pour mesurer la fiabilité du modèle avant utilisation.

tags: #lucie #verret #psg