Comprendre les statistiques Opta dans le football : Explications et applications

Data, chiffres, statistiques… Ces termes investissent tous les champs, et le football ne fait pas exception. L'objectif ? Maîtriser, en nommant et en quantifiant la moindre action, ce qui semble, à première vue, incontrôlable.

Il est néanmoins difficile de nier leur intérêt pour l’étude du jeu. Elles ont leurs détracteurs, qui dénoncent une forme de fétichisme du chiffre et une prétention vaine à « révéler » une vérité scientifique ou objective du jeu - le football s’y prêtant plus mal que d’autres sports.

Cet article explore l'utilisation des statistiques Opta dans le football, en détaillant leur collecte, leur interprétation et leur impact sur la perception du jeu. Nous examinerons également les différentes métriques utilisées et comment elles peuvent être appliquées pour améliorer la compréhension et l'analyse du football.

Collecte et sources des données

Qui en a l’usage et comment modifient-elles la perception du jeu ? L’homme est une machine.

Oui, ce sont des centaines et des centaines de petites mains qui scrutent les matchs de football et notent chaque passe, chaque tacle, chaque dribble, chaque duel, la frappe, le pied de frappe, la zone de tir, la zone atteinte… le temps de secondes frénétiques. Et qui travaillent pour des noms bien connus, tels Opta ou Prozone (aujourd’hui racheté par STATS).

« Chaque analyste est responsable d’un club et le suivra tout au long de la saison, explique Kevin Jeffries, statisticien chez Opta, dans une interview pour Buzzles en janvier dernier. Il y a deux analystes par rencontre, qui rentrent manuellement dans notre base de données tous les événements d’une rencontre. Un travail titanesque. […] Un troisième est présent pour s’assurer qu’ils ne manquent aucun événement ou pour en corriger, comme un superviseur. »

En moyenne, 1 900 événements sont recensés dans un match de football.

Dans un article pour FiveThirtyEight, en 2014, le journaliste Carl Bialik raconte le quotidien de Khalid Hussain, l’une de ces petites mains, devenue manager chez Opta par la suite : « Hussain couvrait 10 à 15 matchs par semaine durant la saison de Premier League. Sa mission première était de suivre les matchs d’Arsenal, mais il travaillait également quatre nuits par semaine à couvrir des rencontres du monde entier. Une fois, il a pris en charge six matchs dans la journée. “Je suis rentré chez moi dans un sale état”, m’a-t-il confié. »

Pas pour rien que la collecte de ces statistiques met déjà nos Wall-E de service à contribution. Ce sont des puces glissées dans les chaussures qui calculent les kilomètres parcourus, tracent les courses et leur vitesse. Toute l’activité d’une société telle que Catapult Sports, partenaire, en Ligue 1, du Paris Saint-Germain.

Un capteur équipe la cheville de chaque sportif et transmet des données sur les réseaux de passes, les tirs, les sprints, etc. Le tout exploitable via une appli… en temps réel ! À l’origine destinée aux éducateurs des clubs amateurs, la technologie a notamment séduit les Crocos nîmois, qui en tireront profit en L1 la saison prochaine.

Ce sont enfin des solutions capables de transcrire en data les évolutions des joueurs sur un terrain à partir d’images vidéos, comme Sentiosports peut le proposer avec son Sentioscope. « En partant simplement des matchs à la télé, on est capables d’extraire la position des joueurs à chaque moment avec notre logiciel de tracking, détaille Pierre Miralles, l’un des fondateurs, pour Numerama.

Les cibles de ces stats ? La demande le réclame. Celle des clubs, qui s’adressent à Opta, Stats ou Catapult Sports pour comprendre le comportement de leurs joueurs sur le terrain, interpréter des schémas ponctuels ou récurrents, anticiper et éviter des blessures, envisager un recrutement.

Opta vend des stats et leurs analyses pointues à des clubs qui en font la demande ; mais aussi des « facts », des faits chiffrés notables.

Statistiques clés et leur signification

Derrière chaque but, chaque arrêt et chaque passe, des chiffres et des observations peuvent être décortiqués à travers des métriques qui permettent de mieux comprendre ce qui se passe sur le terrain. Il vous est sans doute déjà arrivé de vouloir vous renseigner sur le nombre de tirs d’un joueur lors d’un match, son nombre de tacles ou encore le nombre d’arrêts pour un gardien.

Depuis plusieurs années, les clubs professionnels et leur staff ont intégré l’analyse de ces données dans leur gestion quotidienne. Voici quelques statistiques clés et leur signification :

  1. Les xG (Expected Goals) calculent la probabilité qu’un tir se transforme en but. Les xG permettent d’évaluer la qualité des occasions créées. Par exemple, une équipe qui produit 3 xG par match, mais qui ne marque qu’un but peut souffrir d’un problème d’efficacité.
  2. Les xGA permettent d’identifier les lacunes défensives d’une équipe. Cette métrique peut mettre en évidence d’éventuelles failles.
  3. Les xA (Expected Assists), contrairement aux xG ou au xGA vu précédemment, mesurent la probabilité qu’une passe se transforme en but. Les xA évaluent les joueurs créatifs et leur impact dans les phases offensives, même en l’absence d’une passe décisive.
  4. La moyenne de buts par match est une donnée que vous connaissez sans doute, mais qui est indispensable. La moyenne de buts par match est un indicateur intuitif pour analyser les performances offensives ou défensives.
  5. L’AVG offre un aperçu global des performances d’une équipe.
  6. Le PPDA (Passes Per Defensive Action) est un indicateur data qui mesure l’intensité du pressing exercé par une équipe. Le PPDA est une métrique qui permet de comprendre les stratégies défensives.
  7. L’OPPDA (Opponent Passes Per Defensive Action) mesure l’intensité du pressing que subit une équipe de la part de ses adversaires.

En fonction de la tactique foot mise en place, le staff technique et l’entraineur peuvent prendre en compte cette métrique pour adapter leur tactique foot.

Les occasions créées sont une métrique foot qui compte le nombre d’occasions significatives créées par une équipe ou un joueur. Ces données aident à repérer les joueurs possédant la vision et la créativité nécessaires pour « débloquer » des situations difficiles.

Bien que les indicateurs présentés précédemment soient parmi les plus utilisés, le monde de la data regorge d’autres métriques tout aussi importantes. L’analyse du football évolue sans cesse, et de nouvelles métriques apparaissent régulièrement grâce aux nouvelles technologies.

Exemple concret : Les Expected Goals (xG)

Parmi les outils les plus sophistiqués et de plus en plus populaires, on retrouve les Expected Goals (xG), une statistique fournie par Opta, qui révolutionne la manière dont nous comprenons le jeu en Ligue 1 McDonald’s. Les xG mesurent la qualité d’un tir en lui attribuant une valeur entre 0 (très faible chance de marquer) et 1 (très forte chance de marquer). Ainsi, plus on se rapproche de 1, plus il y a de chances que la frappe termine au fond des filets.

Chez Opta (fournisseur de statistiques pour la Ligue 1 McDonald’s), cette valeur est calculée à partir d’une base de données comprenant plusieurs centaines de milliers de tirs.

Comment les xG sont-ils calculés ? Si on reprend l’occasion manquée de Kylian Mbappé, les outils Opta vont analyser dans ce vaste échantillon les situations similaires en termes de positionnement, de pression adverse, de construction de l’action et la spécificité du tir pour établir qu’en pareille situation, 88% des joueurs ont réussi à convertir un tel tir en but, d’où un xG de 0,88. Cette valeur est particulièrement élevée car il s’agit de tirer dans un but vide, le gardien rennais ayant été éliminé au préalable. C’est plus qu’un pénalty dont la valeur est établie à 0,79 xG.

Inversement, certains tirs ont une probabilité très faible de finir au fond des filets, comme le but de Teddy Teuma avec le Stade de Reims contre Montpellier le 27 août 2023, qui n’affichait qu’une valeur de 0,015 xG. La volée pied gauche à 25 mètres du but héraultais du milieu champenois était d’autant plus compliquée à convertir en but que plusieurs joueurs étaient en position de la contrer, dont un qui était relativement proche.

Comment INTERPRÉTER les EXPECTED GOALS pour GAGNER vos PARIS SPORTIFS ?

Interprétation et Utilisation des xG

Les expected goals prennent surtout leur sens au moment de cumuler les données d’un joueur ou d’une équipe sur un match ou une saison afin de comparer avec le total de buts inscrits sur la même période. S’il y a plus de buts que d’Expected Goals, c’est que le joueur ou l’équipe surperforme par rapport à la qualité des tirs qu’il se procure et donc, à l’opposé, un différentiel négatif laisse entendre un manque d’efficacité.

Pour en revenir à l'ex-attaquant du PSG, son manqué contre le Stade Rennais demeure une exception à l’échelle de sa saison où il a inscrit 27 buts pour un cumul de 21 expected goals. En parallèle, il a su convertir des occasions bien moins évidentes et ainsi basculer dans un différentiel positif. A titre de comparaison, Pierre-Emerick Aubameyang, alors à l’Olympique de Marseille, avait accumulé presque autant d’Expected Goals (20,5 xG) avec un nombre comparable de tirs (116 contre 120) mais a marqué 10 buts de moins en 2023/2024.

Identifier les équipes qui surperforment

Comme pour les joueurs, le cumul des données xG d’une équipe peut permettre d’évaluer sa capacité à se créer des occasions ou une éventuelle réussite insolente.

Les Expected Goals sur une saison permettent aussi d’identifier les forces et faiblesses d’une équipe. Le FC Lorient, 17e du championnat, était plutôt surperformant d’un point de vue offensif avec 43 buts pour 37,6 xG. A titre de comparaison, le premier non-relégable (le Havre AC, avec 37,7 xG) avait quasiment le même total pour 9 buts inscrits de moins. Cependant, les Merlus ont encaissé beaucoup plus de buts qu’ils n’ont concédé d’Expected Goals Against (66 buts pour 55,2 xGA).

L'Évolution des xG : l'xGot

Pour pousser l’analyse, Opta développe depuis plusieurs années un modèle connexe intitulé Expected Goals on target. Une alternative qui permet notamment de mesurer la qualité des tirs cadrés subis par un gardien, et par extension de quantifier les buts qu’un portier a évité ou non à son équipe. Pour les xGot, on prend en compte la valeur xG initiale, qu’on pondère avec l’endroit où la balle termine sa course dans le but adverse (si tant est que le tir est cadré). En d’autres termes, les Expected Goals racontent le voyage, les Expected Goals on target la destination.

Ainsi, un tir peu évident d’un point de vue xG peut avoir une forte valeur xGot. Grâce à ses arrêts, Dimitry Bertaud a ensuite contenu le club artésien à 2 buts, évitant donc 2 buts aux Montpelliérains.

Mieux jauger les gardiens

De la même manière qu’on peut comparer les totaux d’Expected Goals et de buts marqués d’un joueur de champ pour déterminer son efficacité, on peut comparer les Expected Goals on target et les buts encaissés pour déterminer la qualité des arrêts effectués par un gardien. C’est ce qu’on appelle donc les « buts évités ».

Avec ce calcul des buts évités, on peut plus facilement apprécier un bon match d’un gardien qu’avec son seul nombre d’arrêts ou le fait qu’il n’ait pas encaissé de but. Gianluigi Donnarumma - récompensé du titre de gardien de l’année en Ligue 1 McDonald’s lors des derniers Trophées UNFP - n’a pas démérité cette récompense au regard de ses buts évités (11,5, total le plus élevé dans l’élite). Le leader parisien a été plus souvent bousculé qu’on ne pourrait le penser en lisant le classement de la saison 2023/24, mais le gardien italien a clairement contribué au 12e titre du PSG.

Les limites des statistiques

Or ces emplois n’ont pas forcément contribué à les crédibiliser. Leur éditorialisation tend majoritairement à faire saillir des chiffres « parlants », susceptibles d’être relayés, et ils sont présentés souvent sous forme de records - avec une prédilection pour des stats « historiques » peu informatives.

Les représentations les plus courantes sont les équipes-types, les palmarès et les comparatifs. On trivialise alors les statistiques plus qu’on ne les vulgarise, d’autant qu’elles sont cantonnées à un rôle illustratif. Rarement mises en perspective, elles font un contenu additionnel qui peut s’afficher sur les écrans et ou être apposé à des articles, mais elles laissent le téléspectateur ou le lecteur se débrouiller avec elles.

C’est justement parce que ces stats (trop) élémentaires révèlent vite leurs limites que d’autres sont élaborées et expérimentées dans le but de concevoir de meilleurs instruments de mesure. Inconvénient : ils nécessitent une explication, à l’image des expected goals (xGoals ou ExpG), qui évaluent la qualité des occasions de but.

Canal+ a tenté de contourner la difficulté avec son « indice de performance » qui attribue aux joueurs une note sur cent. C’est retomber dans la magie du chiffre, en éludant ce qui est le propre de l’analyse statistique : on s’y confronte en permanence à des limites, des contradictions, des impasses.

Tous les indicateurs posent des problèmes de définition et ne sont pas pertinents dans toutes les situations, tous comportent des biais et des angles morts, leur interprétation est souvent difficile. Les questionnements méthodologiques sont au cœur de la démarche statistique, et on ne peut pas les exclure au moment de restituer les données.

Ces dernières ne peuvent pas délivrer des vérités, ni « expliquer » à elles seules un match, une équipe, un joueur, mais elles donnent des moyens de mieux les comprendre.

Prédictions et analyses pré-matchs

Les statistiques peuvent-elles prévoir les surprises à venir dans le Championnat de France et les retournements de situation ?

La prévision de phase retour de la L1 par Opta est établie à partir de 10 000 simulations du Championnat via de données empiriques et des résultats des dernières années (avec une plus grande importante pour les résultats les plus récents).

Pour le titre, les projections sur la fin de saison laissent peu d'incertitudes : le PSG, champion en titre mais avec seulement 3 points d'avance sur Lens, a 92,8 % de chances de réussir le doublé. Cela ne laisse que des miettes aux Sang et Or (3,55 %) et à l'OM (3,2 %). À l'image des pronostics de L'Équipe, le modèle d'Opta donne un petit avantage aux Marseillais (39,2 %) par rapport aux Lens (37,6 %) pour finir sur la deuxième marche du podium.

Derrière le quinté de tête, annoncé plutôt stable, Opta prédit un petit sursaut de l'OL (de la 9e à la 7e) et un glissement vers le ventre mou de Lorient, la sensation de l'automne, et de Clermont. Les scénarios de lutte pour le maintien ne montrent guère d'extravagance : selon Opta, les quatre derniers à mi-saison resteront sous la ligne de flottaison en mai. Devant eux, Montpellier (annoncé 16e au final) aurait plus de soucis à se faire que Strasbourg.

Sans se lancer dans des prophéties, il existe une autre façon d'utiliser les statistiques avancées pour essayer de prévoir le scénario des prochains matches : déterminer les équipes qui ont surperformé et celles qui ont sous-performé pour essayer de prévoir un retour à la normale.

Autrement dit, si une équipe a inscrit beaucoup plus de buts que ne laissaient imaginer les occasions créées, il y a deux explications possibles : 1) soit ses joueurs sont d'une efficacité hors-norme devant le but et cette anomalie statistique peut se confirmer ; 2) soit ses joueurs ont profité d'un peu de réussite jusque-là et quand cette part de chance va s'évaporer, la tendance pourrait s'inverser.

Si l'on s'intéresse à la première partie de saison, toutes les équipes du top 5 ont performé plus qu'attendu. Lille est l'équipe qui peut s'estimer la moins en réussite puisque les Dogues ont inscrit moins de points que ceux que pouvaient prévoir les occasions créées match après match. Ils sont même sur le podium virtuel d'un Championnat où toutes les équipes auraient même la réussite pour convertir leurs tirs. À l'inverse, Lorient et Clermont apparaissent comme des collectifs qui ont optimisé leurs occasions depuis le début de saison, avec le risque de ne pas tenir le rythme jusqu'au bout.

En bas du tableau, Auxerre et Angers semblent avoir été plombés défensivement avec un énorme différentiel entre les tirs concédés et les buts encaissés. Une des solutions dans ce cas-là est de changer de gardien de but : Angers a tenté le coup en septembre après 15 buts ramassés en 4 matches en remplaçant Paul Bernardoni par Yahia Fofana (depuis, ce dernier s'est blessé). Auxerre va attaquer la phase retour avec un nouveau gardien de but (Ionut Radu), Benoit Costil ayant signé à Lille.

Data Foot : L'optimisation de la performance

La data au football, souvent nommé « data foot », est devenue indispensable pour de nombreuses équipes professionnelles et amateurs, pour optimiser la performance des footballeurs, affiner les stratégies d’une équipe, ou encore repérer les talents. Qu’est-ce que la « data foot » ? Autrefois, pour évaluer la performance, les entraîneurs et recruteurs s’appuyaient sur l’intuition et l’observation. Ces données recueillies lors de matchs ou d’entraînements, peuvent être quantitatives et qualitatives.

Les data foot quantitatives représentent par exemple le nombre de passes réussies ou encore la distance parcourue dans un match.

Capteurs GPS : Portés par les joueurs sur le dos, sur les tibias ou encore directement sur la chaussure, les capteurs GPS foot peuvent mesurer leur vitesse, la distance parcourue, et bien plus encore.

Caméras de suivi : Des systèmes comme les caméras foot sont installés pour suivre chaque joueur en temps réel et collecter des informations sur leurs positions et leurs actions de jeu.

L’utilisation de la data foot par les clubs varie en fonction de leurs objectifs : certains l’utilisent principalement pour le recrutement, tandis que d’autres s’en servent pour optimiser les performances des joueurs.

  • Brentford FC (Premier League) : Pionnier dans l’utilisation de la data pour identifier notamment des talents sous-évalués, Brentford et son dirigeant Matthew Benham s’appuient sur des data avancées pour recruter des joueurs à moindre coût, souvent dans des championnats moins médiatisés.
  • Manchester City : Pep Guardiola et Manchester City s’appuient sur l’analyse des data pour ajuster ses tactiques foot et son fameux jeu de position. Grâce à l’analyse des passes et des positions moyennes de ses joueurs pendant les matchs, Manchester City a optimisé sa possession de balle.

Si vous souhaitez avoir accès à de la data de qualité, plusieurs plateformes peuvent vous proposer une base de données de milliers de joueurs.

  1. DataScout est une base de données dédiée aux agents et aux recruteurs particulièrement. Elle permet d’accéder à une base de données couvrant 12 000 joueurs dans plus de 60 championnats.
  2. Hudl Statsbomb est une des solutions les plus complètes sur le marché, accompagnant autant les équipes de foot, les médias et les entreprises de paris sportifs.
  3. Wyscout est la référence mondiale en matière d’analyse vidéo et de data foot. Appartenant aussi à Hudl, Wyscout possède un outil permettant de comparer plus de 400 000 joueurs dans plus de 600 compétitions à l’échelle mondiale.

L'importance de l'interprétation humaine

D’un point de vue éditorial, la data n’a de véritable intérêt que si l’on en prend résolument le parti, celui de mener des analyses appuyées spécifiquement sur l’exploitation des données - quels que soient les sujets, qui peuvent être très divers. Il ne s’agit pas de livrer une expertise savante, mais d’apporter des éléments de compréhension et de débat.

Les statistiques constituent une approche du football enrichissante, à condition qu’elles soient expliquées, pondérées, mises en perspective - c’est-à-dire qu’elles soient commentées, et qu’elles le soient par des spécialistes.

Dans le sport, qui s’y prête pourtant particulièrement, et malgré un caractère pluridisciplinaire très stimulant (qui associe journalistes, graphistes, statisticiens et développeurs), le data journalisme en tant que tel reste assez marginal en France.

Mais si l’homme, qu’étudie la machine, étudie la machine pour mieux comprendre l’homme et la machine à la fois, il demeurera toujours ce machin qui échappe à la compréhension : un retourné acrobatique de Cristiano Ronaldo face à Gigi Buffon en quart de finale de la Ligue des Champions ; un coup de boule légendaire de Zinédine Zidane en finale de Coupe du Monde ; une remontada barcelonaise dont l’absurdité n’a d’égale que la béance stupéfaite ou le traumatisme infligé, selon qu’on est observateur, passionné ou simple supporter.

tags: #opta #statistiques #football