Le Football Est-Il Vraiment Une Science Exacte?

La semaine du blog spéciale sports se penche sur le livre de Gautier Stangret, "LE FOOTBALL EST UNE SCIENCE (IN)EXACTE - Entraîneurs, journalistes, spectateurs : comment le big data a changé le visage du football ?", publié par AMPHORA le 8 novembre dernier. Ce livre explore l'omniprésence du BIG DATA dans le football.

Quel est le point commun entre le titre de champion d'Angleterre remporté par Leicester en 2016, le sacre de l'Allemagne à la Coupe du monde 2014 et la victoire des Danois de Midtjylland contre Manchester United lors de la Ligue Europa 2016 ?

Au-delà de représenter d'incommensurables exploits footballistiques, ces succès ont été en partie bâtis à l'aide de chiffres, de statistiques et autres algorithmes astucieusement utilisés par des scientifiques intégrés au sein même de ces formations. Passées au peigne fin, les "datas" deviennent des armes au service de la performance. Une fois recoupées, décortiquées, comparées, hiérarchisées, ces caractères sont capables de révéler toutes les parcelles du jeu d'une équipe, ses forces et évidemment ses failles.

Entraîneurs, directeurs sportifs, journalistes, analystes, mathématiciens, fournisseurs de contenu, nous allons nous intéresser à ces acteurs qui ont contribué à la "data-ification" de ce sport et lui ont permis d'évoluer dans une logique toujours plus tournée vers la performance.

Le BIG DATA dans le football est partout, même chez vous! Gautier Stangret, l'auteur du livre, nous invite à explorer un sujet peu abordé mais omniprésent dans le monde du football.

Après avoir expliqué ce qu'est le Big Data, l'auteur démontre sa place importante au sein des clubs de foot et de la gestion de ces derniers avec notamment les transferts ou le développement des équipes. Ils nous parlent des principaux fournisseurs de ces informations exploitées. Ensuite, ils montrent comment sont exploitées ces mines d'informations par les médias et également comment est entré le Big Data dans nos maisons ou dans les stades comme l'exemple pris avec le Groupama Stadium de l'Olympique Lyonnais.

Et anecdote intéressante, dans le Big Data, on peut utiliser comme source d'informations un jeu vidéo: FOOTBALL MANAGER!

La grosse valeur ajoutée de ce livre est aussi voire surtout de décrypter les impasses et les mythes liés à la data dans le monde du foot. En divisant son travail en plusieurs thématiques : les datas dans les clubs, dans la presse… L’auteur, doté d’un grand sens pédagogique, nous fait prendre conscience de ce qu’est la data. Ni outil miraculeux qui peut faire d’un statisticien un coach de L1, ni artifice juste voué à amuser à travers la fameuse « palette à Doudouce », du journaliste Philippe Doucet, précurseur du mouvement dans les médias français et auteur de la préface du livre.

Apprenez également à exploiter simplement, et depuis votre canapé, ces données et devenez incollable sur les statistiques de votre équipe et de vos joueurs préférés.

Gautier Stangret, auteur du très instructif ouvrage « Le Football est une science (in)exacte » ( Amphora éditions), a accepté de nous expliquer le rôle et l’apport de la data dans le football moderne. Selon Gautier Stangret, l'intérêt pour ce phénomène a débuté par un constat : la multiplication des chiffres et des statistiques dans les médias sportifs. Il voyait tous ces chiffres défiler sur sa télé en cours de match, des consultants les manier de façon plus ou moins habile sur les plateaux TV, et entendait des termes comme « possession », « nombre de kilomètres parcourus », « pourcentage de passes réussies »…

Il s'est donc demandé ce que cela voulait dire concrètement. Partant du constat que les médias abreuvaient de statistiques leur audience sans forcément leur expliquer à quoi elles servaient, il a cherché à comprendre pourquoi on les utilise et à quoi elles servent concrètement. C’est à partir de là qu’il a commencé à s’intéresser à ce sujet. Il a réalisé en 2015 un mémoire étudiant, qui a été très bien accueilli par son jury, axé sur les statistiques dans les médias sportifs. Il a par la suite cherché un éditeur pour le faire publier. Les éditions Amphora étaient prêtes à le faire, mais uniquement en élargissant le sujet au football en général. Ce qu’il a fait.

Pour faire simple et essayer de schématiser au possible, le Big Data est un nouveau prisme à travers lequel on peut lire le football. Il y a une vingtaine d’années, certains dirigeants de club étaient lassés de ne prendre des décisions basées que sur leur ressenti, leur instinct. Bref, leurs sentiments. Ils se sont donc rapprochés de scientifiques capables de décrypter les clés du jeu, afin de donner une approche plus rationnelle à ce sport.

Grâce à l’apport des nouvelles technologies, de très nombreux critères physiologiques, mais aussi technico-tactiques, peuvent désormais être mesurés avec précision, par des appareils tels que des capteurs, des GPS ou des logiciels d’imagerie vidéo. C’est d’ailleurs la mesure de ces critères que l’on appelle les « datas », le Big Data ne représentant que la (gigantesque) manne recensant l’intégralité de ces mesures.

La Vérité Derrière Les Chiffres

La particularité des statistiques est qu’elles délivrent toujours la vérité. Ou plus précisément, une vérité. Leur vérité. Les chiffres ne mentent pas et délivrent un regard objectif. C’est pour cela qu’ils constituent une arme redoutable lorsque l’on veut défendre une opinion, car ils agissent comme un fait, un argument. En revanche, ce qui va faire la pertinence d’une statistique, c’est son interprétation. C’est là que se situe, à son sens, la principale limite de l’outil, en donnant par exemple trop d’importance à certains critères.

Il existait jusqu’à peu une idée reçue selon laquelle l’équipe qui avait la possession était celle qui jouait le mieux. C’est totalement faux. Si une équipe a pour stratégie de camper dans son camp puis de procéder par contre-attaques, joue-t-elle forcément plus mal qu’une équipe qui essaie de produire du jeu mais qui n’y arrive que par intermittence ? De même que le nombre de kilomètres parcourus. Il s’agit d’un critère souvent cité, mais pas forcément utile aux yeux du grand public.

Quand on sait qu’un joueur comme Messi parcourt en moyenne 8 à 9 kilomètres par match, qu’il passe la majeure partie de la rencontre à marcher, mais qu’il est certainement le meilleur joueur au monde en termes de courses à haute intensité, est-il moins performant que Cristiano Ronaldo qui répétera les efforts et qui parcourra 13 kilomètres par match ? Pour cette raison, je ne pense pas qu’il faut être très prudent sur l’interprétation qu’on fait des statistiques. Car un chiffre dans sa forme brute n’a que peu de valeur. C’est lorsqu’il sera inscrit dans un contexte, tout en prenant en compte tous les paramètres relatifs au jeu qui l’entourent, qu’il gagnera en intérêt.

« Plus il y a d’antériorité, plus on peut être précis et mieux on peut prédire les événements. » Ce n’est pas moi qui le dis, c’est Alexandre Marles, l’ancien analyste de la performance du PSG et de l’OL. Lorsqu’il était à Lyon, il eut pour mission de collecter et d’analyser les données physiologiques des joueurs afin de réduire le nombre de blessures dans l’effectif, qui atteignait alors des sommets encore jamais atteints au club. Son travail permit de réduire d’environ 30% le nombre de blessés au cours de sa première saison. Car bien utilisées, les données permettent d’individualiser les séances et donc de doser les charges de travail à l’entraînement. Si un joueur a trop de charges, les données peuvent conduire le staff à les réduire. Si un joueur s’est blessé sur un certain type d’entraînement, les données peuvent suggérer d’adapter cet exercice. Bref, les données permettent de mieux connaître le joueur.

Le phénomène des datas à l’échelle industrielle est récent, mais bien avant que tout le processus de collecte de données ne soit informatisé, les statistiques ne se résumaient qu’à des coups de crayon sur un calepin. Pour citer l’excellent The Numbers Game de David Sally et Chris Anderson, l’ouvrage de référence sur le sujet, le premier à avoir collecté des données sur un match de foot est en effet Charles Reep. Cet ancien commandant d’escadron de la Royal Air Force a commencé par comptabiliser le nombre d’attaques au cours d’un match, puis le nombre de tirs, de corners, puis de tirs avant un but, etc.

Entre 1950 et 1990, il a scruté près de 2000 rencontres à la loupe, collectant l’ensemble des faits de jeu, pour finir par dégager de ses observations deux tendances majeures : 80% des buts sont marqués au terme d’actions composées de trois passes maximum ; 60 % des buts sont inscrits à partir de mouvements démarrant dans les trente derniers mètres adverses. Autrement dit, d’après ses conclusions, pour être efficace et marquer le maximum de buts, il faut minimiser le nombre de passes et jouer principalement dans le camp adverse. C’est de ce constat qu’est né le fameux kick-and-rush : une tactique matérialisée sur le terrain par un jeu direct et aérien, fait de contre-attaques et pas forcément agréable à voir.

Pour une question de codification. De base, le football n’est pas une discipline qui se prête facilement aux chiffres, comme peuvent l’être les sports américains par exemple. La raison est simple : que ce soit le baseball, le football américain ou le basketball, toutes ces disciplines sont basées sur une succession de phases arrêtées. Alors qu’au football, le jeu est beaucoup plus fluide, ce qui peut donner lieu à des phases de plusieurs minutes sans interruption. La capacité de lecture est donc beaucoup plus difficile. Il en va de même pour les interactions entre les différents acteurs.

Comme me le faisait remarquer Damien Comolli, ancien directeur sportif de Tottenham et Liverpool, « au baseball, il n’y a qu’une seule interaction au départ d’une action : entre le batteur et le pitcher. Au football, c’est complètement différent. Dans le jeu, chaque joueur, qu’il s’agisse d’un attaquant ou du gardien, base son positionnement à la fois en fonction du ballon, mais aussi de la position de l’adversaire ».

Exactement. Les données physiologiques de type, nombre de courses à haute intensité, accélérations, kilomètres parcourus, sont les données les plus répandues dans les clubs, car utilisées par les staffs dans un but médical, afin, par exemple, de mieux cerner les dispositions d’un joueur, comprendre les besoins d’une équipe, ou individualiser les charges de travail à l’entraînement. Mais aujourd’hui, les données technico-tactiques, relatives au jeu donc, ont pris une importance considérable dans l’analyse de ce sport. Elles sont apparues en premier dans les médias, via des critères pour le moins primaires comme la possession ou le nombre de tirs, et se sont petit à petit développées pour qu’aujourd’hui, des clubs les utilisent pour élaborer des tactiques de match, que ce soit sur des phases arrêtées, comme les corners ou les penalties par exemple, ou dans le jeu (le RB Leipzig a par exemple banni les centres en fond de ligne car ils étaient jugés pas assez efficaces pour produire un but).

Pour être franc, j’ai commencé à m’intéresser à ce club lorsque j’ai appris que l’équipe U17 utilisait des Google Glass à ses entraînements. J’étais loin d’imaginer ce que j’allais découvrir une fois sur place. En fait, le propriétaire du club est Dietmar Hopp, le fondateur de la société informatique SAP, spécialiste des logiciels de pointe. Celle-ci fournit à l’équipe ses outils les plus sophistiqués afin de les décliner au service de la performance sportive. Au centre d’entraînement, chaque interaction avec le ballon, chaque mouvement d’un joueur, que ce soit lors d’une séance collective ou individuelle, est mesuré et répertorié dans une immense base de données, qui permettra à l’entraîneur d’avoir une vision globale de ses joueurs, et ainsi, de baser ses décisions en suivant un raisonnement scientifique.

Le club possède aussi des machines innovantes, comme le Footbonaut. Mais pour vraiment cerner le mode de fonctionnement de ce club, je vais citer ce que m’a dit Rafael Hoffner, le « coordinateur des innovations basées sur les technologies d’information », là aussi un poste singulier : « Nous sommes arrivés à un niveau de performance quasi-maximal pour ce que peut supporter le corps humain, que j’évaluerais à 95%. L’enjeu consiste donc à travailler dans cette toute petite fenêtre de performance restante pour chercher à l’optimiser.

Je dirais d’abord que le Big Data a permis au football de s’ouvrir au monde scientifique. Il est évident que sans la recherche d’une certaine rationalité dans ce sport, jamais des docteurs en psychologie, en mathématiques ou en astrophysique n’auraient daigné pointer leurs blouses blanches dans des clubs, comme ce fut le cas à Tottenham sous la direction de Damien Comolli. Mais à l’échelle du Big Data tel qu’on le connaît aujourd’hui, avec la multiplication des données à collecter et des informations à traiter, les clubs ont dû faire appel à des personnes spécialisées pour remplir cette tâche. D’où l’émergence du métier d’analyste de la performance, que certains appellent aussi « data analyst », voire « data scientist ».

Pour faire simple, car les tâches exactes varient en fonction du degré d’exigence de chaque club, cette personne est en charge de collecter, d’étudier et d’interpréter un certain nombre de données sur trois tableaux différents : tactique, technique et physiologique. Cela demande d’observer méticuleusement le jeu de l’équipe, de ses adversaires, de l’équipe réserve ou même des équipes jeunes, tout en passant au peigne fin les statistiques collectées en cours de match ou à l’entraînement.

Pour en citer un deuxième, il y a aussi le métier de « recruitment analyst » qui est apparu au cours des dernières années. Lui est un spécialiste du mercato.

Il y a plusieurs écoles. Ceux qui s’en fichent complètement, ceux qui s’y intéressent, mais de façon raisonnée, et ceux qui ne pensent qu’aux stats. Ou plutôt, à leurs propres stats. Et ils sont de plus en plus nombreux. Aujourd’hui, avec la multiplication des datas dans les médias et surtout la multiplication des trophées individuels, les joueurs regardent de plus en plus leurs statistiques. C’est un fait. Aujourd’hui, des primes de but sont inclues dans la plupart des contrats d’attaquants, et pour certains, cela peut leur monter à la tête.

Je pense notamment à un agent qui m’a avoué qu’un de ses joueurs, qui s’était présenté un jour face au gardien, avait totalement oublié son coéquipier démarqué à côté de lui pour aller s’empaler sur le portier adverse. A la fin du match, le joueur s’est justifié en lui disant : « je suis pas con, je pensais à la prime de but ». Ça, c’est une dérive de l’outil statistique.

C’est un exemple de distinction individuelle oui, mais peut-être pas l’exemple type. Car au niveau auquel évolue Harry Kane, Tottenham peut se permettre de jouer « pour » lui. D’autant plus qu’avec le salaire qu’il perçoit, les primes de but doivent lui paraître dérisoires. Mais il est évident que dans des divisions plus modestes, où les primes de but peuvent représenter 10 à 25% du salaire mensuel, cela peut s’avérer dangereux. Il en va de même pour la course aux records. Sans toutes ces histoires de statistiques autour du record de buts de Cavani au Paris SG, Neymar n’aurait jamais été sifflé par son propre public au moment de tirer son pénalty et le malaise autour de cette affaire n’aurait jamais eu lieu d’être. Bref, l’excès de statistiques tue la statistique.

Je m’égare volontairement de la question initiale, mais on peut aussi citer les dérives liées à la méconnaissance de l’outil. En 2016 dans France Football, Mathieu Bodmer disait qu’il connaissait trop de joueurs « contents d’avoir réussi 90% de passes alors qu’ils ont juste fait des transmissions à quatre mètres et jamais vers l’avant. » Il notait alors qu’il fallait ramener ces chiffres au jeu. « Certains courent des kilomètres pour rien et on lit “10,5 km parcourus”. Super… Moi, je préfère celui qui a fait la bonne course pour ouvrir le but à son partenaire. Lui on n’en parlera pas statistiquement. Pourtant, il a eu un apport concret. » C’est vrai sur toute la ligne.

Oui, je pense. Au départ, la plupart d’entre eux voyaient les stats comme un gadget, un outil uniquement destiné à faire parler les journalistes. Mais lorsque les fournisseurs de contenu sont arrivés sur le marché, ils ont révolutionné la manière de préparer les matchs. Car il était désormais possible de mesurer avec précision les mouvements des joueurs sur le terrain, à savoir leur vitesse, leurs accélérations, leurs courses à moyenne ou haute intensité… Frédéric Antonetti, qui était l’un des premiers à signer un partenariat avec le logiciel Amisco en France, m’a d’ailleurs avoué qu’avant d’utiliser cette technologie, il avait tendance à trop faire courir ses joueurs la semaine et qu’ils arrivaient cramés le jour du match. Ainsi, les datas lui ont permis de mieux connaître les dispositions physiques de ses joueurs et de doser leurs charges de travail à l’entraînement.

Après, les données technico-tactiques ont mis plus de temps à faire leur chemin auprès des techniciens. La majorité d’entre eux déteste qu’on émette un jugement sur leur travail et que des scientifiques leur prouvent que leurs méthodes ne sont pas suffisamment efficaces. C’est pour cette raison qu’encore aujourd’hui, peu d’entraîneurs professionnels sont sensibilisés aux vertus des datas.

Tableau récapitulatif des informations clés du livre:

Titre Auteur Éditeur Date de publication Nombre de pages ISBN13
Le football est une science (in)exacte Gautier Stangret Amphora 8 novembre 2017 240 978-2851809889

Football et Big data

tags: #le #football #est #une #science #exacte