Ouvert il y a seulement quelques jours, le mercato d'hiver bat déjà son plein. Les années passent et les mercatos, en été comme en hiver, demeurent l'un des incontournables d'une saison footballistique. L'occasion de mettre l'accent sur des méthodes de recrutement en pleine mutation, avec l'utilisation croissante de la data.
Si le rendez-vous perdure, les manières de travailler des recruteurs, elles, ne cessent d'évoluer, et notamment avec l'essor des nouvelles technologies. Pour mieux appréhender cette nouvelle méthode, TF1info a interrogé l'un des fondateurs du site "Data'Scout".
La Révolution de la Data dans le Recrutement
La façon d'analyser les forces et faiblesses d'un joueur ne se résume désormais plus à la simple observation dans les stades ou en vidéo. Les recruteurs utilisent la "data", des données chiffrées qui permettent de mesurer les performances d'un sportif. Apparue dans les années 1990 aux États-Unis, cette méthode de travail n'est utilisée en Europe que depuis une dizaine d'années, mais a révolutionné le travail quotidien et le fonctionnement d'une cellule de recrutement. Certains clubs en ont même fait leur spécialité, à l'instar du Toulouse FC en France.
Pour comprendre l'ampleur de ce changement, TF1info a contacté Data'Scout qui propose son expertise à des clubs, médias et joueurs pour faciliter le processus de recrutement d'un joueur. L'un de ses co-fondateurs, Alexy, nous aide à y voir plus clair sur cette nouvelle façon de travailler. La data permet d'aller chercher des profils sous les radars, à bas coûts, mais aussi des profils plus onéreux.
TF1info : Comment se sert-on de la data dans le recrutement des joueurs ?
Alexy : Elle permet de définir l'apport (ou la faiblesse) de joueurs dans des domaines précis, et pour lesquels il faut parfois des dizaines d'heures de visionnage avant de pouvoir se faire une idée. Par exemple, il est intéressant de savoir qu'un joueur réalise en moyenne 85 passes par match. Mais c'est encore plus pertinent de savoir quels types de transmissions il réalise : des passes vers l'avant, qui cassent des lignes et apportent une plus-value aux actions de l'équipe, ou au contraire des passes vers l'arrière dans des moments qui ne le nécessitent pas ?

Les données avancées permettent de répondre à cette question très rapidement, de dresser un portrait robot du profil du joueur et de savoir rapidement s'il vaut le coup, ou non, d'être analysé à la vidéo. Elles font office de premier filtre pour produire une liste de joueurs répondant aux besoins du club. En plus, la data permet d'aller chercher aussi bien des profils sous les radars, à bas coûts, que des profils plus onéreux. Elle peut donc toujours être utilisée d'une façon ou d'une autre quel que soit le budget.
Comment expliquer qu'elle soit de plus en plus exploitée ?
Liverpool et l'utilisation de la DATA
C'est un formidable moyen pour un club de gagner du temps, de savoir où regarder et d'apporter des éléments de contexte supplémentaires dans le "scouting" d'un joueur. Analyser un footballeur à la vidéo demande du temps et un recruteur ne peut pas observer simultanément tous les joueurs d'un match, tout comme il ne peut visionner qu'un nombre limité de rencontres. En plus, certains clubs possèdent des cellules de recrutement limitées, avec un réseau de recrutement bien établi, mais restreint (et qui ne peut pas forcément être étendu faute de budget).
Autrement dit, cela permet surtout de savoir où regarder, de ne pas se focaliser seulement sur une poignée d'équipes ou de championnats et de repérer plus facilement des joueurs potentiellement intéressants, quel que soit le pays ou la division dans lequel ils évoluent. Par exemple, on peut repérer via l'usage des données avancées qu'un Colombien performe bien dans son championnat. Par la suite, le club peut l'analyser en vidéo ou même envoyer un recruteur sur place pour qu'il puisse faire un retour visuel et en profondeur sur le joueur. Mais tout part, dans ce cas précis, de la data, sans laquelle ce profil atypique n'aurait probablement pas été repéré.
Fonctionnement de Data'Scout
Nous sommes quatre co-fondateurs, Ben, Léo, Matis et moi-même. Nous sommes tous des passionnés de football, nous regardons plusieurs matchs chaque week-end, partout dans le monde. Parfois, quand on lit certaines personnes, on a l'impression qu'être passionné par la data se résume à aimer les fichiers Excel sans regarder de matchs. C'est tout le contraire : c'est parce que nous aimons le football que la data au travers de cette discipline nous passionne.
Pour travailler, nous utilisons des données d'entreprises spécialisées et nous les traitons avec nos propres outils. Notre objectif est d'analyser des données en masse pour les rendre compréhensibles aux yeux de personnes ne maîtrisant pas du tout la data. Nous avons développé un algorithme de détection qui prend en compte les données de plus de 60 championnats dans le monde, soit plus de 12.000 joueurs, pour les classer selon différents profils. L'objectif de cet algorithme est de ressortir très rapidement les joueurs qui surperforment dans leur championnat et le rôle dans lequel ils sont les meilleurs.
Données Privilégiées par Poste
Nous regardons plus attentivement certaines données en fonction du profil de joueur recherché pour un poste donné. Grâce à notre algorithme, nous possédons différents profils pour tous les postes (17 en tout), aussi bien en défense, qu'au milieu de terrain ou qu'en attaque. L'ambition est de coller, avec le plus de précision possible, aux différents rôles qui existent actuellement dans le football moderne.

Ainsi, si un club recherche un joueur qui aura pour mission principale de rôder dans la surface pour conclure les actions, nous utilisons l'index de performances associé au profil de renard des surfaces. Au contraire, si une équipe recherche un attaquant qui sera le premier défenseur de l'équipe, qui ne va pas rechigner à la tâche et effectuer un pressing constant, nous regardons davantage l'index de performances associé au profil d'attaquant de pressing.
Les Limites de la Data
Mais la data n'est pas non plus l'alpha et l'omega du processus de recrutement, sans parler du fait qu'elle possède ses propres limites... Les analyses data doivent toujours être complétés de rapports visuels réalisés par des recruteurs ou des analystes vidéos. Il n'est pas question d'une solution miracle qui a pour vocation à remplacer les hommes, bien au contraire. Il s'agit plutôt d'étayer ou de compléter ledit travail.
Par ailleurs, certains aspects du jeu ne sont pas encore bien quantifiés ou caractérisés par la data. L'exemple le plus parlant, que nous aimons évoquer, est celui des défenseurs centraux. Les données avancées vont révéler qu'un défenseur va beaucoup au duel, tout en se montrant impérial dans ce domaine. Il serait, dès lors, facile d'interpréter que ce joueur est un "crack" qu'il faut absolument le recruter. Sauf que dans le football, bien défendre ne se résume pas à aller au duel, il y a des notions de placement, de marquage, de cadrage, de courses qui bloquent des lignes de passes.
Collecte des Données
Comment la data est-elle collectée ? Les données peuvent être collectées manuellement par observation ou automatiquement (Vidal-Codina, F. et al. 2022) par les prestataires spécialisés comme Track 160, Tracab, Hawk-Eye, Opta, StatsBomb. Dans la plupart des cas, ces informations sur les joueurs sont obtenues à l'aide de capteurs sophistiqués qui traquent les déplacements des joueurs sur le terrain. D'autres outils de collecte se développent actuellement, comme Footbar ou l'application développée lors de la coupe du monde 2022 par la FIFA (FIFA player App).
Cette app permet à chaque joueur d'avoir accès aux données individuelles consultables immédiatement après chaque match. Les type de données collectées sont, entre autres, les données footballistiques avancées (exemple : la nature des mouvements réalisés par un joueur en vue de recevoir le ballon), les données de performance physique (la distance parcourue à différents seuils de vitesse, le nombre de courses au-dessus de 25 km/h ainsi que la vitesse maximale enregistrée) et les données avancées d'intelligence footballistique.
Impact sur le Métier de Scout
Le métier de scouting est une pratique consistant à assister aux matchs et entraînements des équipes (tous les niveaux) afin de faire des repérages et collecter des informations pour un club. celui qui joue le rôle d'observateur tactique chargé d'étudier et d'analyser les comportements des équipes adverses. Le scout est différent de l'agent sportif qui lui est le représentant du jouer, qu'il peut accompagner ponctuellement ou tout au long de sa carrière. Ainsi, depuis l'évolution de l'usage de la data et l'IA dans le football, ces informations que collectent les scouts peuvent être obtenues autrement à l'aide des outils technologiques mentionnés ci-haut.
Par exemple, grâce aux algorithme de l'IA, le projet Predictafootball permet d'identifier les jeunes talents et prédit leur potentiel à réussir au niveau professionnel.
L'Exemple du Toulouse FC et de l'Olympique de Marseille
Toulouse Football Club a été le première club en Ligue 1 à avoir opérationnaliser l'utilisation de la data. Il recrute les joueurs à l'aide des data analysées statistiquement par ses techniciens. En 2020, Branco van den Boomen, inconnu des médias, recruté d'un simple club néerlandais « De Graafschap » grâce à ce système, et est devenu deux ans après, le meilleur joueur de la ligue 2 Française. Actuellement, il est sociétaire de la prestigieuse équipe d'Ajax Amsterdam. Un autre club Français, l'Olympique de Marseille, possède depuis 2020, un département chargé d'analyses statistiques des performances de ses joueurs. Il aide également aux recruteurs pour faire de bons choix, et permet ainsi de dénicher un talent que les scouts n'ont pas identifié à l'aide des méthodes classiques.
Vers une Plateforme d'Achat/Vente des Joueurs ?
Le volume de données collectées dans le football évolue à une vitesse exponentielle. Dans le même temps en économie, on assiste à l'apparition des business des plateformes en ligne (Insaf et al, 2022, p3), comme Leboncoin, Uber..,fournissant principalement des services (Hänninen et al.,2018), et permettant des interactions entre entreprises et clients (exemple : transfert entre club et un joueur libre - B2C) ou entre entreprises et entreprises (exemple : transfert d'un joueur négocié entre deux clubs - B2B) (Muzellec et al., 2015). En effet, nous supposons qu'au regard des données collectées actuellement, toutes les conditions sont remplies pour développer une plateforme en ligne d'achat et vente des joueurs.
Dans le tableau ci-dessous, on voit à quoi peut ressembler une plateforme d'achat des joueurs et l'exemple des critères à saisir pour avoir le profil souhaité.

Il est important de préciser qu'aucun contrat ne peut être signé uniquement sur la base d'un choix fait sur la plateforme. On peut dire que cette idée qui se dessine serait plus adaptée au joueurs moyens car la valeur de ceux et celles dont le capital marque est élevé ne dépendent pas seulement des performances.
Difficultés et Limites de l'Utilisation de la Data/IA
L'ère de la data/IA dans le football est lancée. Malgré la difficulté d'en analyser objectivement les bénéfices actuellement, il semble évident de dire que les données aident ceux qui ont des compétences pour les analyser, les interpréter et les mettre en contexte. Toutefois, le football n'est pas un jeu vidéo, il y a de l'humain avec tous ses défauts et qualités. Ainsi, on peut souligner quelques difficultés liées à cette nouvelle tendance.
Les données positives d'un joueur peuvent être surestimées par le style de jeu de l'équipe qui lui est favorable, à l'inverse, un joueur peut avoir des données (performances) positives mais ne pas contribuer au jeu de l'équipe. Il est important d'avoir des précisions sur les modalités de calcul (exemple, les critères prises en compte) et d'exploiter les données parallèlement à d'autres types d'évaluations non chiffrées comme des séquences vidéo. Par ailleurs, la plupart des algorithmes de l'IA se basent sur le principe de l'apprentissage (supervisée ou non supervisée) dont la qualité des résultats dépend beaucoup de la qualité des données d'entrainement.
Sur le plan émotionnel et sentimental, il est difficile pour les algorithmes d'anticiper l'intégration d'un nouveau jouer recruté. Un joueur peut se sentir mieux dans un championnat et avoir un bon niveau mais pas dans l'autre. Lionel Messi, transféré de Barca à PSG, meilleur joueur du Monde de l'époque, mais ses performances à Paris étaient moins spectaculaires que prévu. Sur le même ordre d'idée, le recrutement à l'aide de la data/IA peut causer le problème d'intégration socioculturelle du fait que plusieurs nationalités (sensibilités/mentalités) peuvent se retrouver dans le même vestiaire, ce qui risque de compliquer la tâche au staff technique.
De même, la technologie aura du mal à capter l'ambiance du stade au sein des associations des supporters alors qu'elle s'invite aux performances des joueurs. Par exemple, la réaction des supportes de l'OM peut dépendre des performances de leur équipe et ainsi peut impacter positivement ou négativement celles de certains joueurs. Plus tard, quand l'usage de la data sera généralisée, il faudra anticiper une possibilité de voir des fraudes liées aux données truquées qui risquent de fausser les mercatos.
La Question de la Décision : Machine ou Humain ?
La problématique liée «à qui revient la décision » a été abordée dans d'autres domaines comme l'armée. Dans le football, le recours massif aux algorithmes peut susciter des différents au sein des clubs. Est-ce qu'on se fie à 100% aux résultats générés par nos ordinateurs dotés de l'IA pour recruter un joueur, pour connaitre les 11 débutants à aligner sur un match ? La logique serait de concilier les deux, c'est-à-dire, considérer la data mais également le point de vue des techniciens du club.
Malgré le consentement des joueurs au sujet de la collecte de leurs données privées qui s'appuie sur la charte de la FIFA, on peut se demander, sur le plan éthique, si réellement ces derniers sont assez informés sur les données collectées et leurs utilisations ultérieures, d'autant plus que certaines informations concernent le comportement du joueur en dehors du terrain dans sa vie privée (hygiène de vie) ! En dehors de cette charte, les joueurs professionnels et/ou évoluant dans les pays développés sont globalement protégés par les dispositifs déjà en vigueur comme la RGPD et ont l'avantage d'avoir des agents capables de faire un suivi sur l'utilisation des données de leurs clients.
Le présent article traite globalement et développe les idées autour des problématiques liées à l'implication de la data/IA dans le football. Cependant, aucune méthode, modèle statistique ou algorithme de l'IA n'est proposé pour mettre en pratique les idées évoquées.