Feuille de Match NBA : Explication et Analyse des Statistiques Avancées

La saison nord-américaine de basket bat son plein, et l'analyse statistique joue un rôle crucial dans la prise de décision des équipes. Vous pensiez en avoir fini avec les sujets compliqués ? Who's The Bet remet le couvert pour vous proposer quelque chose de bien plus intellectuel que la Jock Tax mais en plus simplifié pour que tout le monde comprenne. Aujourd'hui nous allons parler des statistiques avancées en NBA ! La ligue américaine en est très friande comme John Sullinger qui est l'auteur de plusieurs d'entres elles. Rassurez-vous, vous ne serez pas notés si vous ne comprenez pas et je vais faire au mieux pour vous faire assimiler cette chose plutôt indigeste. Prenez une bonne respiration...

Le sport made in USA, c'est aussi les statistiques. Pour faire le point sur l'état des statistiques appliquées au basket, nous vous présentons une série d'articles. Tous les matins, la rédaction de BasketUSA vous propose un résumé de la nuit agrémenté des différentes feuilles de match.

COMMENT JOUER SANS BALLON AU BASKET !

Mais il faut aussi dire que les principaux sports US, au premier titre desquels le football américain et le baseball, se prêtent particulièrement bien à l'analyse chiffrée. Cet attrait se ressent dans le domaine de la recherche (comment “lire” et interpréter les statistiques), mais aussi dans la disponibilité des informations. Tout est organisé en NBA pour produire un grand nombre de stats, et notamment de statistiques avancées.

Pour commencer, il est essentiel de comprendre les bases de la feuille de match et comment elle est structurée. Voici un exemple de feuille de match avec les statistiques de base:

Exemple de feuille de match NBA

Les Statistiques de Base

La feuille de match “standard” ne donne aucune information sur les possessions. Pour pouvoir débuter, il est donc nécessaire de la déduire. Récupérer les informations fournies directement par la ligue si elle inclut les possessions dans son système statistique. Récupérer ces informations indirectement en traitant les données de type “fil de match” (play-by-play). On peut en déduire les changements de possession, mais de manière indirecte. Estimer ces informations à partir de la “box score”. Ceci est nécessaire car pour les matchs plus anciens pour lesquels on ne dispose pas du “play-by-play”. Il serait très limité de devoir se contenter des 10 ou 15 dernières années. L'idée est de déduire le nombre de possessions simplement à partir de la feuille de match standard.

Voici les statistiques de base que l'on retrouve dans une feuille de match NBA :
  • FG (Field Goal): Pour cette statistique et les 2 suivantes, on a deux chiffres séparés par un tiret. Le premier correspond aux tirs réussis et le second aux tirs tentés. Le terme FG signifie Field Goal, les tirs pris en jeu.
  • 3Pt: Il s'agit d'un sous-ensemble du précédent. Indique le nombre de tirs à trois points marqués et tentés.
  • FT: Indique le nombre de lancers-francs marqués et tentés. Contrairement au 3pt, ce n'est pas un sous-ensemble des FG.
  • Ast: Le nombre de passes décisives.
  • Team Rebounds: Le champ Team Rebounds dans la partie “Stats collectives” mesure simplement les rebonds qu'il n'a pas été possible d'affecter à un joueur bien précis, et qui sont affectés à l'ensemble de l'équipe.

Statistiques Avancées et Leur Signification

En plus des statistiques de base, la NBA utilise des statistiques avancées pour évaluer la performance des joueurs et des équipes de manière plus approfondie.

Player Efficiency Rating (PER)

Le taux d'efficacité du joueur (player efficiency rating ou PER) est l'un des outils simples conçus de cette manière. Certaines franchises cumulent les bons résultats ; dans d'autres, on envisage de transférer des joueurs afin d'améliorer l'équipe. Malheureusement (ou pas), les transactions sont encadrées par la puissante NBA, qui limite la somme totale disponible pour rémunérer une équipe. Les dirigeants doivent donc faire preuve d'intelligence pour leur recrutement. La première idée consiste à agréger les données visibles (points marqués, passes, fautes...) en un indicateur numérique.

Expected Points Valuation (EPV)

L'objectif principal de l'exposé sera de présenter une nouvelle mesure statistique, nommée EPV (Expected Points Valuation). L'EPV permet de quantifier l'apport statistique de chaque décision d'un joueur, tout au long de la partie. Le match de basketball devient alors un processus aléatoire continu, et le nombre de points marqués une variable aléatoire sur le même espace.

Une modélisation avancée commence par la description d'une succession de configurations de jeu, appelée possession : une équipe attaque et une autre défend ; on localise le ballon, ainsi que chacun des joueurs sur le terrain. Il faut ensuite déterminer si une position est avantageuse pour l'équipe qui attaque. On liste toutes les configurations qui peuvent succéder à cette position et on regarde toutes les issues possibles : marquer deux ou trois points, perdre la balle.

Typiquement, si le joueur qui détient la balle se trouve dans l'une de ses positions favorites et qu'il n'y a pas de défenseur entre lui et le panier, il est vraisemblable que l'équipe puisse marquer des points. En revanche, si ce joueur est cerné par des défenseurs doués, il a de grandes chances de perdre la balle : l'espérance de points marqués est faible. Il ne reste qu'à effectuer une moyenne des différents aboutissements en fonction de leur probabilité de se produire.

Le modèle probabiliste permet de décrire comment une situation peut évoluer, puis de caractériser à chaque instant la « valeur » d'une possession par l'espérance du nombre de points marqués ( expected points valuation ou EPV). Sur le plan mathématique, c'est un calcul d'intégrale sur la distribution des futures possessions possibles. Pour évaluer les choix d'un joueur, il suffit désormais de regarder si ceux-ci font augmenter ou diminuer l'EPV.

Un mauvais choix stratégique placera l'équipe dans une situation plus délicate et fera baisser ses chances de marquer, ce qui fera donc chuter son EPV. En calculant cela sur le long terme, on peut savoir si un joueur améliore le jeu de son équipe et donc s'il mérite d'être recruté. Cette description temporelle du jeu est ce que l'on appelle en probabilités un processus markovien. Il consiste en une succession continue de situations, avec des transitions aléatoires entre ces situations qui ne dépendent que du présent.

Pour ce faire, on utilise alors tous les paramètres disponibles pour estimer ces transitions : on évalue la probabilité de réussite d'une passe d'un joueur vers un autre dans des positions données, de réussite au tir... en fonction des habitudes du joueur, mais aussi de celles des joueurs lui ressemblant - car parfois les statistiques sur un seul joueur ne sont pas suffisantes.

Toutes les franchises ne publient pas leur méthode, mais toute la puissance des statistiques récentes est mise en oeuvre pour évaluer la configuration de l'action, en déduire le potentiel espéré en points marqués, étudier les variations et finalement savoir si un joueur donné améliore l'action.

Analyse de la Possession

Dans l'analyse statistique du basket, la possession est la notion fondamentale. La notion de possession permet de mesurer l'efficacité de manière plus précise qu'à travers un simple pourcentage au shoot, qui ne prend en compte qu'un aspect du jeu. Si une équipe rate systématiquement deux fois son tir, prend systématiquement deux rebonds offensifs et met le 3ème shoot, le résultat est là : le panier est marqué à la fin.

Une caractéristique intéressante de cette notion est que les deux équipes ont chacune le même nombre de possessions par match (ou quasiment, à cause des fins de quart-temps) : à chaque fois qu'une équipe fini une possession, l'équipe adverse en commence une. L'analyse statistique par possession permet aussi de s'affranchir de la notion de rythme de jeu (pace en anglais).

Pour analyser la possession, il faut :

  1. Récupérer les informations fournies directement par la ligue si elle inclut les possessions dans son système statistique.
  2. Récupérer ces informations indirectement en traitant les données de type “fil de match” (play-by-play). On peut en déduire les changements de possession, mais de manière indirecte.
  3. Estimer ces informations à partir de la “box score”. Ceci est nécessaire car pour les matchs plus anciens pour lesquels on ne dispose pas du “play-by-play”.

L'idée est de déduire le nombre de possessions simplement à partir de la feuille de match standard. L'idée de base, comme dit plus haut, est que la balle change de main lorsqu'une équipe marque un panier, manque une panier et laisse l'adversaire prendre le rebond défensif, ou perd la balle.

Calcul du Nombre de Possessions

Regardons les lancers-francs. Tous les lancers francs ne mènent pas à un changement de possession : la plupart du temps, ils viennent par deux (ou 3) et le premier ne donne lieu à aucun rebond. Par ailleurs, il peut arriver qu'il y ait une faute technique, qui est sanctionnée par un lancer unique, puis la balle est redonnée à l'attaquant. Au final, des analyses ont été réalisées, en comparant les résultats données par les 3 méthodes citées ci-dessus, et il apparaît qu'en moyenne seuls 44% des lancers peuvent donner lieu à un changement de possession (44% = 0,44).

On voit donc que la valeur NBTIR + 0,44 * NBLF représente le nombre de fois où la balle peut changer de main (nouvelle possession) suite à un tir, soit parce que le panier est marqué, soit parce qu'un rebond défensif est pris. Mais en s'arrêtant là, on compterait trop de possessions, car les rebonds offensifs ne mènent pas à une nouvelle possession.

Pour finir, la dernière manière de rendre la balle à l'adversaire est de la perdre (sur une interception, une sortie des limites du terrain, un dépassement des 24 secondes, un 3 secondes dans la raquette, …).

Points par Possession

Une fois qu'on dispose du nombre de possessions, il est possible de débuter l'analyse. C'est le nombre de points marqués par possession d'une équipe. Pour la saison dernière, l'ensemble des franchises NBA marquait en moyenne 104,9 points pour 100 possessions (104,9 pts / 100poss). Phoenix affichait un très bon rendement : 112,7 pts / 100poss.

On peut en profiter pour voir que les Warriors ne sont pas particulièrement efficaces en attaque. Avec 105,4 pts / 100poss, ils sont 14ème, à peine mieux que la moyenne de la ligue. Par contre, il est vrai qu'ils sont deuxième au nombre de points marqués (108,8 pts / match). Mais c'est simplement parce qu'ils courent, pas parce qu'ils attaquent bien.

On pourrait penser que comme il faut marquer plus de points que l'adversaire, c'est une stratégie forcément payante. Mais n'oublions pas que, comme dit plus haut, chaque équipe a autant de possessions. A chaque fois que les Warriors marquent rapidement, l'adversaire à une occasion d'en faire autant, et à son rythme.

Rendement Défensif

C'est le nombre de points marqués par possession de l'équipe adverse. Au final, la différence entre le rendement offensif et défensif (le rendement global) donne une bonne estimation de la capacité d'une équipe à remporter ses matchs (rappelons que le nombre de possession par équipe est quasi-identique).

Représentation Graphique des Rendements

Pour clore cette première partie, je vous propose une petite représentation graphique des rendements par équipe sur la saison 2009-10 :

Rendements offensifs et défensifs des équipes NBA (2009-2010)

  • En abscisse (axe horizontal) est représenté le rendement offensif. Plus la valeur est grande, meilleure est l'attaque de l'équipe.
  • En ordonnées (axe verticale) est représenté le rendement défensif. Plus la valeur est faible, meilleure est la défense.
  • En haut à gauche (groupe 1), les équipes mauvaises en attaques et en défense, gentiment surnommées “passoires amateurs de brique” (humour).
  • En haut à droite (groupe 2), les équipes qui privilégient l'attaque. Là encore, on trouve des équipes aux résultats mauvais, à l'exception de Phoenix.
  • En bas à gauche (groupe 3), les équipes se concentrant sur la défense.

Etre complet, à la fois efficace en attaque et en défense est un équilibre délicat à trouver. Mais cela nécessite mécaniquement d'être moins présent au rebond défensif, au risque de détériorer le rendement défensif.

A la lecture du graphique, on pourrait se dire que quitte à choisir, en fonction de son effectif, entre une équipe “tout attaque” et une équipe “tout défense”, il faut privilégier la seconde solution. Sur les 5 équipes dans le groupe 3 (les défenseurs fous), 4 se sont qualifiées pour les playoffs. La franchise de l'Arizona offre d'ailleurs un profil original. Seule équipe dans le groupe des “attaquants fous” qualifiés en playoffs, c'est aussi la seule du groupe à avoir un rendement global positif. En regardant dans le détail on voit que c'est une équipe qui joue vite (4ème en terme de rythme de jeu dans la ligue), et qui attaque extrêmement bien. Son rendement défensif n'est pas extraordinaire (19ème), mais est compensée par une attaque ultra efficace (1ere de la ligue, 3 points par 100 possessions au dessus du second). C'est probablement l'exemple que les Warriors ou les Knicks auraient voulu imiter.

La ligne bleue en pointillé qui traverse le graphique représente la ligne de séparation entre les équipes qui marquent plus de points par possession qu'elles n'en encaissent et les autres. C'est, comme on l'a dit avant, un bon indicateur de la performance d'une équipe. Etre plus efficace, c'est être en dessous de cette ligne. Seule Chicago constitue une exception.

Analyse des Statistiques de Tir

Field Goal Percentage (FG%)

Le FG% c'est le pourcentage de tirs réussis au total vs le nombre de tirs tentés. Ça peut vous sembler la seule statistique dont vous avez vraiment besoin, mais ne tombez pas dans ce piège. Aucune stat n'offre un reflet de la réalité adéquant par elle-même. La première chose à faire lorsqu'on est confrontés à un FG% très haut ou très bas, c'est de regarder le nombre de matchs joués et le nombre de tentatives.

Le nombre de matchs joués et le nombre de tentatives totales révèlent que Nesmith est streaky et son jeu nécessite une certaine monopolisation de l'attaque alors que Cunningham lui est mieux capable de distribuer la gonfle et faire sa part dans une attaque plus complète et balancée.

Two-Point Percentage (2P%)

Le pourcentage de réussite à deux points est une statistique mal-aimée et souvent ignorée par les geeks de basket. Pourtant, son importance varie toujours selon le contexte et le joueur. Par exemple, il s'agit de la stat offensive la plus importante pour un joueur d'intérieur de type screen-and-roll car elle illustre largement son pourcentage de réussit au panier. Elle est indicatrice de maturité physique, de contrôle du corps dans l'espace et de dominance athlétique.

C'est respectable, mais pas génial. Cependant, c'est contrebalancé par son tir à trois points à 41,5%. En tant que (seul) focus de l'attaque de son équipe l'an dernier, il s'est retrouvé dans plusieurs bouchons de circulation au cercle et il a quand même tiré son épingle du jeu. Cunningham est grand, fort et incroyablement stable à sa position.

Three-Point Percentage (3P%)

Oui, le pourcentage de réussite à trois points est plus important aujourd'hui qui'il ne l'a jamais été. C'est même de plus en plus important que chaque joueur drafté l'ait dans son arsenal jusqu'à un certain point. On voit tranquillement disparaître dans le processus de sélection tout comme dans le processus de formation, les joueurs qui ne le shootent pas.

Depuis la révolution small ball de Mike D'Antoni, les deux tirs avec le plus de valeur dans la ligue sont les dunks et les layups (plus haut pourcentage de finition) et les tirs à trois points (plus de points, donc possibilité d'avancer plus vite). C'est cependant important qu'un joueur d'élite balance et les deux et maîtrise les deux.

Pick your poison. Cependant, le pourcentage à trois points n'écume que la surface de la personnalité d'un shooter et pour mieux comprendre ce qu'on regarde, il n'y a pas le choix: vous devez regarder les matchs (je suis un grand fan de regarder des matchs de basket avant de m'ouvrir la gueule comme vous pouvez le constater).

Est-ce que le joueur peut créer son tir à trois points en sortie de drible? Est-il un spécialiste du catch-and-shoot statique ou peut-il shooter en mouvement? Comprend-t-il comment shooter en sortie d'écran? Est-il capable de prendre un drible latéral pour déjouer son défenseur? (c'est quelque chose que je regarde beaucoup). Un joueur comme Klay Thompson par exemple, fait tout ça. C'est ce qui le rend extrêmement précieux même s'il ne manie pas vraiment le ballon.

Free Throw Percentage (FT%)

Une autre stat qui représente quelque chose de plus profond qu'elle ne semble. Voyez-vous, lorsqu'on scout un joueur collégial, en G-League ou en Europe, il faut toujours garder en tête qu'un joueur est 1) en apprentissage 2) en changement de contexte continuel et 3) dans un processus de croissance physique semi-continuel.

Il se peut qu'un joueur soit complètement nul dans toutes les statistiques mentionnées plus haut, mais qu'il devienne quand même un excellent shooteur en NBA. Comment on vérifie ça? Avec le pourcentage aux lancers francs. Il s'agit de l'unité de mesure la plus précise pour savoir si la mécanique de tir d'un joueur fonctionne.

Le contexte de tir est toujours le même. Le joueur n'a personne dans le visage. Il n'est pas en mouvement. La seule variable qui compte c'est son niveau de concentration et sa confiance en sa mémoire musculaire. S'il a assez fait de répétition, ça va rentrer à un haut pourcentage.

OPINION TRÈS PERSONNELLE: j'ai tendance à être très positiviste sur le sujet. Parfois un peu même trop. Je vous explique ma philosophie : mathématiquement, le taux de réussite d'une activité à probabilité va toujours tourner autour de 50%. Bien sûr, on peut faire augmenter ces chiffres à l'aide de la biomécanique et de la discipline personnelle. J'ai cependant tendance à ne jamais perdre espoir tant que ce le pourcentage tourne au-dessus de 50%.

Un autre preuve de sa stabilité : Cunningham a obtenu son 85% aux lancers francs sur 5.8 tentatives par match. Pour vous donner un étalon de comparaison, le James Harden des bonnes années avait environ 10 LF par match. Alors 5.8 c'est ÉNORME comme échantillon.

True Shooting Percentage (TS%)

ATTENTION! L'idée du TS% c'est de donner le contexte général le plus précis possible de l'efficacité d'un joueur au tir. Le problème, c'est que ce contexte est TRÈS SUSCEPTIBLE DE CHANGER lors du passage chez les pro, ce qui va révélé un TS% très différent de celui sur lequel vous vous êtes basés pour évaluer un joueur.

C'est un calcul plus précis parce qu'il comprend les lancers francs ,le nombre de points et le nombre de tentatives, donc ça ne comprend pas seulement le pourcentage de réussite, mais la VALEUR de ces réussites. Par exemple, étant donné que les points ET les tentatives y sont comptabilisés, les tireurs à trois points efficaces sont légèrement avantagés.

C'est plus moderne, c'est plus précis, mais c'est une stat également plus chatouilleuse. Le true shooting peut être traitre parce que le nombre de points est calculé. L'usage qu'on fait d'un joueur est donc également très important.

Un bon true shooting est d'habitude un excellent signe, mais un TS% médiocre n'est pas nécessairement synonyme de désastre. Tout est une question de contexte avec les stats. Ne vous fiez jamais à une seule d'entre elles.

Autres Statistiques Importantes

Le champ Team Rebounds dans la partie “Stats collectives” mesure simplement les rebonds qu'il n'a pas été possible d'affecter à un joueur bien précis, et qui sont affectés à l'ensemble de l'équipe.

La mesure des performances d'un joueur à la lecture directe de la feuille de match n'est pas très poussée. Sa signification peut varier en fonction des sources qu'on regarde. Mais dans la très grande majorité des cas (et notamment sur BasketUSA), elle indique une valeur simple : le différentiel entre les points marqués et les points encaissés lorsque le joueur était sur le terrain.

Un autre moyen d'évaluation de la performance individuelle mis en avant par la NBA est la notion d'évaluation (ou “rating” en anglais). On compte simplement de manière positive les points, les rebonds, les passes décisifs, les interceptions et les contres. C'est aussi une mesure peu pertinente, dans la mesure où on considère qu'un point marqué, un rebond et une interception apporte de manière égale, ce qui n'est pas le cas.

Conclusion

En conclusion, l'analyse des feuilles de match NBA et des statistiques avancées est essentielle pour comprendre les performances des joueurs et des équipes. Elle permet de prendre des décisions éclairées en matière de recrutement, de stratégie et de développement des joueurs. Cependant, il est crucial de contextualiser ces statistiques et de ne pas se fier uniquement aux chiffres pour évaluer la valeur d'un joueur ou d'une équipe.

tags: #feuille #de #match #nba