Derniere mise a jour:

Analyse video de technique martiale par IA

L'analyse video de technique par IA repose sur la detection de pose, c'est-a-dire l'estimation par un modele neuronal de la position des principales articulations sur chaque image. Google publie MediaPipe Pose en 2020 et MoveNet pour TensorFlow.js en 2021 ; ces bibliotheques rendent la detection performante sur appareil mobile. DOJUKU SHINGI utilise un pipeline ouvert pour calculer trois jauges : precision (alignement des segments compare a une reference), timing (cadence d'execution), puissance (vitesse instantanee). Quand le pipeline ne dispose pas encore d'une calibration fiable, nous declarons une valeur de repli plutot que d'inventer un score. La video n'est jamais utilisee pour entrainer un modele.

Detection de pose, fondement technique

En 2020, Google publie MediaPipe Pose, un modele leger de detection d'articulations capable de tourner en temps reel sur un smartphone. En 2021, Google Research publie MoveNet, optimise pour TensorFlow.js et donc adapte au web. Ces deux briques constituent le socle de la majorite des applications de coaching technique modernes. Notre pipeline s'aligne sur ces standards ouverts pour eviter le verrouillage.

Calcul des trois jauges

Precision

Nous calculons l'angle articulaire entre trois points consecutifs (par exemple epaule, coude, poignet) et comparons cet angle au moment cible a une reference. La jauge baisse quand l'ecart depasse une tolerance dependante du geste. Sur une frappe directe comme oi-zuki, la tolerance est plus stricte qu'en posture de garde.

Timing

La jauge timing compare la duree mesuree de l'execution a la duree attendue pour le kata ou la sequence. C'est la jauge la plus robuste, parce qu'elle ne depend pas de la calibration corporelle : une simple horloge suffit. Nous utilisons un modele sigmoide qui tolere une variation autour de la duree cible.

Puissance

La jauge puissance est un signal indirect : nous mesurons la vitesse instantanee du segment dominant pendant la phase active (le bras qui frappe, la jambe qui pousse), et nous normalisons sur un baremo dependant du gabarit declare. Cette jauge ne mesure pas une force en newtons ; elle propose un indicateur de fluidite.

Quand le pipeline ne suffit pas

Dans certaines situations (lumiere faible, cadrage partiel, geste inhabituel non encore calibre), le pipeline ne peut pas calculer une jauge fiable. Notre choix explicite est de declarer une valeur de repli (75 par defaut sur les jauges concernees) et de marquer le score comme " repli ". Le journal d'execution conserve cette information ; nous evitons ainsi de presenter un faux chiffre rond comme un resultat reel.

Securite et donnees

  • Les videos sont stockees dans un bucket prive, chiffre au repos chez notre hebergeur de base de donnees.
  • La lecture est limitee a l'utilisateur proprietaire via Row Level Security.
  • Aucune video n'est utilisee pour entrainer un modele.
  • Les videos sont supprimables a tout moment depuis l'application.

Limites de l'analyse video automatique

Trois limites tenaces meritent d'etre nommees :

  1. L'intention martiale derriere le geste reste invisible. Aucune jauge ne lit la concentration.
  2. La pertinence tactique d'un choix de technique en combat libre echappe a l'analyse video.
  3. Les techniques avec partenaire (saisies, projections de judo) requierent un partenaire reel et ne peuvent pas etre evaluees en shadow.

Roadmap technique

Notre pipeline actuel produit le timing en mesure reelle. La precision et la puissance sont en partie en valeur de repli : l'integration plus profonde de MediaPipe et MoveNet est planifiee sur une phase ulterieure. Le calendrier sera mis a jour des qu'une evolution change la nature de la mesure ; cette page sera datee en consequence.

Aller plus loin