{"title":"Prédiction des blessures au Foot 5 à l’aide d’une méthode de machine learning","authors":"D. Jacob , R. Tievant , L. Cervoni , M. Roudesli","doi":"10.1016/j.jts.2023.06.001","DOIUrl":null,"url":null,"abstract":"<div><h3>Introduction</h3><p>Le Foot 5 est un sport qui gagne en popularité en France. Afin de mieux comprendre les facteurs à l’origine des blessures et de pouvoir développer un outil de prévention, nous proposons un modèle de machine learning.</p></div><div><h3>Méthode</h3><p>Un modèle de machine learning est un outil informatique qui, à partir d’une liste de variables d’entrées décrivant un participant, va pouvoir prédire si ce dernier se blessera ou non. L’algorithme utilisé dans cette étude est le Random Forest, et il est constitué de plusieurs centaines d’arbres de décision qui vont participer à prédire le risque de blessure d’un participant en fonction de certaines informations d’entrées. Le modèle a été développé sur une base de données d’une étude épidémiologique de 1827 participants.</p></div><div><h3>Résultats</h3><p>Le modèle a été optimisé sur 80 % du jeu de données, pour ensuite être évalué sur les 20 % restants. Le modèle possède une accuracy de 64,9 %. La précision est de 60,1 % et le recall de 70,3 %. Dans notre cas, ce sont les informations sur le temps de jeu et des caractéristiques anthropométriques qui participent à fournir les meilleures prédictions.</p></div><div><h3>Conclusion</h3><p>Le modèle développé propose des premiers résultats encourageants comme outil de prévention de la blessure. Deux pistes d’amélioration ont été identifiées : augmenter la taille de l’échantillon et améliorer le questionnaire (avoir des informations sur la qualité de leur sommeil, l’historique de leur blessure, affiner les données anthropométriques), avec ces 2 axes de progression la qualité de l’accuracy du modèle pourrait augmenter significativement.</p></div><div><h3>Context</h3><p>Five-a-side football is a sport that is gaining popularity in France. In order to understand the factors at the origin of injuries and to be able to develop a prevention tool we propose a machine learning model.</p></div><div><h3>Method</h3><p>A machine learning model is a computer tool that, from a list of input variables describing a participant, will be able to predict whether the participant will get injured or not. The algorithm is the Random Forest and it consists of several hundred of decision trees that will participate to predict the risk of injury of a participant according to some input information. To develop this model, we used a cross-sectional epidemiological study of 1827 participants.</p></div><div><h3>Results</h3><p>The model was optimized on 80% of the dataset and then evaluated on the remaining 20%. The model has 64.9% accuracy with a precision of 60.1% and a recall of 70.3%. In our case, it is the information on the duration of practice and anthropometric characteristics that participate to provide the best predictions.</p></div><div><h3>Conclusion</h3><p>The model developed offers encouraging results as a tool for injury prevention. Two opportunities of improvement have been identified: increasing the sample size and asking participants about the quality of their sleep and their injury history and refining the anthropometric data. With these 2 areas of improvement, the accuracy of the model could be significantly increased.</p></div>","PeriodicalId":38932,"journal":{"name":"Journal de Traumatologie du Sport","volume":"40 4","pages":"Pages 261-269"},"PeriodicalIF":0.0000,"publicationDate":"2023-06-27","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"1","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Journal de Traumatologie du Sport","FirstCategoryId":"1085","ListUrlMain":"https://www.sciencedirect.com/science/article/pii/S0762915X23000724","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q4","JCRName":"Medicine","Score":null,"Total":0}
引用次数: 1
Abstract
Introduction
Le Foot 5 est un sport qui gagne en popularité en France. Afin de mieux comprendre les facteurs à l’origine des blessures et de pouvoir développer un outil de prévention, nous proposons un modèle de machine learning.
Méthode
Un modèle de machine learning est un outil informatique qui, à partir d’une liste de variables d’entrées décrivant un participant, va pouvoir prédire si ce dernier se blessera ou non. L’algorithme utilisé dans cette étude est le Random Forest, et il est constitué de plusieurs centaines d’arbres de décision qui vont participer à prédire le risque de blessure d’un participant en fonction de certaines informations d’entrées. Le modèle a été développé sur une base de données d’une étude épidémiologique de 1827 participants.
Résultats
Le modèle a été optimisé sur 80 % du jeu de données, pour ensuite être évalué sur les 20 % restants. Le modèle possède une accuracy de 64,9 %. La précision est de 60,1 % et le recall de 70,3 %. Dans notre cas, ce sont les informations sur le temps de jeu et des caractéristiques anthropométriques qui participent à fournir les meilleures prédictions.
Conclusion
Le modèle développé propose des premiers résultats encourageants comme outil de prévention de la blessure. Deux pistes d’amélioration ont été identifiées : augmenter la taille de l’échantillon et améliorer le questionnaire (avoir des informations sur la qualité de leur sommeil, l’historique de leur blessure, affiner les données anthropométriques), avec ces 2 axes de progression la qualité de l’accuracy du modèle pourrait augmenter significativement.
Context
Five-a-side football is a sport that is gaining popularity in France. In order to understand the factors at the origin of injuries and to be able to develop a prevention tool we propose a machine learning model.
Method
A machine learning model is a computer tool that, from a list of input variables describing a participant, will be able to predict whether the participant will get injured or not. The algorithm is the Random Forest and it consists of several hundred of decision trees that will participate to predict the risk of injury of a participant according to some input information. To develop this model, we used a cross-sectional epidemiological study of 1827 participants.
Results
The model was optimized on 80% of the dataset and then evaluated on the remaining 20%. The model has 64.9% accuracy with a precision of 60.1% and a recall of 70.3%. In our case, it is the information on the duration of practice and anthropometric characteristics that participate to provide the best predictions.
Conclusion
The model developed offers encouraging results as a tool for injury prevention. Two opportunities of improvement have been identified: increasing the sample size and asking participants about the quality of their sleep and their injury history and refining the anthropometric data. With these 2 areas of improvement, the accuracy of the model could be significantly increased.