{"title":"Une mesure de similarité sémantique pour la classification de documents par le contenu","authors":"Rim Al Hulou, A. Napoli, E. Nauer","doi":"10.3166/objet.10.2-3.217-230","DOIUrl":null,"url":null,"abstract":"Dans cet article, nous proposons une approche pour classifier des documents a partir de leur contenu. Le contenu des documents est exprime par des annotations representees sous forme d'arbres. Etant donnee une hierarchie d'annotations generiques, notre approche vise a rattacher une annotation specifique a une ou plusieurs classes possibles dans la hierarchie. Ce processus de classification repose sur une mesure de similarite qui permet de mesurer l'ecart entre une annotation specifique et une annotation generique. Un schema d'algorithme de classification de documents est propose a partir de cette mesure de similarite.","PeriodicalId":201701,"journal":{"name":"Obj. Logiciel Base données Réseaux","volume":"11239 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2004-09-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"2","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Obj. Logiciel Base données Réseaux","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.3166/objet.10.2-3.217-230","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 2
Abstract
Dans cet article, nous proposons une approche pour classifier des documents a partir de leur contenu. Le contenu des documents est exprime par des annotations representees sous forme d'arbres. Etant donnee une hierarchie d'annotations generiques, notre approche vise a rattacher une annotation specifique a une ou plusieurs classes possibles dans la hierarchie. Ce processus de classification repose sur une mesure de similarite qui permet de mesurer l'ecart entre une annotation specifique et une annotation generique. Un schema d'algorithme de classification de documents est propose a partir de cette mesure de similarite.