{"title":"根据内容对文档进行分类的语义相似性度量","authors":"Rim Al Hulou, A. Napoli, E. Nauer","doi":"10.3166/objet.10.2-3.217-230","DOIUrl":null,"url":null,"abstract":"Dans cet article, nous proposons une approche pour classifier des documents a partir de leur contenu. Le contenu des documents est exprime par des annotations representees sous forme d'arbres. Etant donnee une hierarchie d'annotations generiques, notre approche vise a rattacher une annotation specifique a une ou plusieurs classes possibles dans la hierarchie. Ce processus de classification repose sur une mesure de similarite qui permet de mesurer l'ecart entre une annotation specifique et une annotation generique. Un schema d'algorithme de classification de documents est propose a partir de cette mesure de similarite.","PeriodicalId":201701,"journal":{"name":"Obj. Logiciel Base données Réseaux","volume":"11239 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2004-09-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"2","resultStr":"{\"title\":\"Une mesure de similarité sémantique pour la classification de documents par le contenu\",\"authors\":\"Rim Al Hulou, A. Napoli, E. Nauer\",\"doi\":\"10.3166/objet.10.2-3.217-230\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Dans cet article, nous proposons une approche pour classifier des documents a partir de leur contenu. Le contenu des documents est exprime par des annotations representees sous forme d'arbres. Etant donnee une hierarchie d'annotations generiques, notre approche vise a rattacher une annotation specifique a une ou plusieurs classes possibles dans la hierarchie. Ce processus de classification repose sur une mesure de similarite qui permet de mesurer l'ecart entre une annotation specifique et une annotation generique. Un schema d'algorithme de classification de documents est propose a partir de cette mesure de similarite.\",\"PeriodicalId\":201701,\"journal\":{\"name\":\"Obj. Logiciel Base données Réseaux\",\"volume\":\"11239 1\",\"pages\":\"0\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2004-09-30\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"2\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Obj. Logiciel Base données Réseaux\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.3166/objet.10.2-3.217-230\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Obj. Logiciel Base données Réseaux","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.3166/objet.10.2-3.217-230","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
Une mesure de similarité sémantique pour la classification de documents par le contenu
Dans cet article, nous proposons une approche pour classifier des documents a partir de leur contenu. Le contenu des documents est exprime par des annotations representees sous forme d'arbres. Etant donnee une hierarchie d'annotations generiques, notre approche vise a rattacher une annotation specifique a une ou plusieurs classes possibles dans la hierarchie. Ce processus de classification repose sur une mesure de similarite qui permet de mesurer l'ecart entre une annotation specifique et une annotation generique. Un schema d'algorithme de classification de documents est propose a partir de cette mesure de similarite.