You are on page 1of 2
Rare entice unter feta be ynibr ayes Année 2020/2021 Niveau + Master BDSaS & MIDVI Matitre —: Text Mining Enseignant : Loqman chakir Durée : Uhi5 Examen du 1% Semestre 2020 - 2021 (1° Session) Remarques ‘© Veuillez lire attentivement les questions avant de répondre. ‘© Documents, ordinateurs et téléphones non autorisés. EXERCICE 1 (Questions de cours) 1. Qu’est-ce que Text Mining? 2. On exprime une requéte avec un seul terme. Est-ce que l’idf du terme a une importance pour le classement? 3. Un document peut-il obtenir un classement élevé méme s'il ne contient pas tous les termes de la requéte? Donner un exemple ou un contre-exemple (le plus simple possible). EXERCICE 2 On souhaite réaliser une classification supervisée de documents par la méthode naive bayésienne. Il existe deux catégories possibles : (C1) et (C2)). Le corpus d’apprentissage comprend les textes suivants: Dy, | just plain boring Gi Dz, | entirely predictable and lacks energy | Cy ‘Ds | no surprises and very few laughs G ‘Dy | very powerful Cr ‘Ds | the most fun film of the summer GQ 1. Pourquoi certains classifieurs de Bayes sont dits naif ? 2. Calculer les probabilités de chaque mot dans la classe C, et C, 3. Appliques la méthode naive bayésienne pour classer le document suivants dans la catégorie Cou: © De: predictable with no fun C. LOQMAN 1 Master MIDVI & BDSaS NJA.D - BCP (A+ BYA+C)(B+ DCF D) Id; € cy: t € dil lds cy : ty € di] [dy € cy ty ¢ di Di=|di ¢ cet; ¢ dil Calculer Xaee(very) EXERCICE 3 Soit le corpus suivant: % | t | ta [ta [ts Difijo{ififo Dalo[o{i|i]o Ds{i{ifo[1|o Dli[o]o| 12 Ds{i[2{1] 00 Dslo[i[o]1]o Ou {t, ta...,ts} sont des termes et {D;, Dz..., Ds} sont des documents. 1. Onse basant sur le modale vectoriel, utiliser la métrique tf x idf pour calculer les poids des termes et générer la matrice Documents-termes . 2. Quel est le document le plus proche & la requéte suivante(Utilisez cosinus) : Q: ttats 3. Soit R= {D2, Ds, De} V'ensemble des documents retournés par le moteur de recherche pour la méme requéte. Calculer la précision, le rappel et la F-Mesure C. LOQMAN 2 Master MIDVI & BDSaS

You might also like