Projet IDAPA

Accueil > Qui sommes nous ? > Comptes rendus > Comptes rendus M2 > Compte rendu N°4

Compte rendu N°4

lundi 29 décembre 2008, par Fadel

Points abordés :

- On a présenté l’état d’avancement de projet, on a parlé aussi des difficultés rencontrées.
- Le rapport final était également abordé pendant cette réunion.

Travail à réaliser :

Partie SAS :

Puisque SAS ne fournit pas une méthode spécifique pour la normalisation des variables, on a effectue plusieurs étapes pour arriver à la normalisation de la table Casden avec SAS :
Etape 1 : On a exploite le résultat de la procédure CORRESP qui permet de réaliser une analyse factorielle des correspondances (AFC), c’est-à-dire une étude de la liaison entre deux variables qualitatives, le résultat contient pour chaque attribut une valeur 0 ou 1 selon s’il apparait ou pas dans l’observation.
Etape 2 : On a passe le résultat de la procédure précédente à la méthode TRANSPOSE qui a filtre les données pour qu’il nous reste que les attributs qui ont l’attribut _OBSERVED_, puis on a pivoté la table ce qui nous a donnée une table normalisé.
Etape final : On a fusionné la table obtenu précédemment avec la table casden.
Après ces différents traitements il fallait améliorer le CAH, donc j’ai tracé une courbe qui nous permet de visualiser Rsquare(inertie interclasse)par rapport a chacun des cluster il nous a permis de distinguer un saut de cette valeur entre 150 et 160 donc on a coupe l’arbre au cluster 160 ..

Partie XML pour KDD :

- Finaliser la généralisation du reporting comme son nom l’indique généraliser la tache précédente « générer reporting ». On y trouve les contenus et les requêtes exécutés ainsi que les Meta data (l’algorithme utilisé, l’auteur entre autres) des résultats.
- Finalisation de la partie gestion de projet et la rédaction du rapport final.

Travail réalisé :

Partie SAS :

Selon le planning qu’on a établi on devait aboutir à la grille de score a la dernière semaine mais suite a certaine contraintes (Entretiens et session de recrutement) la dernière phase du projet n’a pas pu être finaliser a temps donc elle sera livré a la rentrée.

Partie XML pour KDD :

- La partie reporting, une tache qui consistait à fournir des rapports et des graphes pour l’analyse de résultats retournés par SAS (les centroides de class,…….) qui est en CSV.
- Etude de SPIP pour la gestion de projets informatiques qui est une tache de la deuxième partie du projet :
Puisqu’on a utilisé Open Source SPIP pour notre projet on voudrait évaluer telle expérience.

Date prochaine réunion : Soutenance 08/01/2009