Projet IDAPA

Accueil > Ressources > Outils pour SAS > EXEMPLES DE QUELQUES SIMILARITES/DISTANCES ALCULEES EN SQL

EXEMPLES DE QUELQUES SIMILARITES/DISTANCES ALCULEES EN SQL

mardi 6 janvier 2009, par Pierre Michel Bousquet

Table en entrée : cube relationnel np lig. x 3 col.(Id, item, value)

Table en sortie : dist distances entre couples n² lig. x 3 col.(Id1, Id2, distance d)
 [1]

Calcul de distances :

  1. euclidienne
  2. distances de Steinhaus et de Kulczynski sur matrices d’effectifs (valeurs >0)
  3. Similarités d’indices binaires : (0,1) ... ou bien (-, +) -> (0,1), par ex. sur données centrées.
  4. 3 distances : simple_contingence, Jaccard (ou "de communauté"), Soerensen (ou Odum ou Bray-Curtis ou Czenakowski) : poids double pour la double présence.
  5. distance du Chi2 (issue de la métrique).

[1NB : puis macro sas %mat_dist pour générer une mat. de distances nxn (format DIST
compatible avec proc CLUSTER)