Accueil > Bases de données relationnelles et indexation du contenu

Bases de données relationnelles et indexation du contenu

On aborde deux conceptions des entrepôt de données :

  1. L’approche structurée fondés sur des SGBDR rapides en interrogation tels que MySQL.
  2. L’approche XML et donc semi-structurée fondée sur des moteurs de recherche d’information (RI) tels que Indri.

Les deux types d’outils sont adaptées à l’implémentation de fonctions de "scoring" dans un modèle vectoriel ou probabiliste. Ils peuvent aussi être combinés. Le moteur RI est utilisé pour indexer interroger un grand entrepôt de données XML. Le SGBDR est utilisée pour manipuler les échantillons extraits ainsi que pour gérer de larges tables d’annotations.