NL FR EN
www.belgium.be

Text mining pour la diffusion de l'information statistique via Belgostat on-line

Projet de recherche AG/GG/094 (Action de recherche AG)

Personnes :

Description :

Le projet est une suite logique au projet de thesaurus-Belgostat pour la Banque Nationale de Belgique (projet AG/DD/36). Si ce thesaurus permettra d'augmenter considérablement l'accessibilité des séries Belgostat aux utilisateurs extérieurs, mais également aux utilisateurs internes, il n(en demeure pas moins qu'une lacune persiste quant à l'accessibilité des informations non codées, non structurées, à savoir les métadonnées, les articles, etc... Le but du projet "text mining pour la diffusion de l'information statistique via Belgostat on-line" a donc pour objectif d'offrir aux utilisateurs du site internet de la Banque, un accès rapide et structuré aux notes méthodologiques sous jacentes à la collecte et à la production des séries statistiques.
La mise en place d'un "text mining", permettant la recherche aisée de ce type d'information est essentielle pour fournir aux utilisateurs un site Internet complet, avec tous les moteurs de recherche nécessaires.

Sur base de l'inventaire fourni par la Banque Nationale, l’équipe universitaire proposera une organisation propre à faciliter la dissémination des notes méthodologiques via Belgostat on-line (liens avec les séries et tableaux, utilisation de mots-clés, "text mining"). Une méthode de recherche et d'organisation adéquate, compte tenu des spécificités des données.

L'équipe de spécialistes universitaires commencera ses travaux que lorsque la Banque aura dressé un inventaire des informations non codées susceptibles d'être soumises à la recherche des utilisateurs (liste des articles méthodologiques concernant les séries statistiques, métadonnées). Cet inventaire précisera en outre les règles de conception et de mise à jour en vigueur.

L'équipe de spécialistes fera une proposition fonctionnelle et technique sur l'organisation (classement, accès, mise à jour) des notes méthodologiques, susceptible d'être utilisée sur Belgostat, possédant les spécificités suivantes:
- recherche aisée des informations non codées
- liens avec le thesaurus actuel, et donc correspondance possibles avec les séries statistiques.
- mise au point des méthodes d'utilisation et de gestion.

La Banque intégrera cette nouvelle application à son site Internet et complètera ainsi la panoplie des moyens de recherche d'information mis à la disposition des utilisateurs finaux. Via le Website Statistique Belgostat on-line, ce projet doit assurer un accès facile à l'information méthodologique sur les séries diffusées.