Projet de recherche B2/233/P2/BelgicaWeb (Action de recherche B2)
Dans le cadre du pilier 2 "science du patrimoine", la Bibliothèque royale de Belgique (KBR) propose BelgicaWeb : un projet visant à ouvrir le patrimoine numérique de la Belgique - des informations qui n'existent qu'en ligne - et à le rendre FAIR. Le projet vise à développer une plateforme d'accès multilingue conviviale et une API permettant un accès au niveau des données. BelgicaWeb s'appuie sur les connaissances acquises dans le cadre des autres initiatives Belgica de la KBR (voir : BelgicaPressv et BelgicaPeriodicals) et contribuera à ouvrir à la recherche et à l'analyse les collections nées numériques de la KBR, qui ne cessent de s'enrichir.
Afin d'assurer l'exploitation scientifique et la valorisation sociale de ce patrimoine numérique, BelgicaWeb va: 1) étudier comment fournir un accès durable à ces collections ; 2) développer l'infrastructure de données nécessaire ; 3) enrichir les (méta)données via des données liées, le traitement du langage naturel ou d'autres méthodes numériques ; 4) analyser les cadres juridiques pertinents et 5) promouvoir le patrimoine numérique de la Belgique.
BelgicaWeb est innovant dans le sens où il développera une plateforme d'accès intégrée qui est optimisée à la fois pour les sites web archivés et les médias sociaux, alors que les outils pour visualiser le contenu sont principalement développés avec des sites web à l'esprit. Offrir un accès au niveau des données aux collections numériques via une API est également une approche qui n'est pas souvent adoptée par les bibliothèques nationales. Le projet aura donc un impact majeur sur les connaissances scientifiques ainsi que sur la gestion du patrimoine et des collections puisque de nouvelles collections numériques seront créées et préservées pendant le projet. De plus, il permettra à KBR de développer son expertise interne en offrant des collections numériques sous forme de données via une API et en développant et en maintenant un portail d'accès. L'accès au patrimoine numérique archivé a un fort impact sur la société civile, car il soutient le droit des citoyens à l'information et permet de mieux comprendre le comportement en ligne des citoyens en général.
Le projet BelgicaWeb rassemble des partenaires aux compétences variées. Le CRIDS de l'UNamur apportera son expertise sur les questions juridiques pertinentes, IDLab, GhentCDH et MICT de l'UGhent travailleront respectivement sur l'enrichissement des données, l'engagement et l'évaluation des utilisateurs et la sensibilisation de la communauté des chercheurs. KBR sera le coordinateur du projet et travaillera sur le développement de la plateforme d'accès, de l'API et l'enrichissement des données. Les partenaires du projet ont déjà travaillé ensemble sur l'archivage du web et des médias sociaux dans le cadre des projets PROMISE et BESOCIAL, ce qui constitue un atout supplémentaire pour ce projet.
Dans le cadre du projet, un groupe d'experts de référence fournira de manière itérative des informations sur la sélection, le développement de l'API et de la plateforme d'accès, l'enrichissement des données, le contrôle de la qualité et la facilité d'utilisation. Des collections de données numériques seront créées à l'aide d'outils d'archivage du contenu des sites web et des médias sociaux et ces données seront indexées. L'API et la plateforme d'accès seront développées en deux phases : une phase pilote avec une évaluation et une phase finale. Les données seront également enrichies par l'utilisation de méthodes numériques telles que les données liées ou le traitement du langage naturel. La composante juridique du projet comprend une analyse des cadres juridiques concernant l'échange de données, l'exploration de textes et de données, la protection des données et les droits à la vie privée, la liberté d'expression et l'impact de la proposition de règlement européen sur l'intelligence artificielle.