Vocabulaire de l'informatique : quelques données terminologiques

Le domaine de l’informatique est notoirement connu pour user d’anglicismes, alors même que des équivalents français existent parfois. C’est ainsi que les concepts de cette liste, en vogue à l’ère des mégadonnées, sont souvent véhiculés en anglais. Découvrez ce vocabulaire entériné par les experts de l’informatique et publié par la Commission d’enrichissement de la langue française au Journal officiel du 24 mars 2023.

 

Cette liste s’intéresse à trois infrastructures logicielles permettant le stockage de données : l’entrepôt de données (data warehouse), le lac de données (data lake) et la plateforme de données (data hub).

 

L’entrepôt de données est le plus ancien de ces trois types d’infrastructure – le terme, ici révisé, avait d’ailleurs été publié une première fois en 2007. Généralement hébergé dans un centre de données, l’entrepôt collecte, structure et stocke des données d’une organisation afin d’en permettre l’exploitation par des outils d’aide à la décision.

 

Le lac de données, étroitement lié à l’essor des mégadonnées, collecte celles-ci dans leur format d’origine et les associe à des métadonnées (nom, date, lieu...) qui permettent d’en préparer l’exploitation. Cette appellation évoque une organisation des données moins structurée que celle d’un entrepôt. Cependant, le lac de données nécessite une gestion rigoureuse, sous peine de devenir un marécage de données (data swamp), inexploitable.

 

Quant à la plateforme de données, souvent désignée part l’anglicisme data hub, elle regroupe des données liées à un domaine d’activité (par exemple la santé ou l’éducation) et les rend disponibles pour l’exploitation par les parties prenantes.

 

Afin de mieux structurer ces données terminologiques dans votre tête, consultez le détail des définitions en cliquant sur les liens !