Accès en ligne au patrimoine culturel numerisé

Le moteur Collections donne accès librement à plus de 7,4 millions de documents et à plus de 5, 6 millions d'images de son patrimoine culturel numérisé.

Collections est un moteur de recherche sémantique permettant des interrogations en langue naturelle. La recherche s'effectue en plein-texte quels que soient la base d'origine et le type de document. Le moteur sémantique permet de retrouver un terme quelle que soit sa forme (plurielle, conjuguée, etc.) et d'étendre la recherche aux mots synonymes ou de même racine étymologique.

La recherche est donc, après analyse, étendue aux mots sémantiquement proches de ceux utilisés dans la requête.

En résumé, cette technologie permet de gérer les variantes linguistiques, en particulier syntaxiques et orthographiques du français :

- porte-clé/porte-clef/porte cle ou peinture du 18e siècle/ peinture du XVIIIe siècle

- les erreurs de frappe ou fautes d'orthographe via le correcteur orthographique (chapeau à pulme) ou phonétique (otoportret)

- la synonymie : par exemple voiture/automobile

- la déclinaison de termes (génériques en termes spécifiques) : ainsi en tapant : bijou, le moteur va ramener également les termes suivants : bague, pectoral, pendentif, boucle d'oreille, fibule, collier, bracelet, couronne, broche, diadème...que le terme bijou soit ou non présent dans les documents interrogés ;

- les dérivés morphologiques : manoir normand et manoir en Normandie

- le multilinguisme : window, door (anglais)

Pour limiter le « bruit », tous les résultats d'interrogations sont accompagnés de pavés d'affinage répartis par groupe sémantique (terme associé, qui, quand, où) avec des suggestions contextualisées et classées en fonctions de leur pertinence.