Recherche de jeux de données

Le DFDR offre des fonctions de recherche puissantes pour rechercher des jeux de données publiés dans les dépôts de données de recherche au Canada, tant dans le DFDR lui-même que dans une panoplie d’autres dépôts dont les métadonnées sont moissonnées par le DFDR.

Une boîte de recherche est disponible sur plusieurs pages web du DFDR. Lancez une recherche en saisissant des termes et en cliquant sur l’icône de recherche. Les résultats apparaissent sur une page montrant les jeux de données pertinents avec des facettes permettant d’affiner les résultats.

Vous pouvez filtrer et raffiner les résultants par :

Il existe trois façons de rechercher :

1. Recherche de base

Entrez un ou plusieurs termes de recherche dans la boîte. Les résultats (au moyen de l’opérateur logique OU) dresseront la liste de tous les jeux de données correspondant à l’un ou l’autre des termes de recherche.

Prenez note que les caractères accentués sont considérés comme distincts des caractères non accentués. Ainsi, une recherche pour Quebec retournera des résultats différents qu’une recherche pour Québec.

2. Interface de recherche avancée

Cliquez sur le lien Recherche avancée pour préciser plus de paramètres de recherche, au moyen de menus déroulants, y compris : le titre, l’auteur, la description ou le sujet.

3. Recherche par syntaxe

Les chercheurs peuvent préciser une requête plus complexe au moyen d’un sous-ensemble de commandes de la syntaxe d’ElasticSearch. Cette syntaxe est puissante, mais ne laisse pas place à l’erreur.

Un exemple de requête serait :

title:(fish AND stock~) AND date:[2016-01-01 TO *]

Les exceptions à la syntaxe d’ElasticSearch propres au DFDR comprennent :

Prenez note que la recherche par syntaxe s’applique à tous les champs de métadonnées dans le DFDR et non seulement aux champs disponibles dans l’interface de Recherche avancée. Par exemple :

http://dublincore.org/documents/dcmi-terms#contributor : Smit*

Cela comprendrait tous les champs de métadonnées (pleinement définis) créés pour un groupe de stockage particulier dans le DFDR. Veuillez noter que différents dépôts rendent publics différents champs de métadonnées aux fins de moissonnage et qu’il y a des désaccords entre dépôts sur la façon d’utiliser les champs ou encore que certains champs ne sont pas remplis.

Visualisation ou téléchargement

Sur la page de résultats, chaque jeu de données correspondant à la requête est affiché accompagné des éléments suivants :

Si vous cliquez sur le nom du jeu de données, vous serez amené à la page d’accueil du jeu de données. Veuillez noter que pour les jeux de données hébergés dans un autre dépôt, si vous cliquez sur le nom du jeu de données, vous serez amené vers cet autre dépôt où les règles et les permissions d’accès ne sont pas contrôlées par le DFDR.

Les pages d’accueil varient pour chaque dépôt, mais comprennent généralement :

Les jeux de données déposés directement dans le DFDR pourront être assortis de métadonnées plus riches que ce qui est affiché sur la page de recherche. Pour obtenir les métadonnées complètes, cliquez sur le bouton « Affichage détaillé » au bas de la page d’accueil du DFDR.

Pour accéder aux fichiers de données déposés directement dans le DFDR, veuillez consulter la section de la page d’accueil du jeu de données intitulée « Fichiers dans le jeu de données ». On peut y consulter les fichiers et dossiers du répertoire principal et développer les dossiers à l’aide de l’icône « + ». Certains fichiers sont accessibles, et peuvent être prévisualisés, dans votre navigateur web. Le type de fichier que l’on peut prévisualiser dépend des capacités et des paramètres de votre navigateur web. Les petits fichiers peuvent être téléchargés par votre navigateur. Cependant, les fichiers volumineux (de plus de 10 Go) doivent être téléchargés à l’aide de Globus Connect. Les jeux de données comprenant de nombreux fichiers ou ayant une arborescence importante devraient être téléchargés à l’aide de Globus Connect plutôt que de télécharger les fichiers un à un.

Trier les résultats de recherche

La page de résultats comporte un menu déroulant pour préciser l’ordre de tri des résultats obtenus. Le tri peut se faire par auteur, titre ou date. Veuillez noter que le tri est sensible à la casse. Les titres (ou auteurs) débutant par une lettre minuscule (p. ex. « dGPS ») ou avec des caractères accentués (p. ex. « Évaluation de l’impact du programme... ») apparaîtront après « Zooplankton ».

Par défaut, les résultats de recherche sont triés par « pertinence », soit une pondération qui donne la priorité à l’information contenue dans les titres d’abord, puis les sujets, puis les descriptions.

L’ordre des résultats de recherche peut être modifié avec l’opérateur « boost » (consultez Recherche par syntaxe et syntaxe de requêtes ElasticSearch.)

Rechercher les métadonnées personnalisées

Le DFDR peut prendre en charge des schémas de métadonnées supplémentaires de sorte que les métadonnées propres à un domaine peuvent être enregistrées avec vos jeux de données, permettant ainsi d’effectuer une recherche en fonction des valeurs de ces champs de métadonnées. Par exemple, un schéma de métadonnées pour les observations astronomiques, le Common Archive Observation Model (CAOM-2.2), a été ajouté à la version Démo du DFDR, ainsi qu’un jeu de données organisé selon ce schéma.

Pour effectuer une recherche dans ces métadonnées personnalisées, la requête doit comprendre le chemin complet vers la norme de métadonnées ainsi que la ou les valeurs des champs recherchés. Par exemple, la requête suivante précise la valeur de « 47 » pour le champ de métadonnée « sequenceNumber » de la norme « caom2/1.0 », dont la norme a été copiée dans l’instance de démonstration du DFDR.

https://www.frdr.ca/schema/caom2/1.0/#sequenceNumber : 47

Cette recherche pourra repérer un jeu de données du James Clerk Maxwell Telescope (dans demo.frdr.ca). Les champs de métadonnées autres que les éléments de base de Dublin Core peuvent être consultés en cliquant sur le bouton « Affichage détaillé » au bas de la page d’accueil du jeu de données.

Les champs de métadonnées personnalisés ne sont pas accessibles à partir des menus déroulants de la page de Recherche avancée et ne sont pas accessibles comme facette de recherche. Cependant, tous les schémas de métadonnées personnalisés sont indexés dans le DFDR et disponibles pour la recherche.