290 pages - mai 2023
ISBN papier : 9781789480733
ISBN ebook : 9781789490732

Code ERC :

PE6 Computer Science and Informatics
PE6_10 Web and information systems, database systems, information retrieval and digital libraries, data fusion

Effacer

– Papier (Collections classiques, Encyclopédie SCIENCES) :
Livraison offerte pour toute commande directe effectuée sur le site istegroup.com
Délai de livraison : environ deux semaines
Envois uniquement vers : France métropolitaine, Belgique, Suisse et Luxembourg
Impression en couleur
Un ebook de l’ouvrage (à l’exception des titres de l’Encyclopédie SCIENCES) est offert pour tout achat
de sa version papier sur notre site, il vous sera envoyé après la finalisation de votre commande
Offre non applicable aux librairies

– Ebook (Collections classiques, Encyclopédie SCIENCES, Abrégés) :
Prix réservé aux particuliers
Pour les institutions : nous contacter 
Nos ebooks sont au format PDF (compatible sur tout support)

Plateformes de partage, de réutilisation et de conservation de données, les entrepôts de données de recherche sont des infrastructures au coeur de la politique pour la science ouverte.

Partage et valorisation des données de recherche propose une approche globale de ces entrepôts de données, de leurs fonctionnalités, usages, enjeux et perspectives. Il analyse le paysage des entrepôts en France, discute le concept d’un entrepôt national (avec une étude comparative de plusieurs dispositifs nationaux), décrit le répertoire international re3data et réunit six études de cas d’entrepôts modèles, publics et privés (CDS, Data INRAE, SEANOE, Nakala, Figshare, Data Mendeley). L’annexe contient plusieurs sites web et des textes de référence du ministère de l’Enseignement supérieur, de la Recherche et du CNRS.

Premier ouvrage entièrement consacré à ces nouvelles plateformes, il s’adresse aux chercheurs, aux enseignants, aux étudiants et aux professionnels des données et de l’information scientifique et technique.

1. Le dispositif d’entrepôt de données de recherche
2. Le paysage des entrepôts de données de recherche en France
3. La communauté internationale : le Centre de données astronomiques de Strasbourg
4. Data INRAE : l’entrepôt en réseau
5. SEANOE, un entrepôt thématique
6. Nakala : service de publication de données
7. L’option d’un entrepôt national
8. Étude comparative des services nationaux de recherche
9. Mendeley Data
10. Figshare : une place pour les résultats de la recherche scientifique ouverte
11. COREF : un projet pour le développement de re3data
12. Enjeux et perspectives des entrepôts de données de recherche

Joachim Schöpfel

Joachim Schöpfel est maître de conférences en sciences de l’information et de la communication à l’Université de Lille. Il est membre du Laboratoire GERiiCO et du conseil d’euroCRIS. Il est également consultant indépendant du cabinet Ourouk.

Violaine Rebouillat

Violaine Rebouillat est membre associée du Laboratoire Dicen-IDF. Ses travaux analysent les représentations et pratiques scientifiques liées à la production, l’utilisation et la gestion des données de recherche dans un contexte de science ouverte.

Chapitre 1

Le dispositif d’entrepôt de données de recherche (pages : 7-37)

Qu’est-ce qu’un entrepôt de données de recherche ou, en anglais, un research data repository ? D’où vient ce terme ? Comment décrire ce dispositif ? Le premier chapitre essaie de répondre à toutes ces questions, même si le paysage des entrepôts est caractérisé par une grande variété et hétérogénéité. La question de la confiance est au cœur du développement des entrepôts de données de recherche – confiance aussi bien dans le contenu que dans la qualité du dispositif. Etroitement lié à la question de la confiance est l’enjeu de la certification des entrepôts.


Chapitre 2

Le paysage des entrepôts de données de recherche en France (pages : 39-55)

Combien existe-t-il d’entrepôts de données de recherche en France ? Ce chapitre essaie de fournir une réponse à cette question, avec une analyse de la typologie des entrepôts, de leurs domaines scientifiques et de leur qualité. Mais en fait, que veut dire « en France » dans un paysage fortement internationalisé ?


Chapitre 3

La communauté internationale : le Centre de données astronomiques de Strasbourg (pages : 57-71)

L’astronomie a été, et reste, une discipline pionnière pour le partage des données scientifiques. Ce chapitre retrace le développement du Centre de Données astronomiques de Strasbourg (CDS) depuis sa création en 1972. Le CDS est exemplaire à plusieurs égards : certification CTS, FAIRisation des données, proximité avec la recherche, rôle international… Aujourd’hui, le CDS fait face à plusieurs enjeux – l’évolution rapide de la recherche avec de nouveaux outils, équipements et types de données, la volumétrie des données à gérer, et l’intégration au sein du cloud des infrastructures européennes.


Chapitre 4

Data INRAE : l’entrepôt en réseau (pages : 73-86)

Depuis 2018, l’Institut national de recherche pour l’agriculture, l’alimentation et l’environnement (INRAE) met à disposition de ses chercheurs un entrepôt pour le signalement et le dépôt des données de recherche. Cet entrepôt, dénommé Data INRAE , est basé sur l’application open source Dataverse . Nous avons interrogé Esther Dzalé Yeumo, responsable du pôle “Numérique pour la Science” au sein de la Direction pour la Science Ouverte (DipSO), sur le choix de cette solution, sur les avantages qu’elle présente pour un institut comme l’INRAE et, plus généralement, sur ses fonctionnalités et usages.


Chapitre 5

SEANOE, un entrepôt thématique (pages : 87-106)

L’Institut français de recherche pour l’exploitation de la mer (Ifremer) a développement un entrepôt pour les données issues de la recherche marine, appelé SEANOE (Sea Scientific Open Data Edition). SEANOE est diffusé dans le portail des données marines de l’Ifremer. Il ne s’agit pas d’un entrepôt institutionnel, dans la mesure où le dispositif s’adresse à tous les chercheurs du domaine. Quelles sont les particularités de SEANOE ? Quel est son usage ? Est-il FAIR ? Quels sont les enjeux et pistes de développement ?


Chapitre 6

Nakala : service de publication de données (pages : 107-126)

Depuis 2013, la très grande infrastructure de recherche (TGIR) Huma-Num offre à la communauté des sciences humaines et sociales (SHS) un service de publication de données, baptisé Nakala. Fondé sur un socle commun, permettant le stockage et l’organisation des fichiers, Nakala s’articule avec des outils d’éditorialisation modulables, donnant la possibilité à chaque projet de recherche de créer sa propre interface web d’accès aux données. En quoi ce dispositif particulier répond aux attentes de la communauté des SHS en France et comment il s’adapte aux politiques d’ouverture des données de la recherche ?


Chapitre 7

L’option d’un entrepôt national (pages : 127-145)

Ce chapitre analyse la demande et décrit les fonctionnalités et caractéristiques d’un entrepôt de données de recherche à vocation nationale. Certains pays ont mis en place un tel entrepôt, d’autres non. Pourquoi ? Quelles sont les alternatives ?


Chapitre 8

Étude comparative des services nationaux de recherche (pages : 147-166)

Plusieurs pays ont mis en place une infrastructure nationale pour la diffusion et la conservation des données de recherche. Dans le cadre d’un groupe de travail du Comité pour la science ouverte, l’auteur a réalisé une étude comparative de ces infrastructures dans sept pays. Quels sont les objectifs, missions et modalités de gouvernance de ces infrastructures ? Quels sont leurs modèles économiques ? Quels sont les principaux fonctionnalités et services ? Ce chapitre propose une synthèse de cette étude.


Chapitre 9

Mendeley Data (pages : 167-191)

Mendeley a été lancé en 2008 à Londres par des étudiants, comme un réseau social scientifique pour gérer et partager des publications. Après son rachat par Elsevier en 2013, d’autres services et fonctionnalités ont été ajoutés à Mendeley, dont en particulier un service dédié aux données de recherche. Mendeley Data – le nom de ce nouveau service – est en même temps un entrepôt de données et un moteur de recherche pour trouver des données dans d’autres entrepôts. Nous avons demandé à Elsevier de nous parler de ce service, de ses particularités, de son positionnement, ses enjeux, ses perspectives.


Chapitre 10

Figshare : une place pour les résultats de la recherche scientifique ouverte (pages : 193-216)

Lancé en 2012, Figshare est aujourd’hui l’un des grands entrepôts de données de recherche internationaux. Quel est son statut ? Quels sont ses objectifs, ses fonctionnalités, ses points forts ? La plupart des entrepôts sont disciplinaires. Quelle est la place pour un entrepôt généraliste ou générique ? Quels sont les enjeux et les perspectives ?


Chapitre 11

COREF : un projet pour le développement de re3data (pages : 217-230)

Re3data est un répertoire international multidisciplinaire gratuit d'entrepôts de données de recherche. Il est a été lancé en 2012 avec un financement par la Fondation allemande pour la recherche (DFG). Aujourd’hui, re3data est considéré comme une plateforme de référence pour signaler et trouver des entrepôts thématiques de données de recherche dans plus de 80 pays. Ce chapitre présente le répertoire, ses objectifs, son développement et ses fonctionnalités, et il décrit les évolutions en cours.


Chapitre 12

Enjeux et perspectives des entrepôts de données de recherche (pages : 231-250)

Les entrepôts jouent un rôle essentiel pour la gestion des données de la recherche. Ce dernier chapitre résume les principaux enjeux auxquels ces dispositifs font face ; parmi ces enjeux, nous évoquerons non seulement la volumétrie et la complexité des données, l’intégration dans l’écosystème des infrastructures de recherche et l’ouverture vers l’international, mais également la qualité des données et l’acceptation par les chercheurs. Quelles sont les perspectives ? L’avenir des entrepôts sera conditionné par l’évolution scientifique et technologique, par des choix politiques et économiques, mais aussi par la recherche d’un équilibre entre les besoins spécifiques des communautés et la tendance vers la standardisation et, last not least, par la prise en compte du facteur humain.