• Contenu du site mis à jour le 16 avril 2024

Bases & Netsources - Accueil

L’intelligence économique commence par une veille intelligente

Europe PMC, une banque de données augmentée en sciences de la vie

François LIBMANN
Bases no
416
publié en
2023.07
2606
Réduire Augmenter Taille de la police
Europe PMC, une banque de données augmentée en sciences de ... Image 1
Europe PMC, une banque de données augmentée en sciences de ... Image 1

Il existe de très nombreuses banques de données bibliographiques de littérature scientifique. Selon les cas, les possibilités de recherche sont plutôt rustiques ou, au contraire, plus ou moins sophistiquées (indexation, opérateurs de proximité, troncatures, conversion des orthographes américaine et anglaises, reconnaissance des abréviations, recherche sur des valeurs numériques, liens citants/cités, recherche par structures chimiques, recherche dans plusieurs banques de données à la fois…).

Europe PMC (https://europepmc.org/) va plus loin même si elle n’offre pas toutes ces possibilités et nous n’hésitons pas à la qualifier de banque de données augmentée car elle permet, d’une part, de focaliser la recherche sur certaines parties d’un article, par exemple les éléments de méthodologie ou les figures. Elle permet aussi, ce qui est original, d’établir, à partir du contenu d’une référence des liens avec plusieurs banques de données externes plutôt factuelles/numériques, spécialisées dans le domaine des sciences de la vie telles que ChEMBL-small molecules ou MGnify-Metagenomics.

Analyse et évaluation du contenu

Commençons par le contenu, totalement en open access qui est très diversifié tout en restant centré sur les sciences de la vie.

Europe PMC présente, d’une part, ses contenus d’une façon globale, chiffres régulièrement mis à jour :

● 42,7 millions de références dont 35,9 millions venant de PubMed/Medline comme le nom de cette banque de données le laisse entendre. A noter que 70% d'entre elles ont un abstract ;

● 9 millions d’articles en texte intégral ;

● 0,92 millions de références de documents issues de la banque de données Agricola (qui en offre 8,3 millions). Les références les plus récentes apparaissent comme étant publiées en … 2 122. Vérification faite sur le site web, il s’agit bien de 2 023. La plus ancienne date de 1 885 ;

● 4,2 millions de brevets provenant de la banque de données Espacenet de l’OEB (qui en propose 140 millions en tout) ;

● 2 262 NHS guidelines qui sont des « evidence reviews ». Elles sont produites par le plus important organisme de santé au Royaume-Uni. On y accède spécifiquement de la façon suivante, qui est loin d’être intuitive (Cf. Figure 1.) : dans la boite de la recherche simple il faut entrer PUBLISHER:"nice" OR PUBLISHER:"national institute for health and clinical excellence" OR PUBLISHER:"national institute for health and care excellence"

● 628 045 preprints qui proviennent de 31 serveurs de preprints parmi lesquels arXiv, agriRixv, Beilstein archives, bioRxiv, preprints.org, F100 research.

Figure 1. Interface de Europe PMC

La deuxième façon de présenter le contenu est aussi plus opérationnelle puisqu’elle permet de sélectionner une ou plusieurs source(s) parmi celles présentées dans une liste.

tags

Déjà abonné ? Connectez-vous...

Les abonnés peuvent poster des commentaires ! N'hésitez pas à vous abonner à Bases et Netsources...