Knoema et Statista sont deux plateformes fournissant des quantités importantes de données statistiques issues de milliers de sources. Elles couvrent différents secteurs, marchés ou encore pays.
Les deux plateformes se positionnent à première vue sur un même marché similaire. Pourtant, il existe entre elles des différences non négligeables et elles ne répondent pas aux mêmes besoins.
Fondé en 2011 aux États-Unis, Knoema a été lancé en 2014, dans le cadre d›une collaboration avec la Banque africaine de développement.
Parmi leurs “1 400” sources de données, on dénombre de grandes organisations internationales telles que la Banque Mondiale, le FMI, l’OCDE, Eurostat, la FAO, UNCATD, des cabinets de conseil et audit comme Deloitte, etc.
On notera que les données issues de ces sources font l’objet de vérification, mais ne sont pas retravaillées par Knoema.
Déjà abonné ? Connectez-vous...
Dans le dernier numéro de BASES, nous avions présenté une série de sources pour effectuer une veille sur le Coronavirus.
Compte tenu de l’actualité et de l’effervescence liée au sujet, de nouvelles sources voient le jour très régulièrement, sachant que certaines ressources se retrouvent dans plusieurs sites agrégeant les principales ressources sur le sujet.
Lancée en février, la nouvelle base lancée par Dialog Solutions propose aujourd’hui plus de 33 500 références bibliographiques de documents scientifiques, essentiellement des articles, ce nombre augmentant rapidement, avec une mise à jour quotidienne.
Déjà abonné ? Connectez-vous...
OUTIL DE VEILLE • Edd devient Aday, la mutation de la plateforme de veille média, pp. 1-4
AGENDA • Report des conférences et formations, p. 4
BREVETS • Les combinations sets dans la classification des brevets, p. 5
IST • Les nouveaux outils de recommandation pour l’IST, pp. 6-9
SOURCING • Quelles sources pour une veille sur le Coronavirus ? pp. 10-11
L’acteur historique de l’accès numérique à la presse française a changé discrètement de nom courant mars. Mais ce changement de nom est le reflet d’une mutation plus profonde qui a démarré il y a plusieurs années.
Né en 1989 de la fusion de G.Cam serveur et Juridial, sous le nom de l’Européenne de Données à l’époque, il a été l’un des premiers à offrir un accès en ligne aux grands quotidiens comme Le Monde ou aux dépêches de l’AFP. Racheté en 1991 par ORT, il continue alors à être commercialisé sous sa marque. Lorsque Reuters rachète ORT en 1999, l’Européenne de Données ne fait pas partie du rachat et est reprise à titre personnel par les fondateurs d’ORT. C’est en 2004 que L’Européenne de Données adopte le sigle EDD, plus facile à utiliser.
Le changement de nom est donc intervenu le 11 mars, mais la forme sociale, le capital et le numéro de RCS de l’entreprise restent inchangés.
En dehors d’un bref communiqué qui a été adressé à tous les clients, et de quelques rares articles dans la presse spécialisée de l’industrie des médias, Aday a fait connaître son changement d’identité par le biais d’articles parfois importants parus dans Le Figaro, Les Échos, Notre Temps, Le Journal du Dimanche, etc., et portant sur l’analyse média réalisée grâce à leur service Tagaday (nouveau nom de Press’EDD) autour des sujets mainstream du moment que sont les tristes féminicides, et l’inévitable coronavirus.
Déjà abonné ? Connectez-vous...
Il existe, ou il a existé, plusieurs classifications de brevets reposant sur les éléments constitutifs de chaque brevet.
La plus récente est la Classification Coopérative des brevets (CPC) qui est une extension de la Classification Internationale des Brevets (CIB), créée par l’Arrangement de Strasbourg de 1971, qui est un système hiérarchique de classement des brevets selon les différents domaines technologiques auxquels ils appartiennent.
Cette nouvelle classification des brevets est gérée conjointement par l’Office Européen des Brevets (OEB) et l’United States Patent and Trademark Office (USPTO) et intègre les meilleures pratiques de classification des deux offices. Sa création a été initiée en 1990 par un accord entre les deux offices et elle a été mise à disposition au début de 2003.
L’objectif était de classifier des éléments spécifiques présents de façon combinée dans un brevet. Plutôt que de créer de nouvelles classifications pour les représenter, ce qui aurait fait croître de façon considérable le nombre de classes, il a été décidé de créer des combination sets ou C-Sets, « jeux de combinaison » selon la traduction de l’OEB, regroupant au moins deux classes.
Si on entre dans une stratégie de recherche une ou plusieurs combinaison sets, on est donc supposé trouver moins de documents, mais qui sont plus pertinents que si l’on n’avait pas procédé ainsi en entrant les classes séparément.
Ces C-Sets ne sont pas utilisés/utilisables dans tous les domaines.
D’après Derwent cité par STN et qui fait partie de son catalogue, en mars 2019, les domaines dans lesquels les C-Sets étaient les plus utilisés étaient les semi-conducteurs (classe H01L) avec environ 240 000 documents, la composition de polymères (classe C08L) avec environ 205 000 documents.
Déjà abonné ? Connectez-vous...
Depuis deux ou trois ans, le nombre de nouveaux outils pour la recherche d’information scientifique et technique est en nette progression, ce qui est une bonne nouvelle. Et cerise sur le gâteau, la majorité de ces outils fonctionne sur un modèle de gratuité.
La principale raison de cette prolifération d’outils est simple : il y a d’une part le développement de l’open science (articles scientifiques en open access, ouvertures des données de la recherche) qui fournit une matière précieuse au développement de nouveaux projets et outils et d’autre part les récentes avancées de l’IA qui permettent de proposer des outils d’un nouveau genre.
En 2020, la trajectoire semble se confirmer et de nouveaux outils de recommandation automatique de contenus appliqués à l’IST ont récemment fait leur apparition.
Nous avons choisi dans cet article de faire le point sur ces nouveaux outils de recommandation de contenus en l’occurrence Meta, Scitrus, Sparrho et CoCites.
Même si ces différents outils proposent des corpus et des fonctionnalités différentes, ils ont néanmoins plusieurs points communs :
Déjà abonné ? Connectez-vous...
Actualité oblige, de nombreux professionnels de l’information se retrouvent à devoir effectuer recherches d’information ou veilles sur le sujet du coronavirus.
Mais cela n’a rien de simple tant le volume d’information à l’échelle mondiale illustre parfaitement le concept de surinformation.
Un volume d’information impossible à gérer humainement
Du côté de la presse par exemple, Tagaday (ex-Pressedd) recensait plus de 19 000 mentions du coronavirus dans la presse française en mars 2020 (voir figure 1.).
Mediatree relevait quant à lui plus de 49 000 mentions sur les radios et TV françaises entre le 19 et le 25 mars. Et on se situe ici uniquement au niveau français...
Les articles scientifiques ne sont bien sûr pas en reste. Les bases de preprints (donc non validés par les pairs) MedrXiv et BiorXiv dépassent déjà les 1 000 articles dédiés au Coronavirus.
Enfin, les réseaux sociaux ne parlent pratiquement plus que de cela.

Figure 1. Analyse médias sur le Coronavirus réalisée par Tagaday
Déjà abonné ? Connectez-vous...
IST • Les outils documentaires du CHU de Rouen : CISMeF, LiSSa et HeTP
TENDANCES • L'OSINT : illusion marketing ou nouveau champ d’investigation pur les professionnels de l’info ?
BREVES • I-expo et Documation reportés au mois de mai 2020
OPEN DATA • L’INPI vient de lancer la base gratuite data.inpi.fr
MOTEURS DE RECHERCHE • Google, toujours à l’affût de nouveaux créneaux porteurs
Dès 1995, le CHU de Rouen s’est intéressé aux sites web en langue française concernant la santé puis à la littérature médicale en langue française et a acquis une notoriété certaine. Nous avons choisi dans cet article de nous intéresser aux différents outils documentaires qu’il propose.
Cet intérêt du CHU de Rouen a débouché, dans un premier temps, sur le projet de Catalogue et Indexation des Sites Médicaux de langue française (CISMeF) qui a été réalisé par l’équipe qui appartient aujourd’hui au D2IM (Département d’Informatique et d’Information médicale du CHU hôpitaux de Rouen). Ce site s’est développé et se développe toujours de façon continue tant au niveau de son contenu que des possibilités de recherche aujourd’hui très avancées. Il a été distingué par de très nombreux prix, a reçu de nombreux labels et a bénéficié aussi du soutien financier de divers organismes.
Trois axes prioritaires ont été définis :
- les ressources concernant l’enseignement,
- la médecine factuelle (recommandations pour la bonne pratique clinique et conférence de consensus)
- les documents spécialement destinés aux patients et au grand public, dans le but de participer à l’amélioration de l’éducation sanitaire dans le monde francophone.
Déjà abonné ? Connectez-vous...
Depuis quelque temps, on voit fleurir un peu partout, sur les réseaux sociaux et en particulier dans les environnements liés à la veille et à l’intelligence économique, le terme d’« OSINT », sorte de hashtag de ralliement, entre initiés, à une cause ou une injonction secrète.
La difficulté à en saisir immédiatement le sens, - le terme semble, sinon barbare, pour le moins abscons - nous a intrigués. S’agit-il d’un nouveau concept stratégique de notre monde de l’information, d’un code communautaire ou bien, très prosaïquement, d’un hashtag «marketing » destiné à promouvoir, dans la collectivité des professionnels de l’information et sur le web, quelques consultants ou produits ?
Malgré ce développement médiatique, on est surpris du peu de définition et de formalisation qu’il y a derrière ce terme. Et de fait, le terme est issu des techniques de renseignement civil et militaire, et c’est dans ce domaine, par définition peu publicisé, qu’il a été développé et théorisé, il y a plus de vingt ans, par un certain nombre d’institutions (voir figure 1.). L’OTAN est en particulier l’un des premiers à avoir contribué à sa définition et à son référencement (https://bit.ly/2VFMLZL).
Déjà abonné ? Connectez-vous...
