Avec les années, les réseaux sociaux prennent de plus en plus d’importance dans le processus de veille et de recherche d’information et Facebook ne déroge pas à la règle.
Seul problème, Facebook n’est absolument pas conçu pour la veille et la recherche professionnelle et s’avère beaucoup plus difficile à intégrer dans son process que certains de ses concurrents et notamment Twitter. En mars dernier, Facebook a lancé une nouvelle interface pour tous ses utilisateurs à travers le monde. Si le design et l’ergonomie ont bien évidemment évolué ce qui affectera peu le veilleur, quelques fonctionnalités de recherche et filtres ont également changé.
Lire aussi :
« Facebook incontournable pour la veille et la recherche ? Fantasme ou réalité ? »
Si les logiciels de détection du plagiat sont connus et utilisés depuis plusieurs années dans le monde universitaire, on peut se demander s’ils peuvent également servir à alimenter une démarche de veille et d’intelligence économique en entreprise.
- D’une part, en détectant des contenus plagiés par d’éventuels concurrents.
- D’autre part, en les détournant légèrement de leur utilisation première pour trouver des contenus similaires qui pourront venir enrichir son sourcing ou faire émerger des informations sur des thématiques proches.
Le plagiat se définit comme l’acte de faire passer pour sien une publication d’autrui. Tous les domaines sont concernés, car à la racine du plagiat se trouve l’intention d’utiliser l’idée de quelqu’un d’autre sans les lui attribuer.
Après plusieurs mois pendant lesquels le coronavirus occupait la majorité des actualités de la veille et de la recherche d’information avec de nouvelles ressources et de nouveaux outils dédiés, on sent bien que la vie professionnelle reprend progressivement son cours avec le lancement de nouveaux outils et de nouvelles fonctionnalités et l’aboutissement de projets en cours.
Il y a quelques mois, nous avions eu l’occasion de parler d’un nouvel outil 2D Search qui permet de créer ses requêtes sur des moteurs et bases de données en 2 dimensions. L’idée étant que les requêtes peuvent être parfois longues et complexes et sont propices aux erreurs. En créant sa requête sous forme de blocs combinables, la requête est plus lisible et plus facilement modifiable. À l’époque, l’outil intégrait déjà Google, Google Scholar (même si nous ne recommandions pas son utilisation sur la suite Google), Bing, Pubmed et quelques autres.
Lire aussi :
Des outils pour optimiser ses stratégies de recherche
BASES DE DONNEES
• Korean Medical Database, p. 7
METHODOLOGIE • Comment surveiller Google Actualités ? pp. 8-10
BREVES DE VEILLE • L’actualité de la veille, p. 11
Nous avions, avec Philippe Bodart (Total Research & Technology, Feluy-CFIB) déploré dans un précédent numéro de BASES la baisse régulière depuis plusieurs années du nombre d’articles d’origine asiatique référencés dans les bases de données/agrégateurs/serveurs occidentaux ».
Le producteur de Chemical Abstracts Services nous avait à cette occasion, expliqué que le nombre de brevets déposés dans cette zone croissait fortement et qu’ils avaient, au moins pour un temps, privilégié les brevets par rapport à la littérature. Les références à cette dernière étant supposées, à terme, ré-augmenter suite à l’embauche de nouveaux experts.
Nous avions annoncé alors que nous explorerions les bases de données de certains de ces pays avec l’aide du bureau Asie de l’OEB (Office Européen des Brevets) à Vienne que nous tenons à remercier ici.
Lire aussi :
Forte chute des références d’articles en langue asiatique dans Chemical Abstracts
DBpia (DataBase Periodical Information Academic - https://www.dbpia.co.kr ) a été lancée en octobre 1998 sous forme d’un CD-Rom mais est passée à Internet dès l’année suivante.
De nombreux développements ont été réalisés régulièrement. Le dernier en date (en 2019), a vu une réorganisation complète du site et le remplacement du moteur de recherche.
DBpia se présente comme la première base de données de contenus académiques d’origine coréenne à destination, en priorité, des universités coréennes.
Clarivate, qui n’a rien de coréen, est une autre banque de données payante référençant des articles d’origine coréenne dans le cadre de son produit Web of Science. Elle donne accès aux références de plus de 1,4 million d’articles parus dans plus de 2 500 publications, qui constituent la KCI Korean Journal Database produite par la National Research Foundation of Korea.
Auteur : François Libmann, Directeur de BASES Publications
La « Korean Association of Medical Journal Editors » (KAMJE) offre une série de services gratuits donnant accès au contenu de publications coréennes couvrant la médecine, les soins dentaires, les soins infirmiers, et les soins vétérinaires, ainsi que la nutrition.
On peut considérer que le point central est la base de données d’abstracts KoreaMed qui, en août 2017, référençait plus de 260 000 articles publiés par 256 éditeurs membres de KAMJE (derniers chiffres disponibles).
Pour l’année 2019, on trouve plus de 12 000 références dont environ 9 000 à des publications en anglais et environ 3 000 à des publications en coréen.
Dans KoreaMed, on dispose d’une recherche simple et d’une recherche avancée laquelle permet de combiner plusieurs lignes de recherche avec les opérateurs AND, OR ou NOT. Dans chaque ligne, on a le choix entre la recherche dans tous les champs ou bien de choisir dans une douzaine de champs. On dispose aussi de filtres, en particulier sur la langue de l’article, anglais ou coréen.
RISS International (http://intl.riss.kr/) est une banque de données produite par le KERIS (Korea Education and Research Information Service), un organisme appartenant au ministère coréen de l’Éducation.
Les missions du KERIS sont multiples autour d’un concept mêlant éducation et information numérique.La production et la diffusion de la banque de données RISS font partie de ses missions.
Elle propose plus de 6 millions d’articles dont près de 30% proviennent de KERIS même et les autres de « commercial vendors », principalement de DBpia, Scola, et Kiss, plus de 2 millions de thèses provenant de 227 universités coréennes, plus de 9 millions de livres, pas nécessairement d’origine coréenne, ainsi que quelques rapports de recherche.
Koreascience (Koreascience.or.kr) est produite par The Korea Institute of Science and Technology Information (KISTI). Celui-ci a beaucoup évolué depuis sa création en 1962 sous le nom de KORSTIC (Korea Center for Science and Technology Information).
Cet organisme met à disposition des Coréens la plateforme NDSL, qui propose environ 100 millions de documents de toutes natures et de toutes origines, tant au niveau des brevets non coréens, que de la littérature. Cela a donc peu d’intérêt pour des utilisateurs européens qui disposent de beaucoup d’autres sources plus faciles d’accès.
Il existe une autre base de données coréenne proposant des informations biomédicales gratuites.
Cette banque de données baptisée Korean Medical Article Database (KMbase) (http://en.medric.or.kr/)propose des références de 1 027 publications coréennes et de 4 892 publications non coréennes.
L’objectif des producteurs de cette base de donnée est de référencer le maximum de publications médicales d’origine coréenne. Ils attirent attire l’attention de leurs utilisateurs sur le fait qu’elle n’effectue aucune évaluation des articles dont elle fournit les références, renvoyant cette évaluation à ses utilisateurs.
Dans la recherche avancée, on peut combiner des étapes en les liant avec des opérateurs booléens et on peut aussi limiter les dates.
Auteur : François Libmann, Directeur de BASES Publications
Google News, ou Google Actualités dans sa version francophone, est l’un des services incontournables de Google pour les veilleurs et les professionnels de l’information. Il peut paraître plutôt simpliste a priori, mais les moyens d’y accéder et de le surveiller ne sont pas si limpides.
C’est pourquoi nous nous proposons de faire ici un point sur son contenu, son histoire, ses points d’accès et enfin les différents paramétrages, méthodes et outils à disposition pour surveiller une requête dans Google Actualités, qui comme on va le voir, peuvent faire considérablement varier les résultats.
En cette période particulière, l’actualité de la veille et de la recherche d’information est très différente du paysage habituel. Une majorité des actualités et informations traitent des ressources d’information autour du coronavirus, la gratuité temporaire de certains outils et sources d’information ainsi que du thème du télétravail.
MÉTHODOLOGIE • Faut-il proscrire les opérateurs booléens sur Google : nous avons testé, pp. 1-3
DATAVIZ • Enrichir ses livrables de veille grâce à la datavisualisation, p. 4-5
OUTIL DE VEILLE • Mediatree veut faire profiter les veilleurs et professionnels de l’information de sa technologie de veille audiovisuelle, p. 6-8
BASES DE DONNEES • Knoema et Statista, deux portails incontournables pour la recherche de statistiques, pp. 9-10
BASES DE DONNEES • De nouvelles ressources gratuites sur le COVID-19 p. 11
Pour les professionnels de l’information, les opérateurs booléens représentent la clé de voûte d’une stratégie de recherche et de veille réussie.
Si de plus en plus d’outils de recherche (notamment gratuits) font disparaître les opérateurs booléens et encore plus les opérateurs de recherche avancés (opérateurs de proximité, troncature, etc.), Google, lui, n’a pas choisi cette voie-là.
Le géant américain qui reste un outil incontournable pour la veille et la recherche d’information permet depuis ses débuts (en 1998 déjà !) d’utiliser les opérateurs booléens AND
(par défaut), OR
et NOT
(matérialisé sous la forme d’un tiret -
).
L’une des difficultés dans l’exploitation de données consiste à associer le bon visuel pour valoriser l’information qui en découle. Le choix d’un mauvais support visuel peut entraîner une confusion et une mauvaise interprétation des données.
Dans cet article, nous expliquerons comment construire sa datavisualisation qui peut devenir un précieux outil lorsqu’il s’agit de traduire un ensemble de données chiffrées en information intelligible et opérationnelle. Dans un contexte professionnel, qu’elle soit sous forme d’infographie ou représentation graphique PowerPoint par exemple, la datavisualisation vient en soutien aux arguments stratégiques et s’avère extrêmement efficace dans la communication interne de l’organisme.
Si la société Mediatree a été créée dès 2007 et se proclame « leader de la veille audiovisuelle en France », elle reste pourtant méconnue des professionnels de l’information. Grâce à des technologies de pointe brevetées, cette société française est en mesure de capter et d’indexer en temps réel le contenu de plus de 5 000 chaînes de télévision et radio dans le monde.
Ses premiers clients furent des sociétés de production audiovisuelle désireuses de retrouver des extraits sonores ou vidéo et de pouvoir les réutiliser au sein d’émissions ou de documentaires. Mais ce service a très vite aussi intéressé les responsables de communication au sein de services gouvernementaux, de sociétés de grandes marques ou d’associations, qui souhaitaient disposer d’un outil leur permettant de couvrir les médias audiovisuels pour y réaliser toutes sortes de recherches, de veilles d’image ou de réputation.
Knoema et Statista sont deux plateformes fournissant des quantités importantes de données statistiques issues de milliers de sources. Elles couvrent différents secteurs, marchés ou encore pays.
Les deux plateformes se positionnent à première vue sur un même marché similaire. Pourtant, il existe entre elles des différences non négligeables et elles ne répondent pas aux mêmes besoins.
Dans le dernier numéro de BASES, nous avions présenté une série de sources pour effectuer une veille sur le Coronavirus.
Compte tenu de l’actualité et de l’effervescence liée au sujet, de nouvelles sources voient le jour très régulièrement, sachant que certaines ressources se retrouvent dans plusieurs sites agrégeant les principales ressources sur le sujet.
Lancée en février, la nouvelle base lancée par Dialog Solutions propose aujourd’hui plus de 33 500 références bibliographiques de documents scientifiques, essentiellement des articles, ce nombre augmentant rapidement, avec une mise à jour quotidienne.
OUTIL DE VEILLE • Edd devient Aday, la mutation de la plateforme de veille média, pp. 1-4
AGENDA • Report des conférences et formations, p. 4
BREVETS • Les combinations sets dans la classification des brevets, p. 5
IST • Les nouveaux outils de recommandation pour l’IST, pp. 6-9
SOURCING • Quelles sources pour une veille sur le Coronavirus ? pp. 10-11
L’acteur historique de l’accès numérique à la presse française a changé discrètement de nom courant mars. Mais ce changement de nom est le reflet d’une mutation plus profonde qui a démarré il y a plusieurs années.
Né en 1989 de la fusion de G.Cam serveur et Juridial, sous le nom de l’Européenne de Données à l’époque, il a été l’un des premiers à offrir un accès en ligne aux grands quotidiens comme Le Monde ou aux dépêches de l’AFP. Racheté en 1991 par ORT, il continue alors à être commercialisé sous sa marque. Lorsque Reuters rachète ORT en 1999, l’Européenne de Données ne fait pas partie du rachat et est reprise à titre personnel par les fondateurs d’ORT. C’est en 2004 que L’Européenne de Données adopte le sigle EDD, plus facile à utiliser.
Il existe, ou il a existé, plusieurs classifications de brevets reposant sur les éléments constitutifs de chaque brevet.
La plus récente est la Classification Coopérative des brevets (CPC) qui est une extension de la Classification Internationale des Brevets (CIB), créée par l’Arrangement de Strasbourg de 1971, qui est un système hiérarchique de classement des brevets selon les différents domaines technologiques auxquels ils appartiennent.
Cette nouvelle classification des brevets est gérée conjointement par l’Office Européen des Brevets (OEB) et l’United States Patent and Trademark Office (USPTO) et intègre les meilleures pratiques de classification des deux offices. Sa création a été initiée en 1990 par un accord entre les deux offices et elle a été mise à disposition au début de 2003.
Depuis deux ou trois ans, le nombre de nouveaux outils pour la recherche d’information scientifique et technique est en nette progression, ce qui est une bonne nouvelle. Et cerise sur le gâteau, la majorité de ces outils fonctionne sur un modèle de gratuité.
La principale raison de cette prolifération d’outils est simple : il y a d’une part le développement de l’open science (articles scientifiques en open access, ouvertures des données de la recherche) qui fournit une matière précieuse au développement de nouveaux projets et outils et d’autre part les récentes avancées de l’IA qui permettent de proposer des outils d’un nouveau genre.
En 2020, la trajectoire semble se confirmer et de nouveaux outils de recommandation automatique de contenus appliqués à l’IST ont récemment fait leur apparition.
Nous avons choisi dans cet article de faire le point sur ces nouveaux outils de recommandation de contenus en l’occurrence Meta, Scitrus, Sparrho et CoCites.
Actualité oblige, de nombreux professionnels de l’information se retrouvent à devoir effectuer recherches d’information ou veilles sur le sujet du coronavirus.
Mais cela n’a rien de simple tant le volume d’information à l’échelle mondiale illustre parfaitement le concept de surinformation.
Un volume d’information impossible à gérer humainement
Du côté de la presse par exemple, Tagaday (ex-Pressedd) recensait plus de 19 000 mentions du coronavirus dans la presse française en mars 2020 (voir figure 1.).
Mediatree relevait quant à lui plus de 49 000 mentions sur les radios et TV françaises entre le 19 et le 25 mars. Et on se situe ici uniquement au niveau français...
Les articles scientifiques ne sont bien sûr pas en reste. Les bases de preprints (donc non validés par les pairs) MedrXiv et BiorXiv dépassent déjà les 1 000 articles dédiés au Coronavirus.
Enfin, les réseaux sociaux ne parlent pratiquement plus que de cela.
IST • Les outils documentaires du CHU de Rouen : CISMeF, LiSSa et HeTP
TENDANCES • L'OSINT : illusion marketing ou nouveau champ d’investigation pur les professionnels de l’info ?
BREVES • I-expo et Documation reportés au mois de mai 2020
OPEN DATA • L’INPI vient de lancer la base gratuite data.inpi.fr
MOTEURS DE RECHERCHE • Google, toujours à l’affût de nouveaux créneaux porteurs
Dès 1995, le CHU de Rouen s’est intéressé aux sites web en langue française concernant la santé puis à la littérature médicale en langue française et a acquis une notoriété certaine. Nous avons choisi dans cet article de nous intéresser aux différents outils documentaires qu’il propose.
Cet intérêt du CHU de Rouen a débouché, dans un premier temps, sur le projet de Catalogue et Indexation des Sites Médicaux de langue française (CISMeF) qui a été réalisé par l’équipe qui appartient aujourd’hui au D2IM (Département d’Informatique et d’Information médicale du CHU hôpitaux de Rouen). Ce site s’est développé et se développe toujours de façon continue tant au niveau de son contenu que des possibilités de recherche aujourd’hui très avancées. Il a été distingué par de très nombreux prix, a reçu de nombreux labels et a bénéficié aussi du soutien financier de divers organismes.
Depuis quelque temps, on voit fleurir un peu partout, sur les réseaux sociaux et en particulier dans les environnements liés à la veille et à l’intelligence économique, le terme d’« OSINT », sorte de hashtag de ralliement, entre initiés, à une cause ou une injonction secrète.
La difficulté à en saisir immédiatement le sens, - le terme semble, sinon barbare, pour le moins abscons - nous a intrigués. S’agit-il d’un nouveau concept stratégique de notre monde de l’information, d’un code communautaire ou bien, très prosaïquement, d’un hashtag «marketing » destiné à promouvoir, dans la collectivité des professionnels de l’information et sur le web, quelques consultants ou produits ?
Data.inpi.fr propose des données sur les entreprises issues du Registre National du Commerce et des Sociétés.
Cette base vient rejoindre les autres bases de données gratuites déjà disponibles, proposées par l’INPI sur :
les marques françaises, de l’Union Européenne et internationales ;
les brevets français, européens et internationaux ;
les dessins et modèles français et internationaux ;
Christoph Haxel qui organise AI - SDV est parfaitement capable, comme il le montre, d’adapter le nom de sa ou ses manifestation(s) pour suivre l’évolution des technologies.
En effet, AI - SDV remplace IC - SDV qui a eu lieu deux fois et qui était la fusion des deux manifestations II - SDV et ICIC. De plus, la localisation à Heidelberg a été abandonnée. La mention « AI » dans le titre illustre, bien sûr, le développement de l’intelligence artificielle et de ses applications.
C’est pourquoi, les thèmes privilégiés seront l’intelligence artificielle, la numérisation comme préalable à la mise en place d’une intelligence artificielle, l’apprentissage profond (deep learning), …
Avec Google, impossible de s’ennuyer, car l’actualité ne s’arrête jamais : nouveaux produits, évolutions de fonctionnalités, revirement de stratégie, etc. Et ce début d’année 2020 ne manque pas de nouveautés qui vont venir impacter le quotidien des professionnels de l’information pour le meilleur et pour le pire.
Les évolutions majeures concernent peu le moteur Web de Google mais surtout ses verticales thématiques : Google Datasets, Google Podcasts, ou encore Google Actualités.