Pour les professionnels de l’information, les opérateurs booléens représentent la clé de voûte d’une stratégie de recherche et de veille réussie.
Si de plus en plus d’outils de recherche (notamment gratuits) font disparaître les opérateurs booléens et encore plus les opérateurs de recherche avancés (opérateurs de proximité, troncature, etc.), Google, lui, n’a pas choisi cette voie-là.
Le géant américain qui reste un outil incontournable pour la veille et la recherche d’information permet depuis ses débuts (en 1998 déjà !) d’utiliser les opérateurs booléens AND
(par défaut), OR
et NOT
(matérialisé sous la forme d’un tiret -
).
Sur le papier, il est toujours possible d’entrer des mots-clés séparés par un OR :
Coronavirus OR covid-19 OR SRAS 2
, etc. ;filetype:doc OR filetype:pdf
;intitle:data OR inurl:data
par exemple.
Déjà abonné ? Connectez-vous...
L’une des difficultés dans l’exploitation de données consiste à associer le bon visuel pour valoriser l’information qui en découle. Le choix d’un mauvais support visuel peut entraîner une confusion et une mauvaise interprétation des données.
Dans cet article, nous expliquerons comment construire sa datavisualisation qui peut devenir un précieux outil lorsqu’il s’agit de traduire un ensemble de données chiffrées en information intelligible et opérationnelle. Dans un contexte professionnel, qu’elle soit sous forme d’infographie ou représentation graphique PowerPoint par exemple, la datavisualisation vient en soutien aux arguments stratégiques et s’avère extrêmement efficace dans la communication interne de l’organisme.
Il a été prouvé que le cerveau humain tend en effet, à mieux mémoriser les images par rapport au texte. Les éléments visuels seraient traités 6 000 fois plus vite par notre cerveau et 90 % des informations transmises au cerveau sont non verbales selon le Dr Lynell Burmark et le Dr Paul Martin Lester.
Aussi attrayante soit-elle, la datavisualisation requiert une bonne connaissance de l’auditoire, de l’entreprise et de ses enjeux, mais également une structure solide et une réflexion en amont dont voici les grands points :
Déjà abonné ? Connectez-vous...
Si la société Mediatree a été créée dès 2007 et se proclame « leader de la veille audiovisuelle en France », elle reste pourtant méconnue des professionnels de l’information. Grâce à des technologies de pointe brevetées, cette société française est en mesure de capter et d’indexer en temps réel le contenu de plus de 5 000 chaînes de télévision et radio dans le monde.
Ses premiers clients furent des sociétés de production audiovisuelle désireuses de retrouver des extraits sonores ou vidéo et de pouvoir les réutiliser au sein d’émissions ou de documentaires. Mais ce service a très vite aussi intéressé les responsables de communication au sein de services gouvernementaux, de sociétés de grandes marques ou d’associations, qui souhaitaient disposer d’un outil leur permettant de couvrir les médias audiovisuels pour y réaliser toutes sortes de recherches, de veilles d’image ou de réputation.
Depuis le début de l’année 2020, Mediatree cherche à se faire mieux connaître auprès des professionnels de l’information. Son service de veille audiovisuelle accessible sur le web, baptisé tout simplement Keywords, est proposé, avec un tarif adapté, directement aux veilleurs et documentalistes, à partir de 5 000 € HT.
La page d’accueil du service propose, à l’image de Google, une simple zone de saisie dans laquelle on est invité à « taper quelque chose pour rechercher ». La recherche s’effectue en standard sur 619 chaînes dont 540 chaînes françaises (approximativement 200 chaînes de télévision et 340 chaînes radio), mais de nombreuses autres chaînes peuvent être activées immédiatement (plus de 2 000 chaînes) ou encore sur demande, la couverture annoncée de plus de 5 000 chaînes correspondant aux chaînes disponibles sur leurs positions satellites actuelles.
Ce nombre « théorique » de chaînes change tous les jours, avec l’arrivée de nouvelles disponibilités comme par exemple tout récemment plusieurs chaînes diffusées en Chine, en Grèce, en Italie, au Nigeria, au Qatar, au Ghana, en Turquie, en Algérie, en Bulgarie, etc. Le critère de disponibilité repose à la fois sur la demande exprimée par les clients et sur les marchés visés par Mediatree.
La couverture des chaînes américaines (1472) canadiennes (50) et brésiliennes (168), sera le prochain déploiement 2020.
Déjà abonné ? Connectez-vous...
Knoema et Statista sont deux plateformes fournissant des quantités importantes de données statistiques issues de milliers de sources. Elles couvrent différents secteurs, marchés ou encore pays.
Les deux plateformes se positionnent à première vue sur un même marché similaire. Pourtant, il existe entre elles des différences non négligeables et elles ne répondent pas aux mêmes besoins.
Fondé en 2011 aux États-Unis, Knoema a été lancé en 2014, dans le cadre d›une collaboration avec la Banque africaine de développement.
Parmi leurs “1 400” sources de données, on dénombre de grandes organisations internationales telles que la Banque Mondiale, le FMI, l’OCDE, Eurostat, la FAO, UNCATD, des cabinets de conseil et audit comme Deloitte, etc.
On notera que les données issues de ces sources font l’objet de vérification, mais ne sont pas retravaillées par Knoema.
Déjà abonné ? Connectez-vous...
Dans le dernier numéro de BASES, nous avions présenté une série de sources pour effectuer une veille sur le Coronavirus.
Compte tenu de l’actualité et de l’effervescence liée au sujet, de nouvelles sources voient le jour très régulièrement, sachant que certaines ressources se retrouvent dans plusieurs sites agrégeant les principales ressources sur le sujet.
Lancée en février, la nouvelle base lancée par Dialog Solutions propose aujourd’hui plus de 33 500 références bibliographiques de documents scientifiques, essentiellement des articles, ce nombre augmentant rapidement, avec une mise à jour quotidienne.
Déjà abonné ? Connectez-vous...
OUTIL DE VEILLE • Edd devient Aday, la mutation de la plateforme de veille média, pp. 1-4
AGENDA • Report des conférences et formations, p. 4
BREVETS • Les combinations sets dans la classification des brevets, p. 5
IST • Les nouveaux outils de recommandation pour l’IST, pp. 6-9
SOURCING • Quelles sources pour une veille sur le Coronavirus ? pp. 10-11
L’acteur historique de l’accès numérique à la presse française a changé discrètement de nom courant mars. Mais ce changement de nom est le reflet d’une mutation plus profonde qui a démarré il y a plusieurs années.
Né en 1989 de la fusion de G.Cam serveur et Juridial, sous le nom de l’Européenne de Données à l’époque, il a été l’un des premiers à offrir un accès en ligne aux grands quotidiens comme Le Monde ou aux dépêches de l’AFP. Racheté en 1991 par ORT, il continue alors à être commercialisé sous sa marque. Lorsque Reuters rachète ORT en 1999, l’Européenne de Données ne fait pas partie du rachat et est reprise à titre personnel par les fondateurs d’ORT. C’est en 2004 que L’Européenne de Données adopte le sigle EDD, plus facile à utiliser.
Le changement de nom est donc intervenu le 11 mars, mais la forme sociale, le capital et le numéro de RCS de l’entreprise restent inchangés.
En dehors d’un bref communiqué qui a été adressé à tous les clients, et de quelques rares articles dans la presse spécialisée de l’industrie des médias, Aday a fait connaître son changement d’identité par le biais d’articles parfois importants parus dans Le Figaro, Les Échos, Notre Temps, Le Journal du Dimanche, etc., et portant sur l’analyse média réalisée grâce à leur service Tagaday (nouveau nom de Press’EDD) autour des sujets mainstream du moment que sont les tristes féminicides, et l’inévitable coronavirus.
Déjà abonné ? Connectez-vous...
Il existe, ou il a existé, plusieurs classifications de brevets reposant sur les éléments constitutifs de chaque brevet.
La plus récente est la Classification Coopérative des brevets (CPC) qui est une extension de la Classification Internationale des Brevets (CIB), créée par l’Arrangement de Strasbourg de 1971, qui est un système hiérarchique de classement des brevets selon les différents domaines technologiques auxquels ils appartiennent.
Cette nouvelle classification des brevets est gérée conjointement par l’Office Européen des Brevets (OEB) et l’United States Patent and Trademark Office (USPTO) et intègre les meilleures pratiques de classification des deux offices. Sa création a été initiée en 1990 par un accord entre les deux offices et elle a été mise à disposition au début de 2003.
L’objectif était de classifier des éléments spécifiques présents de façon combinée dans un brevet. Plutôt que de créer de nouvelles classifications pour les représenter, ce qui aurait fait croître de façon considérable le nombre de classes, il a été décidé de créer des combination sets ou C-Sets, « jeux de combinaison » selon la traduction de l’OEB, regroupant au moins deux classes.
Si on entre dans une stratégie de recherche une ou plusieurs combinaison sets, on est donc supposé trouver moins de documents, mais qui sont plus pertinents que si l’on n’avait pas procédé ainsi en entrant les classes séparément.
Ces C-Sets ne sont pas utilisés/utilisables dans tous les domaines.
D’après Derwent cité par STN et qui fait partie de son catalogue, en mars 2019, les domaines dans lesquels les C-Sets étaient les plus utilisés étaient les semi-conducteurs (classe H01L) avec environ 240 000 documents, la composition de polymères (classe C08L) avec environ 205 000 documents.
Déjà abonné ? Connectez-vous...
Depuis deux ou trois ans, le nombre de nouveaux outils pour la recherche d’information scientifique et technique est en nette progression, ce qui est une bonne nouvelle. Et cerise sur le gâteau, la majorité de ces outils fonctionne sur un modèle de gratuité.
La principale raison de cette prolifération d’outils est simple : il y a d’une part le développement de l’open science (articles scientifiques en open access, ouvertures des données de la recherche) qui fournit une matière précieuse au développement de nouveaux projets et outils et d’autre part les récentes avancées de l’IA qui permettent de proposer des outils d’un nouveau genre.
En 2020, la trajectoire semble se confirmer et de nouveaux outils de recommandation automatique de contenus appliqués à l’IST ont récemment fait leur apparition.
Nous avons choisi dans cet article de faire le point sur ces nouveaux outils de recommandation de contenus en l’occurrence Meta, Scitrus, Sparrho et CoCites.
Même si ces différents outils proposent des corpus et des fonctionnalités différentes, ils ont néanmoins plusieurs points communs :
Déjà abonné ? Connectez-vous...
Actualité oblige, de nombreux professionnels de l’information se retrouvent à devoir effectuer recherches d’information ou veilles sur le sujet du coronavirus.
Mais cela n’a rien de simple tant le volume d’information à l’échelle mondiale illustre parfaitement le concept de surinformation.
Un volume d’information impossible à gérer humainement
Du côté de la presse par exemple, Tagaday (ex-Pressedd) recensait plus de 19 000 mentions du coronavirus dans la presse française en mars 2020 (voir figure 1.).
Mediatree relevait quant à lui plus de 49 000 mentions sur les radios et TV françaises entre le 19 et le 25 mars. Et on se situe ici uniquement au niveau français...
Les articles scientifiques ne sont bien sûr pas en reste. Les bases de preprints (donc non validés par les pairs) MedrXiv et BiorXiv dépassent déjà les 1 000 articles dédiés au Coronavirus.
Enfin, les réseaux sociaux ne parlent pratiquement plus que de cela.
Figure 1. Analyse médias sur le Coronavirus réalisée par Tagaday
Déjà abonné ? Connectez-vous...