Facebook a, depuis ses débuts, l’image d’un réseau social grand public orienté vers la sphère privée avec, de fait, un intérêt limité pour la veille et la recherche d’information, à l’exception des veilles d’opinion, marketing ou encore d’e-réputation où l’on se focalise justement sur l’opinion publique.
Depuis quelques années, Facebook propose de nouvelles fonctionnalités et innovations qui l’ont fait progressivement entrer dans la sphère professionnelle, quitte à marcher dans certains cas sur les plates-bandes de Twitter ou encore de LinkedIn. Mais Facebook est-il pour autant devenu un terrain de chasse incontournable pour tous les professionnels ?
Nous sommes partis de l’hypothèse, pour cet article, que Facebook constituait une mine d’informations insoupçonnées, les lectures d’articles et d’ouvrages que nous avions pu faire au cours de dernières années pouvant aisément le laisser supposer. Qu’en est-il exactement ? C’est ce que nous avons commencé par mesurer, via l’analyse du contenu de Facebook et de ses mouvements stratégiques dans la sphère informationnelle. Nous avons ensuite exploré ses possibilités fonctionnelles en termes de recherche et veille.
Déjà abonné ? Connectez-vous...
Avention : un acteur historique de l’information business en Amérique du Nord
Depuis plus de 30 ans, la société Avention (ex-OneSource jusqu’en 2014) est un acteur clé de l’information business et plus précisément l’information sur les entreprises, industries et marchés.
Son marché principal est historiquement en Amérique du Nord mais l’entreprise est également présente dans le reste du monde et notamment en Europe. L’entreprise dispose d’ailleurs de bureaux à Londres pour couvrir le continent européen avec des équipes maîtrisant les différentes langues dont le français. Elle reste néanmoins peu connue en France.
Avention propose deux produits à même d’intéresser les professionnels de l’information :
Le maintien de deux interfaces distinctes répond surtout à une demande de clients qui ne souhaitaient pas basculer sur la nouvelle plateforme.
Nous avons eu l’occasion de tester l’interface OneSource et c’est donc ce produit que nous détaillons dans cet article.
Déjà abonné ? Connectez-vous...
Alice Guilhon, Nicolas Moinet, Pearson, décembre 2016, 320 pages, 31€
Cécile Touitou, Presses de l’Enssib , novembre 2016, 184 pages, 22€
Déjà abonné ? Connectez-vous...
MÉTHODOLOGIE • La recherche d’information audio sur le Web
ICIC 2016
• Chemzent : à l'origine des publications en chimie
• Reprints Desk propose la location d'articles avant un éventuel achat
SERVEURS
• Questel : retour de l'offre marques
• Nombreux changements annoncés par Questel pour Orbit
ACTUALITÉS • En Bref
INDEX 2016 • Index des articles parus dans BASES en 2016
Déjà abonné ? Connectez-vous...
Davantage présent aux débuts de l’internet, notamment en raison de sa taille limitée, le format audio est devenu depuis plusieurs années déjà le parent pauvre de la recherche d’information, chez les professionnels autant que pour le grand public.
L’explosion de la vidéo, permise notamment par l’augmentation exponentielle de la bande passante disponible, a accaparé l’attention, tandis que des outils de plus en plus efficaces de recherche d’images en ont fait un autre axe central des stratégies de veille (en permettant notamment de repérer des logos de marques dans des images à première vue anodines).
Le son, lui, est passé au second plan.
Pourtant, par d’autres aspects, l’audio est plus que jamais présent sur internet. Par lui-même, pour commencer : les web radios et autres podcasts connaissent depuis cinq ans un pic de popularité exceptionnel, représentant une mine d’informations échappant souvent en partie ou en totalité aux méthodes traditionnelles de recherche d’information.
Ainsi, même si une émission de radio bénéficie bien de sa propre page internet au sein de laquelle il est possible d’effectuer des recherches en utilisant un moteur, on pourra néanmoins facilement passer à côté d’une marque mentionnée au cours de l’émission en elle-même sans que celle-ci ne soit mentionnée dans le titre ou même dans les tags : un service d’e-réputation surveillant cette marque pourra alors laisser passer cette mention.
Mais, le plus souvent, le format audio se mêle aujourd’hui à la vidéo, au point qu’il n’y a maintenant plus vraiment de logique à chercher exclusivement le premier sans le second.
Par exemple, lorsque l’on recherche le discours d’un chef d’entreprise, il est probable que seul l’audio, i.e. ce qui est dit, soit intéressant : la partie vidéo, qui consistera généralement en un plan fixe sur le dirigeant en question, est elle-même dépourvue de valeur. Pourtant, il est de nos jours beaucoup plus probable de trouver ce discours sous une forme vidéo que purement audio : il n’est ainsi pas rare de trouver sur YouTube une « vidéo » qui constitue en réalité un simple fichier audio sur lequel a été apposée une photo. Paradoxalement, pour rechercher de l’audio il faudra alors rechercher de la vidéo.
Pour le professionnel de l’information, la recherche d’information audio (qu’il s’agisse d’un fichier son, ou d’une vidéo dans laquelle l’information de valeur réside dans la piste audio) va s’avérer intéressante :
Déjà abonné ? Connectez-vous...
Peter Derycz, CEO et président de la société californienne Reprints Desk a présenté sa solution de location d’articles qui fonctionne en particulier avec son widget « Article Galaxy » accessible sur n’importe quel navigateur.
Prenant l’exemple de la veille dans le cadre de la pharmacovigilance, il est parti du fait que dans 50 % des cas, les responsables de la pharmacovigilance n’étaient pas sûrs de la pertinence des documents obtenus par leur veille. En effet les références bibliographiques, même avec le résumé, ne permettent pas toujours de faire un choix sans ambigüité.
L’expérience montre que dans 30 % des cas, les documents achetés (souvent payés 30 à 50 € l’unité) se révèlent non pertinents.
Pour faire faire des économies à ses utilisateurs et leur permettre de se centrer sur les documents vraiment pertinents, Reprints Desk propose depuis 2013 à ses clients de louer les articles qu’ils ont sélectionnés, à un tarif nettement inférieur à savoir 10 à 25 € l’unité.
Déjà abonné ? Connectez-vous...
A l’occasion de l’ICIC 2016 à Heidelberg, CAS (Chemical Abstracts Services) a présenté deux nouveaux produits ChemZent et MethodsNow.
Nous allons nous intéresser ici à Chemzent.
Chemzent propose la traduction en anglais des notices/résumés de la publication Chemisches Zentralblatt, la plus ancienne publication d’abstracts rédigés originellement en allemand, dans le domaine de la chimie.
La période couverte va de 1830 à 1969, sachant qu’elle constituait la seule publication d’abstracts dans ce domaine jusqu’en 1907, la publication de Chemical Abstracts ayant démarré cette même année.
Chemzent propose un peu plus de 3 millions de références.
On y trouve des documents historiques relatifs à des publications de Louis Pasteur, Niels Bohr ou Albert Einstein.
Déjà abonné ? Connectez-vous...
Quelques années après sa création en 1979, Questel a développé une offre dans le domaine des marques en proposant une série de banques de données chacune consacrée à un pays (registre). Les marques françaises ont en effet été chargées dès 1984.
Ces informations étaient fournies soit par les offices, tel l’INPI pour la France, soit par la société CompuMark, par ailleurs un concurrent.
Pour faciliter l’accès à ces bases marques par les utilisateurs finaux, dans les services marketing par exemple, Questel a mis en place l’interface Trademarkexplorer qui avait été développée par Minesoft, alors distributeur exclusif de Questel dans plusieurs pays. Trademarkexplorer utilisait des macro commandes s’appuyant sur le langage d’Orbit.
Cette interface intéressante était très agréable à utiliser et proposait des fonctionnalités intéressantes.
En 2005, Questel a acheté la société belge Edital spécialisée dans le domaine des marques avec une approche assez sophistiquée et très adaptée à la recherche dans le domaine des marques.
Questel a poursuivi le développement d’Edital et a finalement abandonné l’interface Trademarkexplorer au profit d’Edital, en 2010, ce qui a entrainé le déchargement de toutes les bases marques de la plateforme Orbit.
Déjà abonné ? Connectez-vous...
Clarivate Analytics lance une nouvelle version de son outil de gestion bibliographique EndNote. EndNote X8 offre désormais la possibilité de partager une bibliothèque de références, des références, des PDFs et des annotations avec 100 personnes maximum, la possibilité de travailler simultanément sur une bibliothèque partagée en temps réel, du stockage illimité sans coût additionnel et l’ajout d’un flux d’activité pour voir les nouveaux membres ou les changements apportés aux bibliothèques partagées.
L’organisation des Nations-Unies pour l’Alimentation et l’Agriculture (FAO) vient de lancer une nouvelle version de sa base de données statistique FAOSTAT. Au programme des nouveautés, une interface plus moderne et adaptée à la lecture sur supports mobiles, de nouvelles fonctionnalités de recherche et de filtrage et la possibilité de télécharger des ensembles de données personnalisées, des cartes et graphiques. Le nouveau site propose également une nouvelle fonction avec un ensemble d’indicateurs-clés prêts à l’emploi.
L’heure est à la refonte et à l’amélioration puisqu’on apprend également que le site Legifrance sera refondu en 2017. L’Etat a en effet prévu d’allouer deux millions d’euros à ce nouveau site. Parmi les améliorations prévues : l’ergonomie, l’amélioration des fonctions existantes de recherche comme la recherche multi-bases, le filtrage des résultats, les liens entre les textes et enfin la création de nouveaux services comme la possibilité de mieux gérer ses alertes ou la création de flux thématiques.
On ne saurait parler de l’actualité des moteurs sans parler de Google. Il y a bien longtemps que Google ne communiquait plus sur la taille de son index. Google a récemment changé son fusil d’épaule et annoncé que son moteur indexait désormais 130 trillions de pages (rappelons qu’un trillion représente 1 milliard de milliard). En comparaison, en 2013, le géant américain parlait de 30 trillions de pages. Pas sûr que communiquer sur des chiffres d’un telle ampleur ait encore un sens...
Nous avions déjà eu l’occasion de mentionner que Google allait prochainement scinder son index en deux : un pour les mobiles et un pour les ordinateurs. On en sait désormais un peu plus sur ce nouvel index mobile. On apprend ainsi que ce nouvel index analysera en priorité les versions mobiles des pages. Pour certaines pages et sites, il existe en effet des versions mobiles et desktop qui peuvent être différentes et ne pas proposer un contenu strictement identique. D’autre part, cet index est toujours en test et ne devrait pas être implémenté avant quatre mois. Pour les professionnels de l’information, il faudra alors s’interroger sur l’intérêt éventuel de combiner des recherches sur les index mobiles et desktop car les résultats pourraient différer. Nous testerons dans quelques mois.
Au cours de l’été, Google a également déposé un brevet sur le classement des événements. L’idée est de classer les événements (qui ont une réalité physique comme un concert, une conférence, une exposition, etc.) par popularité sans se baser sur le nombre de liens qui pointent vers le site de l’événement en question.
Autre nouveauté : l’amélioration des traductions dans Google Translate. Depuis le mois de Septembre, Google a annoncé l’intégration d’un nouveau système de traduction neuronal. L’idée est de répliquer le cerveau humain en ne considérant plus les phrases mot à mot mais dans leur intégralité afin d’obtenir une qualité de traduction proche de la traduction humaine. Chez Google cette innovation est pour le moment appliquée à 8 langues : l’anglais et le français, l’allemand, l’espagnol, le portugais, le chinois, le japonais, le coréen, et le turc.
La traduction neuronale est en pleine expansion et on apprend également que Systran est le premier éditeur à lancer un moteur de traduction de ce type sur plus de 30 langues. L’outil est pour l’instant en version beta et accessible à un nombre restreint de beta-testeurs et il existe également une plateforme de démonstration à l’adresse https://demo-pnmt.systran.net/production#/translation permettant d’entrer jusqu’à 2000 caractères. Nous avons fait quelques tests sur l’allemand et les résultats sont déjà très concluants. Néanmoins, il ne semble pas que cet outil soit destiné à être en libre accès.
Mi-Novembre, Bing a annoncé la mise en ligne d’une nouvelle fonctionnalité permettant de sauvegarder certains résultats de recherche pour les visualiser et les retrouver plus tard. Pour le moment, cela ne s’applique qu’aux images, vidéos et articles de shopping. Google propose un système similaire mais qui ne fonctionne que sur les mobiles et pour les images uniquement.
On apprend également que Ahrefs va prochainement lancer un outil de recherche de mots-clés appelé Keyword Explorer. Même s’il agit plutôt d’un outil de référencement/SEO, on pourra néanmoins y trouver un intérêt pour les veilles et recherches d’informations afin d’enrichir le vocabulaire de ces requêtes. Reste à voir s’il disposera d’une version gratuite ou abordable.
Twitter a récemment introduit une nouvelle fonctionnalité permettant d’exclure certains mots-clés, hashtags, phrases, utilisateurs et emojis de ses notifications. Ils ne disparaîtront pas pour autant de la timeline mais uniquement des notifications.
Facebook, quant à lui, continue à s’aventurer dans des secteurs a priori éloignés de son cœur de métier traditionnel avec cette fois-ci les offres d’emploi. Cette nouvelle fonctionnalité toujours en test permettra aux entreprises de diffuser des offres d’emplois ciblées et aux candidats de postuler directement.
Du côté des réseaux sociaux professionnels, l’actualité est plutôt morose. Viadeo a été placé en redressement judiciaire le 29 novembre dernier par le Tribunal de commerce de Paris et vient d’annoncer son retrait du Maroc. Leboncoin et le département des petites annonces du Figaro avaient déposé des offres pour la reprise du réseau social et c’est finalement Figaro Classifieds, la filiale de petites annonces du groupe média qui a été retenue.
LinkedIn de son côté est accusé de violer les lois sur le stockage des données personnelles en Russie et le tribunal municipal de Moscou a ordonné le 10 Novembre son blocage dans tout le pays.
Il semblerait également que les possibilités de recherche booléenne disparaissent progressivement de LinkedIn (source : Boolean Strings) et qu’il réserve de plus en plus ses fonctionnalités de recherche avancées pour les abonnements les plus chers. Pour le moment, certains professionnels ont pu constater ces changements alors qu’ils ne semblent pas s’appliquer pour d’autres. Affaire à suivre !
Du côté des outils de veille, Meltwater rend désormais accessibles à ses clients toutes les publications de l’Union européenne. Des procès-verbaux de réunions aux discours en passant par les rapports d’activité et déclarations publiques, toutes les informations publiées par les 56 départements de l’UE, institutions, agences, services sont maintenant recueillies et analysées par Meltwater.
Talkwalker, connu pour ses solutions de veille sur les médias sociaux a récemment lancé Talkwalker Now, une plateforme pour détecter et analyser les tendances. L’outil permet également de détecter des influenceurs et des sources d’information. Il s’adresse aussi bien aux éditeurs, aux équipes marketing qu’aux veilleurs. Son coût est de 12 000 € /an pour 5 utilisateurs.
Inoreader, l’un des lecteurs de flux RSS les plus puissants du marché et déjà utilisé par de nombreux professionnels de l’information vient d’annoncer que l’intégration d’IFTTT (un service très puissant qui permet d’automatiser un grand nombre de tâche sur le Web comme par exemple publier automatiquement sur Facebook tout message posté sur Twitter ou sauvegarder sur Evernote tout billet publié sur son blog, etc.) allait être réservé aux utilisateurs ayant souscrit l’abonnement Pro.
Revenons maintenant à l’outil IFTTT qui permet d’automatiser des tâches sur les outils de Web. Jusqu’à présent un déclencheur ne pouvait lancer qu’une seule action. Désormais il peut lancer plusieurs actions en même temps.
D’autre part, Microsoft a annoncé le lancement de Flow, un concurrent direct d’IFTTT (https://flow.microsoft.com).
Elcurator, un outil de curation professionnel dont nous avions déjà eu l’occasion de parler dans Netsources (Netsources n°123 - juillet/août 2016) et dans le numéro spécial de Bases sur les livrables de veille (Bases n°338 - juin 2016) est désormais connecté à Zapier, un service proche de ce que peut proposer IFTTT présenté plus haut. Cela permettra notamment de lier elCurator à Facebook, Twitter, Feedly, Slack, Wordpress ou encore Buffer et de créer des procédures automatisées qui seront déclenchées périodiquement.
L’excellent outil de bookmarking Diigo, qui avait beaucoup perdu de sa valeur au cours des dernières années en raison du peu d’améliorations et d’innovations apportés à l’outil a été complètement revu. Parmi les nouveautés : une interface plus ergonomique, une application mobile enfin fonctionnelle, la possibilité d’éditer un grand nombre de bookmarks en même temps, etc.
En matière d’Open Data, nous apprenons ce mois-ci que la Métropole Européenne de Lille ouvre ses données à l’adresse https://opendata.lillemetropole.fr/. 57 jeux de données sont pour le moment disponibles. Plus de la moitié concernent les transports et déplacements.
La Banque de France commence elle-aussi à ouvrir ses données mais pas à tous les publics... Depuis 2011, elle partage déjà quelques données sur le site http://webstat.banque-france.fr/fr/home.do mais désormais certaines personnes pourront accéder à des données beaucoup plus complètes. 400 millions d’éléments seront mis gratuitement à la disposition des chercheurs uniquement. Ceux-ci devront en faire la demande écrite, demande qui sera ensuite examinée par un comité dédié.
Enfin le site data.gouv.fr publie une liste des collectivités territoriales ayant ouvert leurs données (plus de cinq jeux de données pertinentes) à l’adresse http://bit.ly/2h9kLtW.
A l’occasion de la journée annuelle d’utilisateurs, particulièrement suivie cette année, Questel a annoncé de nombreuses nouveautés, certaines déjà opérationnelles, d’autres en devenir.
A cette occasion Questel en a profité pour clarifier son offre et les marques associées aux différents produits/services, ce qui n’était pas inutile.
L’offre d’Orbit est maintenant séparée en deux parties.
Intellectual Property Business Intelligence regroupe cinq produits :
Intellectual Asset Management regroupe, pour sa part :
Déjà abonné ? Connectez-vous...