Le format RSS est toujours - et plus que jamais - d’une grande utilité pour la veille mais il vous arrive peut-être de ne plus parvenir à détecter facilement la présence des flux sur une page, sur les sites web des sociétés et même sur les sites web de presse. Ils sont en effet devenus beaucoup moins visibles et moins promus - ce qui ne veut pas dire pour autant inexistants - que par le passé. A cela s’ajoute le fait que les outils de détection souffrent d’une certaine instabilité.
Cette méthodologie présente les bonnes pratiques à essayer systématiquement, ainsi qu’une sélection des meilleurs outils de détection en 2021. Elle détaille en outre les points d’attention à vérifier pour garantir l’efficacité de la démarche, et suggère quelques pistes pour identifier de nouveaux outils de détection RSS.
Lire aussi : Quel lecteur de flux RSS choisir en 2020
Pour commencer, nous recommandons très vivement de démarrer par la recherche de sources web pertinentes pour un sujet, et non par la recherche directe de flux RSS sur ce sujet.
Il existe en effet des moteurs spécialisés dans les flux RSS (comme par exemple Datorss.com), mais la plupart de ces outils sont souvent assez vieux. Ces derniers sont souvent très centrés sur le monde anglo-saxon, et contrairement aux idées reçues, ne seront jamais à jour ni exhaustifs. Effectuer un sourcing en bonne et due forme (voir NETSOURCES n°146, Mai-Juin 2021), puis vérifier pour chaque source pertinente s’il existe un ou plusieurs flux RSS, s’avère une stratégie bien plus gagnante et efficace.
Déjà abonné ? Connectez-vous...
Il y a quelques semaines, EDF annonçait le lancement de sa plateforme open data (opendata.edf.fr), une bonne nouvelle pour les professionnels de l’information susceptibles de rechercher des informations dans le secteur de l’énergie.
Mais au-delà de l’annonce d’EDF en tant que telle, ce qui est intéressant, c’est que cette nouvelle plateforme est initiée par une entreprise alors qu’on est plus habitué à entendre parler d’open data dans le secteur public. On l’oublierait presque mais les entreprises, elles aussi, peuvent lancer leurs plateformes d’open data et mettre en ligne certains jeux de données, même si on est très loin d’une ouverture des données à très grande échelle.
Tout d’abord, rappelons que l’open data, ce sont des données numériques (textuelles ou non textuelles comme des cartes, des formules chimiques, des statistiques, etc.) produites par des organismes publics mais également privés qui sont rendues librement accessibles et réutilisables sans condition par tout un chacun.
L’open data représente un réel intérêt pour les professionnels de l’information en matière de sources car cela permet notamment d’accéder à des informations auxquelles on ne pouvait pas accéder par le passé ou très difficilement.
Dans le cas des entreprises, il s’agit néanmoins rarement de données que l’on ne pourrait pas trouver ailleurs mais plutôt de données qui peuvent être difficiles d’accès ou bien dispersées à plusieurs endroits sur le web.
Déjà abonné ? Connectez-vous...
Depuis quelques années, difficile d’échapper au phénomène des « fake news ». A tel point que la question se pose de savoir si tous les secteurs sont effectivement concernés et dans quelle mesure cette désinformation peut affecter les professionnels de l’information.
Les récents ajouts de fonctionnalités et initiatives de la part des GAFAM et de Twitter, pour modérer la prolifération des fake news, révèlent que leur large diffusion a passé un seuil critique : d’une part les fake news peuvent affecter la réalité, le cours de l’Histoire, comme en témoigne les récents événements lors de la campagne présidentielle outre-Atlantique et, d’autre part, les réseaux sociaux et géants d’Internet sont tenus responsables dans leur diffusion, par un laisser-faire manifeste, parfois assumé.
Les fake news recouvrent des réalités différentes, que les professionnels de l’information sont susceptibles de rencontrer et ont intérêt à reconnaître.
Par information, nous entendrons ici des articles de presse, des articles scientifiques et des données business. Les fake news peuvent donc être soit de la fausse information (misinformation en anglais), soit de la désinformation (disinformation).
A l’origine des fake news peuvent se trouver plusieurs intentions : la recherche du profit, à l’instar des sites internet Macédoniens révélés en 2016 et spécialisés dans les fake news pour en tirer des bénéfices publicitaireshttps://www.bbc.com/future/article/20190528-iwas-a-macedonian-fake-news-writer, la volonté d’induire un ennemi en erreur, particulièrement dans le cadre des relations interétatiques (voir par exemple l’opération Fortitude lors de la Seconde Guerre Mondiale) ou entre entreprises, ou l’intention d’orienter l’opinion publique dans le cadre d’un débat public, ainsi des Tweets du précédent Président des Etats-Unis d’Amérique.
Une fake news vise donc à orienter la réalité, en corrompant le jugement, et par là les actions des acteurs visés.
Pour savoir plus précisément à quoi on a affaire et être plus alerte face à une (éventuelle) fake news, nous vous proposons la typologie suivante, dressée par Claire Wardle sur la page First Drafthttps://firstdraftnews.org/latest/fake-news-complicated/ :
Déjà abonné ? Connectez-vous...
Embase , produite par Elsevier, est l’une des grandes banques de données biomédicales de référence couvrant, depuis 1947, la littérature sur les médicaments, la pharmacologie ainsi que d’autres aspects de la médecine humaine.
Nous avions annoncé (BASES n°371 Juin 2019 ) le lancement d’un nouveau module d’Embase dépouillant une centaine de publications françaises supplémentaires, qui n’étaient pas déjà prises en compte dans le Embase classique.
Ce module a été créé pour étayer les recherches de pharmacovigilance pour les médicaments commercialisés en France. Il bénéficie de l’indexation très poussée proposée par le producteur.
L’antériorité annoncée est de 2017, mais on trouve des documents publiés à partir de juin 2016.
A son lancement, ce module n’était accessible qu’à la condition d’avoir souscrit un abonnement illimité à Embase couplé avec ce module.
Au moment de nos tests, Embase French Literature proposait 24 082 références d’articles publiés dans une centaine de publications françaises mais seulement 23 375 en français, soit près de 98%, mais aussi 4 427 en anglais et 121 en allemand.
Si l’on parle littérature biomédicale en langue française, on pense aussi à LISSA qui la référence largement et que nous avons présenté en détails dans le numéro 378 (Février 2020) de BASES.
Sur un échantillon de publications présentes dans Embase French Literature, environ 40 % sont accessibles sur LISSA (où seul le résumé est gratuit), tandis qu’environ un tiers sont issues de Pascal, dont la production par l’INIST s’est arrêtée en 2014.
Depuis juin 2016, date de son antériorité, on trouve dans Embase French Literature plus de 50 000 références en français dont une bonne partie est disponible sur LISSA.
On attend maintenant les modules d’Embase dans d’autres langues.
Quant à STN, la décision de charger ou non ce module n’a toujours pas été prise.
Lors des journées annuelles 2019 du CFIB (Club Francophone de l’Information Brevet), Philippe BODART avait fait remarquer une forte diminution de l’indexation par Chemical Abstracts (CAS) des articles scientifiques chinois écrits en chinois, ce qui rendait inaccessible une partie de l’art antérieur chinois dans le domaine de la chimie.
Nous avions confirmé cette tendance dans un article, écrit en collaboration avec lui, et intitulé « Littérature scientifique et technique : forte chute des références d’articles en langues asiatiques dans Chemical Abstracts » (BASES n°372 - juillet /août 2019).
Nous avons demandé des explications aux experts de Chemical Abstracts, qui nous ont indiqué que l’explosion de la demande chinoise de brevets avait mobilisé les ressources des indexeurs chinois au détriment de la prise en compte des articles écrits en chinois.
Fort heureusement, l’indexation de la littérature chinoise a été reprise dans Chemical Abstracts avec une augmentation significative au quatrième trimestre 2020 et une certaine reprise des années antérieures malgré le fait que les indexeurs de CAS, comme beaucoup d’autres salariés, aient été confinés.
TENDANCES • LinkedIn, de la vitrine de CV à la base de données multi contenus, pp. 1-3
METHODOLOGIE • Plongée au coeur du moteur de recherche de LinkedIn, pp. 4-6
METHODOLOGIE • La veille sur LinkedIn : que peut-on réellement faire ? pp. 7-9
BASE DE DONNEES • Inspec, une base de données incontournable pour l’ingénierie, la physique et l’informatique, pp. 10-11
Quand LinkedIn a vu le jour en 2003, il se positionnait avant tout comme une vitrine de CV, un réseau social professionnel à destination d’utilisateurs individuels qui souhaitaient mettre en valeur leurs profils et communiquer avec leurs pairs. Un Facebook des professionnels (essentiellement des cadres) en quelque sorte.
Si cet usage subsiste, il n’est plus au cœur du positionnement stratégique de LinkedIn.
Alors que la majorité de ses concurrents directs comme Viadeo ou encore Xing sont progressivement tombés dans l’oubli, LinkedIn, lui, a réussi à tirer son épingle du jeu en monétisant ses contenus et en développant considérablement ses services, notamment auprès des entreprises. Son rachat par Microsoft en 2016 est d’ailleurs venu renforcer cet ancrage auprès des entreprises avec notamment une meilleure intégration des produits du géant américain.
Pour développer ces nouveaux services, LinkedIn a ajouté, au gré des années et des rachats de diverses startups, de nouveaux types de contenus (billets de blogs, événements, contenus de formation, etc.). Et les utilisateurs - entreprises comme utilisateurs individuels - se sont emparés de ces nouvelles fonctionnalités pour créer de plus en plus de contenus au sein de la plateforme. En juin dernier, LinkedIn indiquait d’ailleurs que la création de contenus internes avait augmenté de 60% en 1 an.
Lire aussi :
Dans cet article, nous avons choisi d’analyser les évolutions stratégiques de LinkedIn et la diversification des contenus qui en résulte pour :
Déjà abonné ? Connectez-vous...
LinkedIn ne manque pas de contenus pour la recherche d’information professionnelle, et pourtant, rechercher sur ces contenus est un programme ambitieux tant le géant américain ne nous simplifie pas la tâche.
Même si, en apparence, LinkedIn a amélioré sa recherche et ses fonctionnalités au fil des années, on comprend vite qu’il y a un décalage important entre le discours officiel de LinkedIn et la réalité du terrain.
On se heurte vite à deux problèmes : un algorithme de classement opaque d’une part et des fonctionnalités de recherche limitées et instables d’autre part.
Pour comprendre comment rechercher, intéressons nous tout d‘abord à l’algorithme de classement de résultats du moteur de recherche de LinkedIn.
Déjà abonné ? Connectez-vous...
Si la recherche d’information sur LinkedIn est un challenge, faire de la veille sur le réseau social se situe un cran encore au-dessus.
LinkedIn a depuis des années une politique extrêmement restrictive à l’égard des outils externes et proscrit tout scraping / extraction de ses données. C’est une des raisons pour laquelle, aucun outil ou plateforme de veille jusqu’à maintenant n’a été en mesure de surveiller correctement LinkedIn, mais il se pourrait bien que les choses évoluent.
On peut également essayer de faire de la veille directement au sein de l’interface de LinkedIn mais, là encore, LinkedIn ne nous simplifie pas la tâche.
Jusqu’à il y a peu, utiliser une plateforme de veille ou même un lecteur RSS pour faire de la veille sur LinkedIn était impensable, tant les règles de LinkedIn étaient restrictives.
Mais certains signaux laissent à penser que LinkedIn pourrait revoir sa politique d’accès et devenir un peu moins intransigeant.
Déjà abonné ? Connectez-vous...
La banque de données Inspec spécialisée dans les domaines de l’ingénierie, la physique et l’informatique est un des classiques historiques des grandes banques de données bibliographiques avec abstracts recensant la littérature de leur domaine.
Dans cet article, nous revenons sur la place et l’intérêt d’Inspec dans un contexte de recherche et de veille scientifique et technique. Dans un second temps, nous analysons les différences entre la base Inspec et un de ses concurrents, l’IEEE Xplore digital library.
Cette banque de données a été lancée en 1969 par « The Institution of Engineering and Technology » qui est issu de la Society of Telegraph Engineers en 1871. Elle est produite aujourd’hui par l’ lET (The Institution of Engineering and Technology) qui est une institution anglaise dont la vocation est de « travailler à la construction d’un monde meilleur » (« working to engineer a better world »).
Inspec, comme les autres bases bibliographiques historiques, propose une grande antériorité en remontant jusqu’à la fin du 19e siècle (1898 pour Inspec), période à laquelle ont commencé à être publiées des revues scientifiques et des revues d’abstracts qui, bien plus tard, ont été numérisées et intégrées aux banques de données, ce qui explique leur grande antériorité actuelle.
Déjà abonné ? Connectez-vous...