Avant de vouloir à tout prix récupérer un flux RSS, il faut déterminer si la source et les contenus que l’on souhaite surveiller sont adaptés à ce format. Et si c’est bien le cas, il existe une méthode générale qui peut s’appliquer à tous les types de sources (sites web, moteurs, réseaux sociaux, bases de données, etc.) et que nous avons détaillée dans l’article « Comment déterminer la méthode la plus adaptée pour mettre une source en veille ? ».
Et puis, un peu comme en mathématiques, il y a tous ces cas particuliers où il y a juste des formules à connaître par cœur. Dans le cas des flux RSS, les cas particuliers se rencontrent quand on essaye de récupérer un flux RSS sur les réseaux sociaux ou encore certains types de sites Web. En guise de formule, nous aurons soit des URLs à connaître, dont on changera les paramètres selon ses besoins ; ou encore des outils très spécifiques qui ne fonctionnent que pour une source en particulier.
Comme il est impossible ou presque de retenir toutes ces formules par cœur, nous avons voulu dans cet article et les suivants rassembler en un seul et même endroit toutes les astuces, méthodes et outils à connaître, associés à chaque cas particulier.
Dans cet article, nous nous intéressons aux formules à connaître pour récupérer des flux RSS sur les sites Web de ses concurrents, de blogs, des sites de presse, des sites institutionnels, etc.
Toutes les formules et outils cités ont été testés et fonctionnaient au mois d’août 2022.
Lire aussi :
Quel lecteur de flux RSS choisir en 2020 ? (Bases N° 384 - sept 2020)
RSS, Twitter, Facebook, LinkedIn et les autres: surveille-t-on vraiment la même chose ? (mai 2018)
S’il y eut un temps où les réseaux sociaux proposaient pour la plupart des flux RSS sortants (sur des comptes, des requêtes, etc.), ce temps est bien révolu. En dépit du regain d’intérêt pour des solutions d’alertes du côté des géants du Web (voir notre article « Maîtriser le RSS, le socle inamovible de la veille »), il faut avoir conscience que ces acteurs ne remettront jamais de flux RSS en tant que tels puisque le but est de garder l’internaute captif de la plateforme. Le veilleur va devoir donc continuer d’essayer de récupérer des flux RSS.
Pour ce faire, sur les réseaux sociaux il y a peu de formules à connaître, mais surtout des outils gratuits ou freemiums très spécialisés.
Les particularités des réseaux sociaux ne permettent en effet pas d’utiliser la méthode généraliste de création de flux RSS. On est obligé de se tourner vers des outils ou fonctionnalités dédiées.
On notera que ces outils reposent sur des modèles très instables et peuvent du jour au lendemain passer sur un modèle payant ou tout simplement disparaître. Par exemple, Queryfeed qui a beaucoup été utilisé par les pros de l’info était passé il y a quelque temps à un modèle payant avant de finalement disparaître.
Lire aussi :
Le guide ultime de la veille et la recherche d’information sur Twitter
Veille Instagram : quoi, comment, pour quoi faire ?
Reddit, réseau social méconnu en France, mais véritable atout pour la recherche spécialisée
Facebook : toutes les clefs pour ouvrir ce coffre bien fermé à la veille ou la recherche
Réussir à utiliser LinkedIn pour la veille et la recherche d’information
Le guide des réseaux sociaux pour la veille (1ère partie)
Comment intégrer YouTube dans votre dispositif de veille
Comment surveiller TikTok : un réseau social atypique pour le veilleur
Prospective : comment vont évoluer vos pratiques de de veille sur les réseaux sociaux ?
Une newsletter ne se reçoit pas nécessairement par email. Certaines plateformes de création de newsletters offrent la possibilité de s’abonner aux nouveaux contenus via RSS.
C’est par exemple le cas de Substack où il suffit d’ajouter /feed
derrière l’URL de la page d’accueil d’une newsletter.
C’est aussi le cas sur la plateforme Medium où on peut récupérer un flux sur tous les contenus publiés par un utilisateur en entrant https://medium.com/feed/@nomdutilisateur.
On peut également récupérer un flux sur tous les contenus publiés avec un tag particulier : dans ce cas le flux n’est plus associé à une newsletter en particulier ; il récupère tous les articles tagués avec un mot-clé particulier, présent sur Medium, et ce quel que soit l’utilisateur. Pour créer un tel flux il faut utiliser l’url : https://medium.com/feed/tag/nomdutag.
Lire aussi :
Les nouveaux formats des médias appellent de nouvelles méthodes et outils de recherche et veille (Netsources N°150 - jan/fev 2021)
Substack ou le symbole du retour en force des newsletters pour la veille (janvier 2021)
Le retour en grâce de la newsletter (Netsources N°128 - jan/fev 2019)
Il est possible de récupérer des flux RSS sur certains moteurs et leurs verticales. C’est par exemple le cas de Google et de ses moteurs spécialisés comme Google Actualités ou même Google Scholar.
Le moteur Bing permet de récupérer des flux RSS à partir de ses recherches en utilisant l’url suivante :
https://www.bing.com/search?q=motcle&format=rss
Google n’offre pas de fonctionnalité équivalente, mais il est possible de créer des alertes sur Google Alertes que l’on pourra récupérer au format RSS.
Il faut cependant avoir conscience que les résultats pourront différer de ce que l’on trouve directement dans le moteur web de Google.
Les autres moteurs ne permettent pas à notre connaissance de récupérer de flux RSS.
Lire aussi :
L’IA au cœur du nouveau Google Actualités : à réintégrer absolument dans son dispositif de veille (Bases N° 405 - juillet/août 2022)
Google lance une fonctionnalité "révolutionnaire" pour la veille ... et nous prend pour des pigeon (oct 2021)
Google Keen et Google Discover : les nouveaux Google Alertes ? (Bases N° 381 - dec 2020)
Quelles alternatives crédibles à Google Actualités en 2020 ? Dossier spécial Agrégateurs de presse (Bases N° 377 - jan 2020)
Bienvenue dans la communauté Bases & Netsources
La Rédaction espère que vous avez passé un bel été et vous souhaite une bonne lecture !
Netsources sait que, dans l'activité de veille, s'équiper d'une plateforme professionnelle de social media listening n'est pas toujours possible, pour de multiples raisons (notamment de coût). C'est pour cette raison que nous avons fait le tour de toutes les astuces, bonnes pratiques et outils gratuits et freemium afin de vous accompagner dans vos projets de veille réseaux sociaux à moindre coup.
Pendant longtemps, on a considéré que pour faire une recherche raisonnablement exhaustive de références bibliographiques scientifiques, il fallait, pour peu que l’on en ait les moyens, utiliser les serveurs ou agrégateurs payants tels que STN, Dialog, Scopus, ou encore Web of Science.
Mais à côté de ces puissants outils traditionnels, se sont développés de nombreux sites web gratuits, proposant, avec différentes interfaces user-friendly des références bibliographiques, de littérature scientifique et de brevets.
La question que se posent maintenant de nombreux de professionnels de l’information est de savoir s’il est raisonnable de limiter ses recherches aux grands serveurs/agrégateurs ou s’il est devenu utile, voire indispensable, de compléter ses recherches par l’interrogation de nombreux sites web en accès gratuit, dont on ne peut ignorer qu’ils ont aujourd’hui des contenus significatifs.
Lire aussi :
Comment faire évoluer sa recherche d’information scientifique avec les nouveautés de Google Scholar ? (Bases N° 404 - juin 2022)
Elicit, un nouveau moteur scientifique au banc d’essai (Bases N° 404 - juin 2022)
The Lens pour la littérature scientifique : des contenus mal valorisés (Bases N° 393 - juin 2022)
L’entreprise spécialisée dans le SEO Ahrefs, basée à Singapour, mais fondée par l’Ukrainien Dmytro Gerasymenko, vient de dévoiler son propre moteur de recherche, Yep.com, qui se veut un émule du moteur Brave et ambitionne de prendre quelque part de marché au mastodonte Google et, dans une moindre mesure, à Bing.
À la différence des moteurs tels qu’Ecosia et DuckDuckGo, Yep.com dit utiliser pour son moteur un index développé en interne, à l’instar de Brave Search (voir notre article « Brave Search, You et Presearch : les nouveaux moteurs passés au crible », Bases N° 397 - nov 2021), et non sur des API dérivant ou s’appuyant sur les index de Google et Bing.
L’index s’appuie donc pour l’instant sur AhrefsBot, un crawler « fait maison » pour indexer le Web, au rythme de 8 milliards de pages web toutes les 24 heures, selon la société.
La prochaine étape prévue sera de créer un YepBot indépendant des algorithmes d’Ahrefs.
Lire aussi :
Brave Search, You et Presearch : les nouveaux moteurs passés au crible (Bases N° 397 - nov 2021)
La conférence AI-SDV revient essentiellement en présentiel, cette année, à Vienne, les 10 et 11 octobre prochains.
Les sujets traités par les 22 conférenciers concerneront la recherche avancée, le text mining, les techniques de visualisation, etc..
Un aperçu du pré-programme paraît très engageant : https://haxel.com/ai-sdv
Alors que ces dernières années, l’interface de Google Actualités n’avait pratiquement plus aucun un intérêt pour la veille et la recherche et qu’il valait mieux passer par l’onglet « Actualités » du moteur web de Google, Google Actualités (ou Google News) a récemment introduit des fonctionnalités inédites.
Plusieurs d’entre elles découlent d’une utilisation accrue de l’IA et sont particulièrement prometteuses pour la veille et la recherche d’information, à tel point qu’elles pourraient bien amener le professionnel de l’info à reconsidérer l’interface pour ses recherches, en plus du moteur web classique.
Google Actualités a récemment lancé une nouvelle interface pour Google Actualités. Cette nouvelle version reste dans la droite ligne des dernières évolutions de Google sur l’ensemble de ses produits et Google cherche à collecter le plus d’informations possible sur le profil et les habitudes de ses usagers.
Google précise d’ailleurs sans détour son parti pris concernant sa politique de contenu dans le court disclaimer suivant :
« Ces articles sont classés en fonction de leur qualité, de l’originalité et de l’actualité de leur contenu, de votre activité et de vos achats précédents dans Google Actualités, ainsi que de votre activité dans d’autres produits Google. Google peut avoir un contrat de licence avec certains éditeurs, mais cela n’a aucun impact sur le classement des résultats. »
Créez d'abord votre propre requête à partir du modèle suivant : en spécifiant le type de décision (arrêté, décret,... attention l'opérateur loi ne fonctionne pas ! ) souhaitée avec l'opérateur nature=
, l'autorité de contrôle (ministère, commission,...) ciblée, et le fameux q=
pour indiquer le mot clé surveillé, en les croisant entre eux bien sûr avec l'opérateur &
. La requête permet ensuite de créer son propre fil RSS à visualiser via son lecture de flux. Retrouvez l'ensemble des opérateurs disponibles via ce lien.
Exemples :
Source : @precisement / CC @L_DiCarlo