Bases & Netsources - Accueil

L’intelligence économique commence par une veille intelligente

Comment récupérer un flux RSS sur les moteurs web et Google Actualités ?

Netsources no
159
publié en
2022.09
3794
Tags
Réduire Augmenter Taille de la police
Comment récupérer un flux RSS sur les moteurs web et Google ... Image 1
Comment récupérer un flux RSS sur les moteurs web et Google ... Image 1

Il est possible de récupérer des flux RSS sur certains moteurs et leurs verticales. C’est par exemple le cas de Google et de ses moteurs spécialisés comme Google Actualités ou même Google Scholar.

Récupérer des flux RSS sur les moteurs généralistes

Le moteur Bing permet de récupérer des flux RSS à partir de ses recherches en utilisant l’url suivante : https://www.bing.com/search?q=motcle&format=rss

Google n’offre pas de fonctionnalité équivalente, mais il est possible de créer des alertes sur Google Alertes que l’on pourra récupérer au format RSS.

Il faut cependant avoir conscience que les résultats pourront différer de ce que l’on trouve directement dans le moteur web de Google.

Les autres moteurs ne permettent pas à notre connaissance de récupérer de flux RSS.


Lire aussi : 

L’IA au cœur du nouveau Google Actualités : à réintégrer absolument dans son dispositif de veille

Google lance une fonctionnalité "révolutionnaire" pour la veille ... et nous prend pour des pigeon

Google Keen et Google Discover : les nouveaux Google Alertes ?

Quelles alternatives crédibles à Google Actualités en 2020 ? Dossier spécial Agrégateurs de presse


Les flux RSS sur Google Actualités : de nombreuses possibilités bien cachées et à connaître

Du côté des verticales des moteurs Web, c’est Google Actualités qui propose le plus de possibilités en matière de flux RSS. Ils sont invisibles, mais les possibilités sont nombreuses. À condition de connaître la syntaxe…

On peut tout d’abord récupérer un flux RSS à partir d’une requête par mot-clé. Le flux prend alors le format suivant : https://news.google.com/rss/search?q=motcle&hl=fr&gl=FR&ceid=FR:fr

Il est impossible de rechercher en même temps sur tous les corpus locaux de Google Actualités (USA, UK, France, etc.). Il faut donc choisir sur quel corpus va porter le flux RSS et pour cela on pourra changer les paramètres de l’URL.

  • hl= va correspondre à la langue - nous avons mis ici le français
  • gl= va correspondre au pays - nous avons ici mis la France
  • ceid= va correspondre au français parlé en France

On notera qu’il est également possible de récupérer des flux RSS sur des requêtes un peu plus complexes qu’un simple mot-clé.

On pourra ainsi utiliser les opérateurs classiques de Google dans sa requête :

  • Le OR
  • Le NOT sous la forme d’un tiret
  • Les guillemets pour l’expression exacte
  • Intitle: pour recherche sur le titre des articles
  • Inurl: pour rechercher un terme dans l’URL
  • Site: pour limiter aux articles publiés sur un site précis et indexés dans Google Actualités

Pour éviter toute erreur en modifiant des paramètres dans l’URL, nous conseillerons d’abord d’entrer sa requête dans le moteur de Google Actualités (dans la version locale qui nous intéresse), de récupérer l’URL de résultats et d’ajouter le terme rss à l’intérieur.

À titre d’exemple, nous avons interrogé la version française de Google Actualités avec la requête :

intitle:energie OR inurl:energie site:lemonde.fr

Nous récupérons alors l’URL de résultats suivante : https://news.google.com/search?q=site%3Alemonde.fr%20intitle%3Aenergie%20OR%20inurl%3Aenergie&hl=fr&gl=FR&ceid=FR%3Afr

Puis nous ajoutons l’élément RSS dans l’URL : https://news.google.com/rss/search?q=site%3Alemonde.fr%20intitle%3Aenergie%20OR%20inurl%3Aenergie&hl=fr&gl=FR&ceid=FR%3Afr

Enfin il est également possible de créer des flux RSS sur les thèmes proposés par l’IA de Google Actualités ainsi que les lieux. Il suffit d’entrer un terme dans le moteur (un thème, un nom de personne ou encore un lieu) et Google nous suggère pour certains mots-clés un thème ou lieu correspondant. Cela permet d’obtenir une sélection d’articles autour de ce thème ou ce lieu repéré par l’IA de Google.

Comme pour les autres flux RSS, on récupérera l’URL de la page de résultats et on ajoutera le terme RSS dans l’URL.

Pour en savoir plus sur l’IA dans Google Actualités, nous vous invitons à lire ou relire notre article paru dans BASES «  L’IA au cœur du nouveau Google Actualités : à réintégrer absolument dans son dispositif de veille » (BASES n°405 - juillet/août 2022).

Les autres verticales de Google

Pour les autres verticales de Google, il n’existe pas de moyens pour récupérer de flux RSS de manière directe. Mais il existe quelques moyens détournés.

Le premier consiste à passer par Google Alertes, choisir la verticale Vidéos ou Livres par exemple puis choisir l’envoi par RSS.

On peut aussi récupérer un flux RSS depuis Google Scholar par des moyens détournés. Google Scholar permet en effet de s’abonner à des alertes par mail. On pourra tout simplement s’abonner à cette alerte mail grâce à la fonctionnalité Newsletter de son lecteur de flux RSS (Inoreader et Feedly par exemple) et recevoir directement l’alerte mail dans son lecteur de flux.

Contrairement aux flux RSS en provenance de sites Web ou de réseaux sociaux qui garantissent une certaine forme d’exhaustivité, il faut bien avoir conscience que les flux RSS issus des moteurs de recherche Web sont beaucoup plus aléatoires. Rien ne garantit que toutes les nouvelles pages et les nouveaux articles répondant à sa requête apparaîtront bien. C’est un complément intéressant, mais on ne peut pas considérer qu’on surveille parfaitement Google par ce biais.

Les abonnés peuvent poster des commentaires ! N'hésitez pas à vous abonner à Bases et Netsources...