Il existe cependant un moyen simple de le savoir : on téléchargera un add on Chrome ou Firefox permettant de connaître les technologies utilisées par un site Web. On recommande en particulier Builtwith (https://builtwith.com/fr/toolbar).
Le principe est simple : une fois l’add-on installé, il suffit de se rendre sur le site qui nous intéresse puis de cliquer sur l’icône Builtwith. Une fenêtre s’ouvre avec de nombreuses indications quant aux technologies utilisées. L’encadré « Content Management System » indique quel est le CMS utilisé.
Chaque CMS a ensuite ses spécificités en matière de flux RSS. Si c’est Wordpress, on peut s’estimer chanceux, car il permet nativement de créer des flux RSS sur à peu près tous les éléments du site : flux général, flux par rubrique, flux par tag, flux par nom d’auteur, etc.
Pour d’autres CMS, c’est beaucoup plus limité avec la possibilité de récupérer au mieux un flux général.
Wordpress : des flux RSS à tous les étages
On trouvera la liste complète des flux RSS disponibles sur des sites Wordpress à cette adresse : https://coderevolution.ro/2020/05/14/the-full-list-of-rss-feeds-provided-by-wordpress/.
Nous avons sélectionné ici les éléments les plus importants à retenir pour le veilleur, ce qui correspond aux cas les plus courants :
- Flux général du site : nom de domaine du site suivi de
/feed
- Flux de tous les commentaires du site : nom de domaine suivi de
/comments/feed
- Flux des commentaires d’un article seulement : URL de l’article suivi de
/comments/feed
- Flux RSS d’une catégorie spécifique : URL de la page d’accueil de la catégorie suivi de
/feed
- Flux RSS d’un tag : URL de la page d’accueil avec tous les articles associés à un tag suivi de
/feed
Si on souhaite suivre les résultats d’une recherche dans le moteur du site, c’est possible, mais on ne pourra pas partir de la page de résultats. En effet la page de résultats se présente sous la forme : https://www.nomdedomaine.com /?s=motcle
. Si on ajoute /feed à la fin, cela ne fonctionne pas.
Il faut entrer l’URL suivante : https://www.nomdedomaine/search/mots-clé/feed
Cela fonctionne également avec une requête combinant plusieurs mots-clés séparés par un AND.
On entrera alors :https://www.nomdedomaine/search/mots1+mot2/feed.
Et on peut également récupérer un flux à partir d’une recherche sur une expression exacte.
Cela donnera : https://www.nomdedomaine/search/«mots1+mot2+mot3»/feed
ou https://www.nomdedomaine/search/«mots1 mot2 mot3»/feed
Les deux fonctionnent.
En revanche, cela ne fonctionne pas si on veut effectuer une requête avec un OR ou un NOT.
Blogger/Blogspot : 3 types de flux RSS
Du côté de Blogger/Blogspot, on peut récupérer trois types de flux RSS :
- Le flux général qu’on obtiendra en entrant https://www.nomdedomaine/feeds/posts/default?alt=rss
- Le flux de l’ensemble des commentaires en entrant https://www.nomdedomaine/feeds/comments/default?alt=rss
- Le flux des articles d’une catégorie spécifique en entrant https://www.nomdedomaine/feeds/posts/default/-/nomderubrique?alt=rss
Joomla : un flux général et des flux sur les rubriques et tags
Pour les sites réalisés avec Joomla, il est possible de récupérer un flux RSS général et des flux RSS sur chaque rubrique et chaque tag.
On récupérera l’URL de la page d’accueil pour le flux général, l’URL de la page d’accueil de la rubrique que l’on souhaite surveiller et l’URL de la page listant tous les articles associés à un tag. On ajoutera à la fin de ces URLs ?format=feed
.
Drupal, Hubspot, Webflow et Wix : un flux général uniquement
Les autres CMS les plus utilisés sur le marché ne permettent de récupérer qu’un flux RSS général sur le site et ce n’est déjà pas si mal.
- Sur Drupal, on peut obtenir un flux RSS général et parfois un flux sur certaines rubriques, mais ce n’est pas systématique. Il suffira d’ajouter
/rss.xml
à la fin de l’URL de la page d’accueil ou de la page d’accueil de la rubrique. - Pour les sites réalisés avec Hubspot, on pourra récupérer un flux RSS général en ajoutant
/rss.xml
après l’URL de la page d’accueil. - Pour les sites créés avec Webflow, on ne réussira pas à obtenir autre chose qu’un flux général en ajoutant
/rss.xml
derrière l’URL de la page d’accueil. - Sur Wix, ce sera également un flux RSS général uniquement. Mais attention, il existe deux formats de flux. On rajoutera
/blog/feed.xml
à la fin de l’URL de la page d’accueil ou/blog-feed.xml
. Si la première solution ne fonctionne pas, on passera à la deuxième.
Le cas spécifique des flux RSS du journal Le Monde
Pour le site du Monde, l’add-on Builtwith ne nous permet pas de connaître le CMS utilisé.
On sait que le site du Monde propose déjà une liste conséquente de flux RSS à l’adresse https://www.lemonde.fr/actualite-medias/article/2019/08/12/les-flux-rss-du-monde-fr_5498778_3236.html.
Seulement, il en existe d’autres, car chaque tag du site est transformable en flux RSS.
Un internaute a ainsi récemment créé le site https://rssmotscles.gallenne.fr/ qui regroupe tous les flux RSS de tous les tags présents sur le site du Monde. Une ressource précieuse à toujours garder sous la main !