Le Web change à vive allure et les sites Web que l’on voit aujourd’hui n’ont plus grand-chose à voir avec ceux d’il y a 5, 10 ou 20 ans. Si cette évolution est bien normale, elle pose un important problème en termes de conservation des données : tous les contenus qui se trouvaient sur ces sites qui ont disparu sont aujourd’hui inaccessibles directement sur le Web ou les moteurs. Et il n’existe que peu de moyens pour les retrouver.
Pour le professionnel à la recherche de contenus anciens (même s’il ne s’agit que de remonter quelques années en arrière), cette quête peut vite devenir compliquée, voire même perdue d’avance.
On a d’un côté les médias qui conservent dans la plupart des cas leurs archives Web. Ainsi une recherche d’antériorité sur ces contenus reste relativement simple. Les médias sociaux quant à eux conservent l’ensemble des contenus (sauf ceux supprimés volontairement par l’utilisateur), comme Twitter par exemple qui permet de rechercher jusqu’en 2006, année de son lancement. Là aussi, une recherche d’antériorité ne pose pas de problème majeur.
Mais pour de nombreux autres sites comme les sites d’entreprises, les sites institutionnels, les sites personnels, il ne subsiste rien quand le site fait peau neuve ou disparaît.
Lire aussi :
Comment retrouver de vieux articles de presse ?
Conseil Veille du 12 mai 2021 pour naviguer dans les archives d’un site web
Outils de recherche sur les contenus audios : un segment encore pauvre
Les professionnels de l’information et de la veille connaissent bien la Wayback Machine proposée par Internet Archive depuis de nombreuses années et qui permet de retrouver les archives d’une page Web à condition que la page ait bien été indexée par Internet Archive. Cet outil est très utile et permet de répondre à certains besoins ponctuels. Mais on sait également que malgré toutes ses qualités, la Wayback Machine ne fait pas de miracles. Il subsiste encore de très nombreux cas où l’on n’arrive pas à retrouver ce que l’on cherche.
De nouveaux acteurs ont fait leur apparition au cours des dernières années. Sont-ils capables de répondre à des besoins informationnels pour lesquels Internet Archive nous conduit à une impasse ?
Dans cet article, nous dressons un panorama des outils et ressources disponibles aujourd’hui pour explorer les archives du Web et nous analysons leurs capacités et complémentarités avec la Wayback Machine.
Déjà abonné ? Connectez-vous...
Créée en 1996, Minesoft était quasiment une entreprise familiale, ce qui ne l'a pas empêchée de se développer sur le marché de la PI (propriété intellectuelle) et d’atteindre un chiffre d’affaires de près de 20 millions d’euros.
Connu pour sa banque de données de recherche de brevets Patbase, utilisée dans de nombreux pays et en particulier en France, Minesoft a développé différents logiciels pour accompagner cette banque de données.
Minesoft vient d’être racheté par MLM 2, une plateforme d’information et de logiciels créée en partenariat avec Warburg Pincus, une importante société de private equity qui gère 73 milliards d’assets répartis dans 235 sociétés très diversifiées.
Minesoft est la première acquisition de MLM 2 dont l’objectif est, par d’autres acquisitions, de devenir un leader dans les logiciels et le service de propriété intellectuelle.
Lire aussi :
Généralisation de la reconnaissance automatique des éléments chimiques dans les textes
Minesoft/Patbase lance Chemical Explorer
Les banques de données brevets gratuites ou freemium
Si cette première acquisition est significative, on notera que le marché est déjà bien encombré même si l’on peut considérer qu’il se développe et continuera à le faire.
Les relations déjà anciennes avec RWS se poursuivront pour continuer à développer Patbase.
Il faut noter que l’équipe de Minesoft reste en place. Le nouveau responsable du marché français se nomme Alexandre Thibault (Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser.).
Dans le monde professionnel, nous sommes tous confrontés un jour ou l’autre, à la recherche de tarifs.
Pour certains acteurs qui opèrent notamment une activité en BtoC et vendent des produits de grande consommation, c’est même une activité cruciale et un élément clé de leur veille concurrentielle. Il s’agit alors notamment de surveiller en continu les tarifs et surtout les variations de prix opérés par les concurrents. La veille dite « tarifaire » répond alors à une démarche très structurée et fait appel à des outils capables de mener cette veille à grande échelle.
Pour de nombreux autres acteurs, la recherche de tarifs relève plus de l’investigation ponctuelle que d’une véritable démarche de veille itérative : il s’agit par exemple d’analyser son environnement concurrentiel en essayant d’avoir une vision des tarifs pratiqués par ses concurrents, d’analyser un marché sur lequel on souhaite s’implanter, de faire une première évaluation de fournisseurs ou prestataires éventuels, etc.
Mais les tarifs ne sont pas toujours affichés sur le Web et surtout, ils ne sont pas fixes et exacts. Les tarifs de produits BtoB ou de prestations de services que l’on peut trouver sur le Web permettent certes d’avoir une première idée des tarifs pratiqués, mais les tarifs réels dépendent de multiples critères qui ne peuvent être pris en compte sur une simple page web (taille de l’entreprise, type de mission, nombres de personnes impliquées, etc.). La recherche de tarifs s’avère alors plus aléatoire et compliquée pour les produits vendus en BtoB et l’est encore davantage pour les prestations de service.
Lire aussi :
Sourcing, de la théorie à l’épreuve de la pratique
La veille sur les appels d’offres de A à Z
Comment intégrer les données d’importation et d’exportation à sa veille concurrentielle ?
Déjà abonné ? Connectez-vous...
SAE International est une association existant depuis plus d’un siècle qui regroupe plus de 200 000 experts dans le monde de la mobilité et des transports.
SAE International vient de lancer un serveur de préprints en accès libre baptisé SAE MobilityRxiv (https://mobilityrxiv.sae.org) qui se présente comme le premier serveur de cette nature dans le domaine des transports et des mobilités (Cf. Figure 1. Interface de SAE MobilityRxiv).
Figure 1. Interface de SAE MobilityRxiv
Ce serveur, qui donne accès à des articles, livres blancs et thèses en langue anglaise n’ayant pas encore fait l’objet d’une revue par les pairs, est destiné à faciliter le dialogue entre experts pour faciliter l’avancement du savoir dans les domaines des transports et de la mobilité.
Lancé récemment, ce site ne propose que quelques dizaines de documents, ce nombre devant vraisemblablement croître rapidement.
En tout cas, c’est une nouvelle source dans le domaine.
Lire aussi :
Les portails documentaires en libre accès : de l’or brut pour le veilleur
Zoom sur Cerema Doc, la plateforme documentaire du climat et territoires de demain
Comment bien rechercher l’information scientifique et technique ?
La veille au défi de l’information scientifique et technique
Twitter est une source d’information incontournable pour le professionnel de l’information : qu’il s’agisse de réaliser une veille métier, un sourcing thématique, un premier tour d’horizon sur un sujet, une veille concurrentielle, Twitter apporte quasi systématiquement une valeur ajoutée à la recherche d’information et à la veille.
Contrairement à la plupart des autres réseaux sociaux, Twitter a l’immense avantage de proposer des fonctionnalités de recherche dignes de ce nom, qui permettent d’explorer efficacement les contenus qu’il renferme.
Pourtant, il arrive que les fonctionnalités proposées ne soient pas suffisantes pour arriver au résultat souhaité. Il faut alors tester différentes méthodes, ruser ou trouver des outils externes qui comblent ces lacunes.
Lire aussi :
Twitter diversifie ses contenus : un casse-tête pour la veille
Comment rendre Twitter plus puissant pour la veille et la recherche ?
RSS, Twitter, Facebook, LinkedIn et les autres: surveille-t-on vraiment la même chose ?
La recherche par mot-clé sur les tweets et retweets d’un compte Twitter s’avère plus compliquée que prévu. C’est pourtant une situation que l’on peut rencontrer régulièrement. Il peut s’agir de vérifier si un compte que l’on suit a abordé tel ou tel sujet par le passé ou, lors d’un sourcing, vérifier si la personne a déjà traité spécifiquement le sujet qui nous intéresse.
Dans cet article, nous explorons les différentes méthodes disponibles pour rechercher sur un compte Twitter.
Déjà abonné ? Connectez-vous...
L’exploration de portails documentaires dans le dernier numéro de BASES (Décembre 2021) a mis en lumière une véritable couche informationnelle du Web, constituée d’ensembles très riches de ressources et sources de valeur sur des secteurs très souvent difficiles à appréhender avec exhaustivité.
Comme nous le faisions remarquer, ces portails sont produits par des personnes qualifiées, documentalistes spécialistes des secteurs traités, qui mettent ici à profit leurs compétences d’expert(e)s de l’information. Des compétences qui garantissent la fiabilité des opérations requises pour la mise à disposition des ressources, de leur recherche à la structuration des données, en passant par leur sélection et leur mise en valeur.
À ce titre, ces produits documentaires constituent des savoirs sectoriels bien aussi précieux, plus cohérents et complets, que certaines fiches sectorielles de l’incontournable Wikipédia. Mais, comme on s’en doute, moins bien publicisés…
C’est pour cette raison que nous avons décidé de les valoriser et de vous les faire découvrir au fur et à mesure de nos découvertes dans une nouvelle rubrique de BASES. Nous n’avons pas hésité à appeler cette rubrique « les trésors du web ». De véritables trésors en effet, dans un Web où le pire côtoie le meilleur et où les ressources les plus visibles sont souvent les plus commerciales…
Lire aussi :
Les portails documentaires en libre accès : de l’or brut pour le veilleur
Zoom sur le portail de l’INRS sur la santé et sécurité au travail
Zoom sur le portail documentaire Eau & Biodiversité
Zoom sur Hortidoc, le portail dédié à l’horticulture
Zoom sur Raildoc, un portail spécialisé sur le ferroviaire
Zoom sur Cerema Doc, la plateforme documentaire du climat et territoires de demain
L’AURG, l’Agence d’urbanisme de la région grenobloise propose en libre accès de nombreux contenus en lien avec l’urbanisme et l’aménagement, et qui ne se cantonnent pas à la région grenobloise. Ces contenus sont susceptibles d’intéresser les veilleurs et professionnels de l’information.
En 2020, l’agence a lancé un nouveau blog de veille appelé « L’Agence veille pour vous » qui regroupe la veille réalisée par la documentaliste en poste. L’occasion pour nous de faire le tour des ressources et produits documentaires dont regorge le site de l’AURG, mais aussi le blog de veille.
Déjà abonné ? Connectez-vous...
Les portails documentaires ont depuis de nombreuses années de multiples atouts qui en font des candidats de choix pour le sourcing des veilleurs. Mais encore faut-il réussir à les identifier.
Les portails sont créés et alimentés par des professionnels de l’information spécialistes des thématiques qu’ils abordent, au contact direct des experts du domaine et avec une connaissance pointue de la recherche d’information et de la veille, de la mise en place des portails et de la structuration de l’information (ontologie, thésaurus, indexation, etc.).
Au-delà du catalogue classique d’une bibliothèque ou d’un centre de documentation, ou encore de certaines bases de données spécialisées, ces portails proposent de plus en plus des veilles thématiques prêtes à l’emploi, des newsletters ou encore des notes de synthèses, études et analyses.
Bref, une véritable mine d’or !
Lire aussi :
Sourcing, de la théorie à l’épreuve de la pratique
Et si on tirait parti des fonctionnalités originales des moteurs ?
Le veilleur peut-il tirer parti des veilles gratuites qui fleurissent sur LinkedIn ?
Et pourtant, quand on commence une veille, ce n’est pas nécessairement à ces ressources que l’on pense en priorité et ce ne sont pas ces sources qui ressortiront en majorité à l’étape de sourcing.
Car les portails ont un défaut majeur : ils sont généralement peu visibles sur les outils utilisés par la plupart des internautes, c’est-à-dire les moteurs de recherche et les réseaux sociaux.
Comment donc les identifier et les intégrer à son processus de veille ?
Comment mettre toutes les chances de son côté pour repérer les bons portails et les bons produits documentaires par rapport à sa thématique de veille ?
Dans cet article, nous proposerons une méthodologie avec les clés d’accès pour identifier des portails thématiques en libre accès en lien avec ses thématiques de veille.
Nous présenterons ensuite dans les prochains articles une sélection de portails thématiques intéressants.
Déjà abonné ? Connectez-vous...
Il y a quelques mois, l’INRS (Institut National de Recherche et de Sécurité) a mis en ligne son nouveau portail documentaire à l’adresse https://portaildocumentaire.inrs.fr/. On y trouve de multiples ressources en santé et sécurité au travail.
On y trouve tout d’abord INRS Biblio, une base de données bibliographique consacrée à la santé et sécurité au travail avec un focus plus spécifique sur la prévention.
À cela s’ajoutent les produits documentaires réalisés par les veilleurs et documentalistes de l’INRS :
Lire aussi :
Comment bien rechercher l’information scientifique et technique ?
INRS Biblio se positionne comme une base de référence en santé et sécurité au travail. Elle propose plus de 83 000 références bibliographiques d’articles (plus de 63 500), de brochures (plus de 6 600), de livres (plus de 4 300), d’études et rapports (près de 4 000), d’actes de congrès (plus de 2 700) et de normes (plus de 1 700), et quelques autres documents, sachant que la presse grand public n’est pas prise en compte.
On dispose d’une recherche simple et d’une recherche avancée. Cette dernière propose de combiner plusieurs champs y compris deux niveaux de descripteurs disponibles. On dispose des opérateurs booléens, de la troncature et de la possibilité de rechercher une expression entre guillemets.
Déjà abonné ? Connectez-vous...
Le Cerema (Centre d’études et d’expertises sur les risques, l’environnement, la mobilité et l’aménagement) a été créé en 2013 par la fusion de 11 organismes. C’est un centre de ressources et d’expertise interdisciplinaire qui travaille essentiellement pour l’État et les collectivités.
Le Cerema met à disposition des rapports d’études, des produits éditoriaux, des avis techniques, des articles qu’il réalise dans ses domaines de compétence.
En novembre 2021, le Cerema s’est doté d’une plateforme documentaire pour recenser et capitaliser l’ensemble de ses productions et livrables disponible à l’adresse : https://doc.cerema.fr/
C’est à cette plateforme riche en contenus et très ergonomique que nous allons nous intéresser dans cet article (Cf. Figure 1. Portail documentaire du Cerema).
Lire aussi :
Figure 1. Portail documentaire du Cerema
Lancé avec 5 000 références en 2021, l’objectif est d’y retrouver l’intégralité des connaissances produites par le Cerema d’ici la fin 2022.
Lors de nos tests, un peu plus de 7 000 documents étaient référencés sur les thématiques suivantes :
Déjà abonné ? Connectez-vous...
Le portail documentaire partenarial Eau & Biodiversité (https://www.documentation.eauetbiodiversite.fr/) a été mis en place depuis une douzaine d’années en co-animation entre l’OFB (Office français de la biodiversité) et OiEau (Office international de l’eau) et avec le soutien financier de l’OFB.
Il compte aujourd’hui 29 contributeurs mettant à disposition leur documentation technique et scientifique sur les thématiques de l’eau et de la biodiversité. Cette littérature grise libre de droits, souvent difficile d’accès, est ainsi partagée et rendue accessible à tout visiteur du portail (Cf. Figure 1. Portail Eau & Biodiversité).
Lire aussi :
Comment bien rechercher l’information scientifique et technique ?
Figure 1. Portail Eau & Biodiversité
Ces 29 contributeurs sont des structures bénéficiant de financements publics en lien avec l’eau et la biodiversité. Parmi eux figurent les agences de l’eau, le BRGM (Bureau de recherches géologiques et minières), l’INRAE (Institut national de recherche pour l’agriculture, l’alimentation et l’environnement), des conservatoires botaniques, le Parc national des Écrins, etc.
L’objectif général est de valoriser les publications de ces organismes publics.
Déjà abonné ? Connectez-vous...