La recherche d’informations financières concernant une entreprise est un exercice dont le niveau de difficulté et le coût peuvent assez vite déraper en fonction du contexte et des enjeux. Tout professionnel de l’information, veilleur ou analyste, en fait souvent l’expérience dans sa collaboration avec ses clients dans les directions de stratégie, marketing, finances/acquisitions, compliance…
Quel que soit le champ et la profondeur de l’investigation à mener et les moyens employés, la recherche de données financières est toujours un défi et un parcours semé d’embûches pour le chargé de recherche, avec parfois, in fine, l’incapacité de parvenir à des certitudes, faute de données et de possibilités de recoupement suffisantes.
Lire aussi :
Méthodologie et outils pour la recherche de statistiques
Comment rechercher des données chiffrées sur Google et moteurs de recherche généralistes ?
Economiser du temps grâce aux outils d’extraction de données
Lors de recherches ou de veilles sur le Web, il n’est pas rare de rencontrer des documents ou des pages Web comportant un gros volume de données chiffrées que l’on souhaite récupérer. Il peut s’agir par exemple de tableaux sur un site internet, d’informations au sein d’un fichier PDF protégé, etc.
Malheureusement, il est souvent impossible de copier-coller l’ensemble de ces données de façon simple et rapide.
S’ensuit alors une longue séance de Ctrl C-Ctrl V pour extraire manuellement les informations utiles... Mais ce temps peut être considérablement réduit grâce à un outil d’extraction de données.
Lire aussi :
Méthodologie et outils pour la recherche de statistiques
Comment rechercher des données chiffrées sur Google et moteurs de recherche généralistes ?
Trouver des informations financières : un exercice de recherche coûteux en efforts et en ressources
Actualité oblige, de nombreux professionnels de l’information se retrouvent à devoir effectuer recherches d’information ou veilles sur le sujet du coronavirus.
Mais cela n’a rien de simple tant le volume d’information à l’échelle mondiale illustre parfaitement le concept de surinformation.
Un volume d’information impossible à gérer humainement
Du côté de la presse par exemple, Tagaday (ex-Pressedd) recensait plus de 19 000 mentions du coronavirus dans la presse française en mars 2020 (voir figure 1.).
Mediatree relevait quant à lui plus de 49 000 mentions sur les radios et TV françaises entre le 19 et le 25 mars. Et on se situe ici uniquement au niveau français...
Les articles scientifiques ne sont bien sûr pas en reste. Les bases de preprints (donc non validés par les pairs) MedrXiv et BiorXiv dépassent déjà les 1 000 articles dédiés au Coronavirus.
Enfin, les réseaux sociaux ne parlent pratiquement plus que de cela.
IST • Les outils documentaires du CHU de Rouen : CISMeF, LiSSa et HeTP
TENDANCES • L'OSINT : illusion marketing ou nouveau champ d’investigation pur les professionnels de l’info ?
BREVES • I-expo et Documation reportés au mois de mai 2020
OPEN DATA • L’INPI vient de lancer la base gratuite data.inpi.fr
MOTEURS DE RECHERCHE • Google, toujours à l’affût de nouveaux créneaux porteurs
Dès 1995, le CHU de Rouen s’est intéressé aux sites web en langue française concernant la santé puis à la littérature médicale en langue française et a acquis une notoriété certaine. Nous avons choisi dans cet article de nous intéresser aux différents outils documentaires qu’il propose.
Cet intérêt du CHU de Rouen a débouché, dans un premier temps, sur le projet de Catalogue et Indexation des Sites Médicaux de langue française (CISMeF) qui a été réalisé par l’équipe qui appartient aujourd’hui au D2IM (Département d’Informatique et d’Information médicale du CHU hôpitaux de Rouen). Ce site s’est développé et se développe toujours de façon continue tant au niveau de son contenu que des possibilités de recherche aujourd’hui très avancées. Il a été distingué par de très nombreux prix, a reçu de nombreux labels et a bénéficié aussi du soutien financier de divers organismes.
Depuis quelque temps, on voit fleurir un peu partout, sur les réseaux sociaux et en particulier dans les environnements liés à la veille et à l’intelligence économique, le terme d’« OSINT », sorte de hashtag de ralliement, entre initiés, à une cause ou une injonction secrète.
La difficulté à en saisir immédiatement le sens, - le terme semble, sinon barbare, pour le moins abscons - nous a intrigués. S’agit-il d’un nouveau concept stratégique de notre monde de l’information, d’un code communautaire ou bien, très prosaïquement, d’un hashtag «marketing » destiné à promouvoir, dans la collectivité des professionnels de l’information et sur le web, quelques consultants ou produits ?
Data.inpi.fr propose des données sur les entreprises issues du Registre National du Commerce et des Sociétés.
Cette base vient rejoindre les autres bases de données gratuites déjà disponibles, proposées par l’INPI sur :
les marques françaises, de l’Union Européenne et internationales ;
les brevets français, européens et internationaux ;
les dessins et modèles français et internationaux ;
Christoph Haxel qui organise AI - SDV est parfaitement capable, comme il le montre, d’adapter le nom de sa ou ses manifestation(s) pour suivre l’évolution des technologies.
En effet, AI - SDV remplace IC - SDV qui a eu lieu deux fois et qui était la fusion des deux manifestations II - SDV et ICIC. De plus, la localisation à Heidelberg a été abandonnée. La mention « AI » dans le titre illustre, bien sûr, le développement de l’intelligence artificielle et de ses applications.
C’est pourquoi, les thèmes privilégiés seront l’intelligence artificielle, la numérisation comme préalable à la mise en place d’une intelligence artificielle, l’apprentissage profond (deep learning), …
Avec Google, impossible de s’ennuyer, car l’actualité ne s’arrête jamais : nouveaux produits, évolutions de fonctionnalités, revirement de stratégie, etc. Et ce début d’année 2020 ne manque pas de nouveautés qui vont venir impacter le quotidien des professionnels de l’information pour le meilleur et pour le pire.
Les évolutions majeures concernent peu le moteur Web de Google mais surtout ses verticales thématiques : Google Datasets, Google Podcasts, ou encore Google Actualités.
1. Lutter contre l’infobésité en privilégiant une sélectivité des sources;
2. Trouver des solutions pour intégrer les contenus multimédias à sa veille au même titre que les contenus textuels;
3. Tirer parti des évolutions de la traduction automatique pour renforcer sa veille sur des langues autres que l’anglais;
4. Accorder plus d’importance à la fiabilité des sources et informations et être vigilant sur la porosité de la frontière information/publicité;
5. Adapter ses livrables aux attentes et pratiques de son public et non l’inverse;
