L’extension Instant Data Scraper portée par les développeurs de la société Web Robots permet à l’utilisateur d’extraire rapidement des données structurées à l’instar de flux Twitter ou de tableau de données présent sur une page web (sauf les données sur des photos !).
Grâce à son Intelligence Artificielle, l’extension détecte les données présentes sur la page et/ou permet aussi de sélectionner la zone de scrapping. Elle propose plusieurs fonctionnalités pour personnaliser l’extraction : choix du format d’exportation (Excel ou CVS), durée du scroll de l’IA ou encore la structure du tableau en cliquant sur ‘Try Another Table’.
Lire aussi : Economiser du temps grâce aux outils d’extraction de données
Auto Scroll Search est une extension développée par le programmateur américain Glen Chiacchieri. Elle permet à l’utilisateur de réaliser une recherche rapide sur un document mais surtout sur son fil d’actualité réseaux sociaux.
Le petit : outre l’identification et la localisation des mots clefs semblable au crtl+f
, l’extension ne se limite pas uniquement au contenu visible. Appliquée à un flux RSS, sur son compte Facebook ou encore son fil d’actualité Twitter, elle va parcourir l’intégralité de la page jusqu’à l’identification du mot clef au cœur du flux.
Pour l’utiliser, il suffit de rentrer le mot recherché dans la barre de recherche dédiée. Si le scrolling est trop long, on appuie simplement sur le bouton « STOP » pour y mettre un terme.
The Lens est un moteur de recherche lancé en 2000 par une organisation à but non lucratif, Cambia, basée au sein de l’Université de Technologie du Queensland à Brisbane en Australie.
Particularité distinctive, il donne accès à trois bases de données, dont une base de publications scientifiques, objet de l’article de François Libmann dans ce même numéro « The Lens pour la littérature scientifique : des contenus mal valorisés », une base de séquences et une base de données brevets en accès libre. Cette dernière est l’objet de cet article.
Dans l’article précédent « The Lens, un outsider au fort potentiel pour la recherche brevet gratuite », Philippe Borne s’est focalisé de façon détaillée sur la partie brevet de The Lens.
Dans cet article nous examinerons la partie consacrée à la littérature scientifique de The Lens que l’on atteint en cliquant sur « Scholary works » dans le menu déroulant « Our apps » sur la page d’accueil.
La recherche dans la littérature scientifique sous forme numérique est disponible depuis très longtemps à de multiples endroits de façon gratuite ou payante. Ici, elle est limitée aux documents dont les références sont en accès libre, ce qui ne préjuge pas de la gratuité ou non de l’accès au document lui-même (41 millions sont en accès libre).
Ces références proviennent de Crossref, Pubmed, Core et Microsoft Academic, sachant que Microsoft vient d’annoncer l’arrêt de son service Microsoft Academic, ce qui risque de poser problème.
Depuis l’apparition dans les années 2000 des premiers services permettant de raccourcir des liens ou urls (Uniform Resource Locator), aussi appelés shorteners, de nombreuses plateformes ont ensuite vu le jour avec plus ou moins de succès.
Ces plateformes apparaissent et disparaissent au gré du temps, laissant le professionnel de l’information confronté à cette instabilité. L’un des derniers en date à abandonner la bataille n’est autre que huit.re, un outil proposé par Framasoft que nous utilisions parfois pour nos articles.
Et même des services, qui sur le papier procurent un sentiment de sécurité quant à leur pérennité, soit parce qu’ils sont issus des géants du Web, soit parce qu’ils existent depuis longtemps, ne sont pas à l’abri de disparaître du jour au lendemain.
Google en a été la preuve il y a quelques années avec son service googl.gl qui resta incontournable jusqu’en 2019. La firme de MountainView préféra pourtant réorienter son service autour de sa plateforme de création de liens dynamiques Firebase Dynamic Links et ferma googl.gl en 2019.
GeoSearch, l’extension de l’entreprise Fiveblocks qui vous permet de réaliser des recherches locales sans passer par un VPN. Cet outil permet d’obtenir des résultats Google d’un autre pays sans être influencé par votre localisation réelle. Ainsi, en renseignant la ville et la langue souhaitées, vous pourrez rechercher efficacement sur le contenu web et la presse en ligne locale (actualité, recherche d’emplois…).
À noter que les méthodes de recherche avancée de Google fonctionnent sur Geosearch. Cela peut être particulièrement utile dans le cadre d’une recherche d’information très localisée portant par exemple sur une usine bien identifiée.
Lire aussi : Netsources 146 - Dossier Spécial sourcing à l'international
SynapsInt, l’outil OSINT salvadorien qui vous permet de tracer des données sur le web. A partir de plusieurs sources ouvertes et plateformes de données sur le web ouvert, cet outil vous permet de collecter et centraliser des informations sur une cible : adresse IP, nom de domaine, adresse mail ou numéro de téléphone (voir les sources et outils utilisés).
Il suffit d’entrer dans la barre de recherche la donnée recherchée : une url, une adresse IP ou numéro ASN, une adresse mail, un numéro de téléphone ou le nom d’un compte twitter puis de lancer la recherche. Ce qui est particulièrement utile dans le cadre d’une démarche de due diligence, d’une enquête d’e-réputation, de détection de leaks d'adresse mail ou lors de l’analyse d’un site web.
Lire aussi : Peut-on innover sur les opérateurs de recherche en s’inspirant du SEO, de l’OSINT, …et des hackers ?
Temps total de lecture : 25 min
Temps total de lecture : 2 min
Les travaux étudiants (mémoires, thèses ou encore rapports de stage) ont toute leur place dans les sources d’information des veilleurs. Ils peuvent souvent fournir des informations uniques que l’on ne retrouve pas sous d’autres formats ou aiguiller l’internaute vers d’autres ressources pertinentes, notamment grâce aux références bibliographiques.
Mais encore faut-il y avoir accès...
Si l’archivage et la mise à disposition des thèses répondent à des obligations légales et des processus de plus en plus structurés et formalisés ce n’est pas le cas pour les mémoires en France ni à l’international.
Chaque organisme étant libre en matière de diffusion des mémoires, on se retrouve alors avec une multitude d’initiatives isolées qu’il est souvent difficile d’identifier.
Cette quête des mémoires peut vite s’avérer tellement chronophage qu’elle n’est pas nécessairement rentable.
Heureusement avec les années, certaines initiatives unifiées à l’échelle d’un pays ou d’une discipline ont pris de l’ampleur et deviennent des sources de référence en la matière.
Lire aussi : Tour du monde des sites de thèses en accès libre
Les fusions/acquisitions sont depuis longtemps très fréquentes dans le domaine de l’information.
Près de nous, voici des années que Questel rachète des sociétés, en France comme à l’étranger, offrant divers services liés à la propriété intellectuelle, cœur de son activité. Dans un autre domaine, Cision a acheté il y a quelques années Europresse, l’Argus de la Presse et PR Newswire. Cette situation existe aussi aux Etats-Unis.
Aujourd’hui, il s’agit d’un achat important d’un acteur essentiellement privé, en l’occurrence Proquest par l’acteur public qu’est Clarivate. La transaction s’élève à 5,3 milliards de dollars, dont quatre en liquide et 1,3 en actions.