On savait que Questel travaillait avec la société hongroise Chemaxon pour réaliser ses modules chimie. Comme les logiciels utilisés par Intellixir et Orbit sont différents, cela s’est fait en deux temps.
Intellixir a été le premier à offrir le module chimie, avec la contrainte de limiter la recherche aux données déchargées dans Intellixir mais avec l’avantage de fonctionner aussi bien sur des documents brevets que sur la littérature ou les essais cliniques.
En ce qui concerne Orbit, une première étape vient d’être franchie avec la mise a disposition en beta du module chimie qui permet, lui, d’effectuer des recherches sur l’ensemble de la base.
Pour y avoir accès, il suffit de le demander à son interlocuteur commercial, Questel étant très en demande de retours.
Précisons que, pour limiter le bruit, et comme dans Patentscope, ces recherches sont limitées aux brevets ayant au moins un code CIB dans le domaine de la chimie. Par contre, Orbit utilise un algorithme de détection de noms de molécules, ce qui signifie que cette détection n’est pas limitée par la mise à jour d’un thésaurus. L’algorithme sera donc capable de comprendre le nom d’une nouvelle molécule et de l’indexer.
Auteur : François Libmann, Directeur de Publication
Nous avons déjà évoqué à la suite de l’édition 2016 de l’ICIC la généralisation de la reconnaissance automatique des éléments chimiques dans le texte, et ce quelle que soit la façon de les écrire (BASES n° 345, février 2017).
Comme on l’avait vu, au moins quatre acteurs étaient présents sur ce créneau : Infochem, en particulier avec l’OMPI, Ontochem IT Solution avec Infoapps, Chemaxon avec Questel, NextMove Software avec Minesoft (pour PatBase), sans oublier STN avec PatentPack basé sur la reconnaissance intellectuelle et non pas automatique des noms chimiques au sens large.
A l’occasion de l’édition 2017 de l’ICIC, Infochem (filiale de Springer Nature depuis 2015) a annoncé de nouveaux développements dans l’informatique appliqué à la chimie et en particulier a précisé l’ensemble des langues dans lesquelles son outil de reconnaissance fonctionnait désormais à savoir, l’anglais, l’allemand, le français, le russe, le coréen, le japonais et le chinois.
Infochem a notamment insisté sur le fait qu’ils adaptent précisément leurs prestations aux besoins précis de leurs clients, généralement dans le cadre d’un projet.
Le producteur de Chemical Abstracts vante depuis longtemps la qualité de l’indexation manuelle qu’il réalise des composés chimiques présents dans les textes d’articles ou de brevets référencés dans la banque de données. Cette indexation manuelle est réalisée par des chimistes des pays d’origine des documents.
Avec Chemical Explorer et Textmine lancé par Minesoft (voir Bases n° 335, Mars 2016) sont apparus le repérage et l’indexation automatique des composés chimiques et l’analyse automatique du contenu des brevets selon certains critères.
Peu après, STN a lancé PatentPak (voir Bases n° 339, juillet-août 2016) qui, sur un nombre relativement limité de brevets, néanmoins en augmentation rapide, permet la localisation dans le texte du brevet de la citation d’une molécule précise.
Parmi les produits présentés par CAS à l'ICIC 20161 figurait un nouveau venu baptisé «MethodsNow» (www.methodsnow.com). Il est constitué en fait de deux produits, l’un consacré aux méthodes de réalisation de synthèses (MethodsNow-Synthesis) et le second aux méthodes analytiques (MethodsNow-Analytical).
La partie consacrée aux méthodes de synthèse est une extension de SciFinder, auquel il faut déjà avoir souscrit.
A l’occasion de l’ICIC 2016 à Heidelberg, CAS (Chemical Abstracts Services) a présenté deux nouveaux produits ChemZent et MethodsNow.
Nous allons nous intéresser ici à Chemzent.
Chemzent propose la traduction en anglais des notices/résumés de la publication Chemisches Zentralblatt, la plus ancienne publication d’abstracts rédigés originellement en allemand, dans le domaine de la chimie.
Depuis quelques temps déjà, la recherche dans le domaine de la chimie se développe et se complexifie.
C’est pourquoi, et comme il y a un vrai marché, les offres déjà conséquentes se développent, se diversifient et apportent de nouvelles possibilités qui aident les chercheurs dans leur travail, en particulier en leur faisant gagner du temps dans le traitement de questions toujours plus complexes.
Curieusement, deux initiatives issues de sociétés plus complémentaires que concurrentes ont apporté des réponses ayant des points communs à des problématiques voisines.
Patbase est, avec Orbit et TotalPatent, l’un des produits commerciaux offrant l’accès à l’essentiel des brevets déposés dans le monde depuis très longtemps, avec une forte proportion de brevets disponibles en texte intégral dont beaucoup sont traduits en anglais, et un puissant langage de recherche.
De nombreuses banques de données brevets sont, par ailleurs, accessibles sur les serveurs Proquest Dialog et STN, ce dernier ayant comme on le sait, une offre spécifique dans le domaine de la chimie.
Minesoft vient d’innover, justement dans le domaine de la chimie, avec le lancement de Chemical Explorer.
STN annonce avoir - enfin - réussi à regrouper les bases de données de chimie proposant des recherches sur les structures de Markush.
Créées par le Dr Eugène A. Markush, un hongrois né au 19ème siècle, les structures de Markush sont une façon de décrire les molécules chimiques en regroupant dans certains symboles un ensemble d’éléments similaires ce qui simplifie grandement l’écriture de ces structures quand elles sont complexes.
Dans le domaine des brevets, les structures de Markush permettent de protéger une famille de composants analogues avec une seule revendication.
L’édition 2015 de l’ICIC (The International Conference on Trends for Scientific Information Professionals) était bien dans la lignée des éditions précédentes, mais plus facile d’accès car se déroulant à Nice.
On a retrouvé certains « fidèles » spécialisés dans le domaine comme le hongrois Chemaxon ou l’anglais Minesoft qui propose en particulier PatBase.
D’autres orateurs ont présenté diverses avancées et la conférence a été aussi l’occasion de découvrir l’offre de la start-up américaine AI Patents qui faisait là sa première présentation en Europe.
Le courrier du CFIB, sous la plume de Fabienne Monfort-Windels, a fait part des nouvelles possibilités offertes par Wikipedia pour ce qui concerne la recherche sur les structures chimiques.
L’idée est de pouvoir rechercher sur les structures de 15.000 composants chimiques présents dans Wikipedia. En fait, pour diverses raisons techniques, les recherches sont limitées à environ 13.500 structures, ce nombre étant en constante croissance.
Ce projet est une collaboration entre le laboratoire Novartis, l’Ecole Polytechnique Fédérale de Lausanne et Actelion, une société biopharmaceutique.
NCI Global est la version pour utilisateurs finaux de Chemlist, une base de données disponible sur STN, qui s’adresse quant à elle aux experts maitrisant le langage de commande. Leur contenu est donc identique mais c’est la façon de chercher l’information qui diffère.
Ce sont des banques de données d’informations règlementaires concernant les produits chimiques (343 000 substances, chiffre de mars 2015) couvrant plus de 100 sources dont TSCA (Toxic Substance Control Act), EINECS (European Inventory of Existing Commercial Chemical Substances), IECSC (Inventory of Existing Chemical Substances in China) ou REACH.