Brèves de veille

Wikipédia et Grokipedia : la bataille du savoir à l’ère de l’IA

Anne-Marie LIBMANN
Blog du
22 octobre 2025
100
Tags
IA | open source | Intelligence artificielle | Wikipédia
Wikipédia et Grokipedia : la bataille du savoir à l’ère de ... Image 1
Wikipédia et Grokipedia : la bataille du savoir à l’ère de ... Image 1

À l’heure où l’intelligence artificielle redéfinit l’accès au savoir, Wikipédia et Grokipedia, le nouveau projet d’Elon Musk, incarnent deux visions opposées : l’une communautaire et ouverte, l’autre centralisée et portée par xAI. Alors que Wikipédia adapte ses données pour dialoguer avec les IA tout en préservant sa transparence, Grokipedia promet une alternative « sans biais ». 

Le Wikidata Embedding Project : Wikipédia s’adapte à l’IA

Lancé le 1ᵉʳ octobre 2025 par la Wikimedia Foundation, en partenariat avec Jina.AI et DataStax, le Wikidata Embedding Project vise à rendre les 119 millions d’entrées de Wikidata, alimentées par 24 000 contributeurs actifs, exploitables par les intelligences artificielles.

Grâce à la recherche vectorielle, qui traduit les concepts en relations numériques via des modèles comme Jina Embeddings v3 (multilingue, jusqu’à 8 192 tokens), le système dépasse les recherches par mots-clés. Une requête sur « scientifique », comme l’illustre le site TechCrunch, proposera ainsi des biographies comme celles de Marie Curie ou Albert Einstein, des concepts liés comme la méthode scientifique ou des visuels tels que des schémas de formules.

Ce projet s’appuie sur des APIs vectorielles ouvertes, notamment celles de DataStax (Astra DB), pour intégrer les données de Wikidata dans les assistants IA via la technologie RAG (Retrieval Augmented Generation). Un webinar le 9 octobre 2025 a marqué le lancement, avec un support initial en anglais, français et arabe, et 30 millions d’entrées déjà vectorisées.

Maryana Iskander, PDG de la Wikimedia Foundation : "Face à l’IA, nous devons préserver notre modèle ouvert en l’intégrant intelligemment."

Cette stratégie répond à une urgence : les résumés IA de Google, déployés à grande échelle en 2025, captent 8 % du trafic humain de Wikipédia, menaçant ses dons, qui représentent 80 % de son financement.

Lire la suite...

Comment accéder à 4 millions de thèses européennes en 2025 (sans perdre des heures)

Rédaction
Blog du
1er octobre 2025
559
Tags
thèses | méthodologie
Comment accéder à 4 millions de thèses européennes en 2025 ... Image 1
Comment accéder à 4 millions de thèses européennes en 2025 ... Image 1

DART-Europe a fermé. EThOS est hors service. Global ETD Search de NDLTD est indisponible.
Trois piliers de l’accès aux thèses européennes ont disparu… mais la recherche continue.
Le nouveau Guide des thèses européennes 2025, conçu par l’équipe de BASES (votre référence en information spécialisée depuis 1985), devient l’outil incontournable pour accéder à plus de 4 millions de thèses à travers 25 pays.


Un contexte bouleversé

  • Février 2025 : fermeture définitive de DART-Europe (1 million de thèses, 29 pays).
  • Depuis 2023 : EThOS (Royaume-Uni) hors service après cyberattaque.
  • Depuis des mois : Global ETD Search (NDLTD) indisponible.

👉 Résultat : les chercheurs et documentalistes se retrouvent sans passerelle centralisée pour accéder aux thèses européennes.


La solution : un guide unique, testé et documenté

  • 140+ portes d’entrée directes vers les repositories universitaires.
    Fini les 15 minutes perdues à chercher où se trouvent les thèses sur le site d’une université : un clic = accès direct à la collection.
  • 25 pays couverts avec stratégies sur mesure.
    Chaque système national est expliqué, testé, optimisé : vous savez immédiatement par où commencer.
  • Une vision globale :
    • les disparitions majeures (DART-Europe, EThOS, Global ETD Search)
    • les solutions encore actives et fiables
    • les nouveaux portails apparus dans plusieurs pays.

    Exemple : pour l’Allemagne, le portail national DNB ne contient que 12 % des thèses récentes. Le guide vous indique comment accéder aux 88 % restants.


    Contenu du guide

    • partie 1 : pourquoi et comment explorer les thèses étrangères
    • partie 2 : le nouveau paysage documentaire (fermetures, solutions actuelles, stratégies de contournement)
    • partie 3 : 25 fiches pays détaillées
      • sources nationales
      • stratégies d’accès
      • URL directes vers les dépôts universitaires
      • volumes de thèses disponibles (données août 2025)
    • méthodologie éprouvée : tests sur des milliers de documents, utilisation avancée de BASE et OpenAIRE, astuces pour contourner les limites des portails.

    Pour qui ?

    • Chercheurs et doctorants → revues de littérature internationales, repérage des travaux existants
    • Documentalistes et bibliothécaires → réponses rapides aux demandes, mise à jour des ressources
    • Veilleurs scientifiques et responsables R&D → détection d’innovations, cartographie des expertises par pays

      pourquoi ce guide fait la différence ?

      • un gain de temps considérable : chaque lien testé fait gagner ~15 min → des dizaines d’heures économisées.
      • des données à jour (août 2025) : un paysage entièrement revu après les fermetures de portails historiques.
      • une expertise unique : compilation d’informations introuvables ailleurs, grâce à 40 ans d’expérience en veille documentaire (BASES).

        📘 guide des thèses européennes 2025

        140+ accès directs | 25 pays couverts | plus de 4 millions de thèses disponibles
        Un outil conçu pour ceux qui ne veulent pas chercher à l’aveugle.

        ➡️ Découvrir et commander le guide

        Préserver l’intégrité de la science : un guide pratique et accessible

        Francois LIBMANN
        Blog du
        08 Août 2025
        1168
        Tags
        science ouverte | littérature scientifique | fact checking | recherche publique
        Préserver l’intégrité de la science : un guide pratique et ... Image 1
        Préserver l’intégrité de la science : un guide pratique et ... Image 1
        Savoir repérer les dérives

        L'intégrité scientifique peut être compromise de multiples façons. Parmi les écueils les plus fréquents, on retrouve le plagiat, la manipulation d'images, l'abus d'auto-citations, un recours excessif à des articles rétractés, ou encore l'utilisation de données peu fiables ou incohérentes.

        Mais comment identifier ces dérives ? Et surtout, que faire lorsqu’on en repère une dans un article ? Aujourd’hui, des outils existent pour aider chacun – chercheur, lecteur ou professionnel de l'information – à vérifier, signaler ou mieux comprendre les écarts. Cette pratique, appelée relecture post-publication (Post Publication Peer Review), gagne du terrain. Elle a d’ailleurs fait l’objet d’un article dans BASES N° 433 - mars 2025. 

        Le COSIG un guide complet détaillé

        Pour accompagner ces démarches le Center for Open Science dont la mission est, en particulier, de contribuer à l’intégrité de la science vient de publier une mise à jour de son guide de référence le COSIG (Collection of Open Science Integrity Guides) .

        Lire la suite...

        Les peer reviews des articles de NATURE sont maintenant disponibles

        Francois LIBMANN
        Blog du
        14 Juillet 2025
        1613
        Tags
        science ouverte | littérature scientifique | protocole
        Les peer reviews des articles de NATURE sont maintenant ... Image 1
        Les peer reviews des articles de NATURE sont maintenant ... Image 1

        Nous avons évoqué dans le numéro 434 de BASES (Mars 2025) le développement, pour les articles de recherche scientifique, du » post publication peer review  » c’est à dire la revue par les pairs après publication et non pas avant, comme c’est traditionnellement le cas.

        Un des arguments avancés pour justifier cette démarche, qui s’est répandue plutôt rapidement, était le caractère confidentiel et obscur du processus de « peer review ». 
        Cet argument vient de tomber, au moins en partie, car l’éditeur Springer Nature vient d’annoncer, qu’après une période concluante de tests qui a duré plusieurs années, tous les articles de 16 publications (voir ci-dessous) éditées par Springer Nature comporteront une annexe reprenant en détail le dialogue entre les reviewers et l’auteur, cette démarche étant appelée « transparent peer review ». On y trouve l’intégralité des questions et des réponses.

        Ce sont des documents extrêmement intéressants car les reviewers analysent l’article dans le détail, posent des questions précises et font des remarques pertinentes.
        Lire la suite...

        ChatEurope : un chatbot aux informations vérifiées

        Francois LIBMANN
        Blog du
        04 julliet 2025
        1402
        Tags
        intelligence économique | fact checking | veille medias
        ChatEurope : un chatbot aux informations vérifiées Image 1
        ChatEurope : un chatbot aux informations vérifiées Image 1

        Une dizaine de media européens, pilotés par l’Agence France Presse et cofinancés par la Communauté Européenne viennent de lancer ChatEurope.

        Cette plateforme a été créée pour répondre à une très grande variété de questions liées à l’Europe posées en langage naturel dans dix langues, les réponses étant fournies en sept langues.

        Le contenu est composé de milliers de documents (articles, dépêches, …) provenant des media partenaires à partir desquels le chatbot construit ses réponses.

        S’appuyant uniquement sur des contenus validés les réponses peuvent être considérées comme fiables ce qui est un critère important de nos jours.

        Lire la suite...

        Les « zombie papers », ces articles rétractés mais toujours cités

        François LIBMANN
        Blog du
        30 Mai 2025
        1601
        Tags
        fake news
        Les « zombie papers », ces articles rétractés mais toujours ... Image 1
        Les « zombie papers », ces articles rétractés mais toujours ... Image 1

        Le blog Retractation Watch existe depuis 2010 et recense plus de 59 000 articles rétractés. Sa notoriété va grandissant d’autant qu’il a récemment été acquis par CrossRef.

        La rétractation d’un article peut être due à différentes raisons telles que fabrication de données, manipulation des résultats, plagiat, erreurs méthodologiques, manipulation d’images, manquements éthiques…

        On en parle de plus en plus, car on est dans la problématique plus générale de fake news, sujet très « tendance ».

        Un problème majeur réside dans le fait que le retrait d'un article n'empêche pas celui-ci de continuer à être cité, ce qui contribue à la diffusion de résultats erronés, fausse les résultats des méta-analyses et peut également avoir un impact négatif sur les politiques publiques ou la pratique clinique.

        Lire la suite...

        SLA : la disparition annoncée d’un pilier américain de l’information

        Francois LIBMANN
        Blog du
        16 mai 2025
        1429
        SLA : la disparition annoncée d’un pilier américain de ... Image 1
        SLA : la disparition annoncée d’un pilier américain de ... Image 1

        La Special Libraries association (SLA), a annoncé avoir entamé sa dissolution dont le processus prendra fin en avril 2026. Cette démarche a pour but d’éviter une faillite pure et simple, en gardant le contrôle des opérations.

        C’est une perte très significative pour les professionnels nord-américains de l’information, tant cette association avait un rôle central. C'est aussi un symbole qui va disparaître pour la profession toute entière dans le monde de l'information.

        La SLA a été créée aux États-Unis en 1909 et ne compte plus aujourd’hui qu’un peu plus de 1 000 membres dont certains non-américains. Nous avons pu retrouver que le nombre de membres avait même dépassé les 14.000 en 1993-94.

        Cette dissolution est due à plusieurs facteurs d’après l’association elle-même  :

        • la baisse continue du nombre d’adhérents, particulièrement au cours de cette dernière décennie
        • plus généralement la baisse du nombre de centres de documentation à partir des années 2000
        • la découverte de l’existence de problèmes mal pris en compte sur les retraites d’anciens salariés et un paiement non provisionné à un fournisseur de données
        Lire la suite...

        Pour la première fois, un article écrit par une IA franchit avec succès l'étape de l'évaluation par les pairs (« peer review »)

        François LIBMANN
        Blog du
        04 Avril 2025
        2222
        Pour la première fois, un article écrit par une IA franchit ... Image 1
        Pour la première fois, un article écrit par une IA franchit ... Image 1

        SAKANA AI, une start up japonaise fondée par deux anciens chercheurs de Google,  a développé l’outil AI scientist est capable d’écrire des articles de recherche d’une qualité suffisante pour être acceptée par une revue par les pairs (peer review).

        Certes, sur les trois articles qui avaient été soumis, un seul a obtenu une évaluation suffisante. Mais cela est considéré comme un grand succès, car, d’après la société, c’est la première fois que cela arrive. Les chercheurs ont l’honnêteté de préciser que le jury auquel avaient été présentés les trois articles parmi 43 savait que certains articles pouvaient avoir été écrits par une IA.

        Lire aussi : Une nouvelle forme de Peer Review se développe rapidement

        Ces trois articles ont été générés de bout en bout par l'IA, sans aucune intervention humaine. L'IA Scientist-v2 a développé une hypothèse scientifique, conçu des expériences pour la valider, rédigé et perfectionné le code pour les exécuter, analysé les données et les a présentées sous forme de chiffres. Elle a également rédigé l'ensemble du manuscrit scientifique, du titre à la référence finale, en incluant la mise en place des figures et l'intégralité du formatage.

        L’outil AI Scientist a été entrainé dans trois sous-domaines du « machine learning ». 

        Les chercheurs de SAKANA AI ont  fusionné différents modèles de fondation plutôt que de partir de zéro et la nouveauté réside dans l’algorithme créé, qui s’inspire de la nature,  pour automatiser le processus.

        On peut sans trop de risque faire l’hypothèse que ce premier succès risque de générer de profonds changements dans le monde de la publication scientifique.

        The AI Scientist Generates its First Peer-Reviewed Scientific Publication

        The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery, LIU et al 2024

        Quels sont les champions des articles retractés ?

        Francois LIBMANN
        Blog du
        28 Février 2025
        2004
        Quels sont les champions des articles retractés ? Image 1
        Quels sont les champions des articles retractés ? Image 1

        On parle de plus en plus du problème des articles (scientifiques) rétractés.

        Plusieurs raisons peuvent conduire à la rétractation d’un article :  

        . Mauvaise conduite scientifique telle qu'invention ou falsification de données

        . Plagiat ou auto-plagiat

        . Erreurs non intentionnelles, par exemple biais expérimentaux ou erreurs statistiques

        . Problème d’éthique par exemple concernant le bien-être animal

        . Article soumis à plusieurs revues ou morcellement d’une étude en multiples articles

        . Utilisation de textes ou d’images protégées

        . Article issu d’une « paper mill »(entreprises vendant des articles fictifs ou plagiés)

        Comme on le voit, les raisons ne manquent pas.

        Si le phénomène est choquant avec 40 000 articles rétractés pendant les dix dernières années, il faut cependant rapporter ce chiffre au 50 millions d’articles publiés durant cette période, ce qui représente moins de 0,1% même si ce chiffre est sûrement sous-évalué. 

        Comme on peut s’en douter il y a des champions  tels que la Chine d’où sont issus près de 60% des articles rétractés. Ce sont les petits hôpitaux ou les universités dans le domaine médical qui se distinguent particulièrement.

        En dehors de la Chine, d’autres champions sont la Ghazi University au Pakistan, la Addis Ababa University en Ethiopie l’Institute of Engineering and Technology à Coimbatore en Inde. La King Saud University à RiYadh en Arabie Saoudite est également bien placée. 

        On trouvera des informations beaucoup plus détaillées dans l’excellent article de Nature « These universities have the most retracted scientific articles » du 20 février 2025 Vol 638 pp 596-599.

        L’éditeur Wiley a étudié l’utilisation de l’IA par les chercheurs

        Francois LIBMANN
        Blog du
        21 Février 2025
        2049
        L’éditeur Wiley a étudié l’utilisation de l’IA par les ... Image 1
        L’éditeur Wiley a étudié l’utilisation de l’IA par les ... Image 1

        Wiley a récemment mené une étude auprès de près de 5 000 chercheurs sur leurs utilisations actuelles de l’IA et la probabilité de leurs futures utilisations.

        Le questionnaire a porté sur 43 cas d’utilisations spécifiques de l’IA dans l’ensemble du processus de recherche.

        Les principaux résultats sont les suivants :

        • Les utilisations actuelles de l’IA sont limitées à quelques tâches, mais les chercheurs attendent une extension rapide de son utilisation tout au long du processus de recherche 
        • Les chercheurs sont très intéressés par l’IA, et une majorité estime que l’IA surpasse actuellement les humains pour plus de la moitié des 43 cas d’utilisation
        • La Chine et l’Allemagne sont en tête en matière d’utilisation de l’IA
        • Plus de 60 % des chercheurs considèrent que le manque de directives et de formation est un obstacle à l’augmentation de leur utilisation de l’IA
        • Ce sont les domaines de l’informatique et de la médecine dans lesquels les chercheurs souhaitent le plus être des « adopteurs précoces » de l’IA ; c’est l’inverse, dans le domaine des sciences de la vie.

        À la suite de cette étude, Wiley élabore des directives à destination des auteurs pour une utilisation efficace et responsable de l’IA.

        Le rapport est disponible sur ce site. 

        • 1
        • 2
        • 3
        • 4
        • 5
        • 6
        • 7
        • 8
        • 9
        • 10
        • ›
        • Fin