Bases & Netsources - Accueil

L’intelligence économique commence par une veille intelligente

Comment valoriser les contenus multimédias dans un livrable de veille ?

Netsources no
143
publié en
2019.12
1333
Comment valoriser les contenus multimédias dans un livrable ... Image 1
Comment valoriser les contenus multimédias dans un livrable ... Image 1

Une fois les vidéos, images ou contenus audios identifiés dans le cadre d’une veille ou d’une recherche d’information, il n’est pas si simple de les valoriser et notamment d’analyser, sauvegarder, utiliser et retranscrire ces contenus dans ses livrables.

D’une part parce qu’il s’agit souvent de contenus éphémères qui peuvent disparaître du jour au lendemain sans laisser de traces.

Et d’autre part parce qu’il est très difficile de retranscrire ces contenus de manière intelligible et efficace dans un livrable.

Il est en effet peu satisfaisant de transmettre un simple lien vers une vidéo ou un podcast en indiquant que le passage intéressant se situe à la 75e minute...

Quels sont les outils et méthodes existant aujourd’hui pour simplifier cette capitalisation et permettant de tirer parti au mieux de ces contenus dans un contexte de veille et de recherche ?

Lire aussi : 

La révolution multimédia bouscule la veille
Outils de recherche de vidéos : des métadonnées au speech to text
Outils de recherche d’images : des métadonnées à la reconnaissance de texte, d’objets et de visages
Outils de recherche sur les contenus audios : un segment encore pauvre
Mettre en place une veille sur les contenus multimédias


Analyser les vidéos est un impératif

Il est de plus en plus fréquent de collecter des vidéos, images, graphiques, dataviz, podcasts dans le cadre de ses veilles, mais, comme pour les contenus textuels, il est impératif d’évaluer la provenance de ces contenus et leur fiabilité. Les contenus multimédias ne sont pas épargnés par la désinformation ou les analyses biaisées ou trop hâtives.

Il n’est ainsi pas rare de trouver des infographies ou dataviz qui compilent des données émanant de sources sérieuses, mais qui ne sont en réalité par comparables. Et cela, fausse ainsi complètement l’analyse.

Même s’il existe des outils aidant à évaluer l’origine et la fiabilité de ces contenus, cela reste avant tout un processus humain.

Pour une infographie ou une dataviz par exemple, il va falloir regarder si les sources sont citées et aller regarder ces sources pour vérifier que l’analyse n’est pas faussée.

Sur le sujet de l’analyse d’images, on conseillera le visionnage du webinaire de Serge Courrier à l’EEIE qui est très complet : https://www.eeie.fr/webinar-eeie-01-analyse-dimage-geoint-imint.

Pour les vidéos, on pourra avoir recours à l’outil Invid, aujourd’hui le plus recommandé pour l’analyse de vidéos : https://www.invid-project.eu.

Pour le moment, il y a peu d’information sur la vérification de contenus audio notamment de podcasts.

Transmettre le lien d’une vidéo directement au passage intéressant

Même si cela ne résout en rien la pérennité des vidéos en ligne, il existe des astuces pour transmettre le lien d’une vidéo en ligne et faire en sorte qu’elle débute directement au passage intéressant.

Sur YouTube par exemple, il suffit d’ajouter &t=XmYs à la fin de l’url de la vidéo, X représentant le nombre de minutes et Y le nombre de secondes.

Par exemple, sur cette vidéo appelée « L’E-Chèque Cadeau : la version dématérialisée et tendance du Chèque Cadeau » dont l’url est la suivante https://www.youtube.com/watch?v=kMe5SPBYTZg, on pourra entrer https://www.youtube.com/watch?v=kMe5SPBYTZg&t=1m30s pour que la vidéo débute directement à 1minute 30.

Sur Vimeo, il faut ajouter #t=XmYs à l’url de la vidéo.

Sur Dailymotion, l’astuce consiste à ajouter start=X à l’url de la vidéo, X représentant les secondes. Si on souhaite que la vidéo débute à la 5e minute et 35 secondes, il faudra donc écrire start=335 (5*60 + 35 = 335)

Pour Facebook, il suffit de se positionner sur la vidéo à l’instant qui nous intéresse, effectuer un clic droit et choisir « Copier l’URL de la vidéo à l’instant T ».

Télécharger des vidéos et images

Les contenus multimédias peuvent rapidement disparaître. Et contrairement à des sites comme la Wayback Machine qui archivent des sites et pages Web qui ont aujourd’hui disparu, il n’existe pas d’initiative similaire à très grande échelle pour les vidéos ou les contenus audio (même si Internet Archive en archive un peu).

Sauvegarder les images, vidéos et contenus audios repérés lors de ses veilles et recherches est donc un réflexe à avoir. Mais les sites qui hébergent ces contenus ne permettent pas toujours de pouvoir les télécharger directement.

Pour les images, en règle générale, un simple clic droit suivi de la commande enregistrer suffit, mais pour les vidéos, c’est plus délicat notamment sur les médias sociaux.

Voici donc quelques outils gratuits permettant de télécharger des vidéos depuis certaines plateformes, telles que YouTube, qui n’offrent pas le téléchargement par défaut. Comme ces outils ne fonctionnent pas nécessairement sur tous les formats de vidéos, il est important d’en connaître plusieurs.

On pourra également citer quelques extensions de navigateur comme :

Pour les podcasts, il n’est pas rare de pouvoir les télécharger directement depuis leur plateforme de diffusion ou de pouvoir les retrouver directement sur YouTube. Lorsque ce n’est pas possible ou qu’ils ne sont pas téléchargeables dans un format exploitable (mp3 par exemple), il faut se tourner vers des outils et services de convertisseurs de fichiers.

Transcrire un contenu audio ou vidéo en texte

Autre problématique récurrente liée aux contenus vidéo et audio : le besoin de retranscrire en texte le son d’une vidéo ou d’un podcast. Et cela peut vite devenir extrêmement chronophage...

Là encore, il existe quelques solutions. Imparfaites certes, mais qui permettent de gagner du temps.

On pourra citer un outil gratuit comme oTranscribe (https://otranscribe.com) qui permet de gagner du temps, mais fonctionne toujours sur un modèle manuel. Il s’agit d’une sorte de lecteur audio d’aide à la retranscription. Il suffit d’intégrer le fichier audio et de transcrire manuellement le fichier dans la fenêtre de droite. L’outil permet de faire un retour en arrière, avancer le son, programmer la vitesse de défilement, insérer un marqueur temps, etc. lien :

Dans la même veine, on pourra trouver le logiciel d’aide à la transcription Express Scribe (https://www.nch.com.au/scribe/fr).

Pour les solutions plus automatiques, il existe tout d’abord une astuce en détournant Google Docs.

On peut tout d’abord utiliser la saisie vocale de Google Docs en ouvrant en arrière-plan le fichier audio ou vidéo que l’on souhaite retranscrire. Mais Google Docs n’arrive pas à tout entendre et il n’y a aucune mise en page. La qualité est donc loin d’être parfaite.

Il y a ensuite tous les services de retranscription automatique en speech to text comme :

  • Happyscribe : fonctionne sur 119 langues et transcrit les contenus en quelques minutes. (tarif 12 euros de l’heure) - https://www.happyscribe.co ;
  • Amberscript https://www.amberscript.com (20 euros de l’heure ou 1.90 euro par minute) dans 29 langues ;
  • Authôt https://www.authot.com/fr (54 euros par heure - fonctionne sur le français, mais il n’est pas mentionné quelles autres langues sont prises en compte) ;
  • Temi.com est un service de transcription automatique en speech to text mais ne fonctionne pour l’instant que sur l’anglais. Le tarif est de 0.10$ par minute. Les transcriptions peuvent être obtenues en quelques minutes ;
  • Sonix qui fonctionne sur 36 langues (tarif : 10$ de l’heure) - https://sonix.ai ;
  • Vocalmatic qui fonctionne sur 110 langues (https://vocalmatic.com) pour 15$ de l’heure ;
  • Ubiqus pour 1.50 euro la minute pour le français et l’anglais - https://www.ubiqus.io ;

On trouve enfin des sociétés qui proposent des transcriptions humaines de contenus audio et vidéo si on souhaite une très grande qualité. Les acteurs sont nombreux et on pourra citer par exemple Codexa, AMK France, Rev.com, etc.

Extraire le texte d’une image

Comme nous l’avons vu précédemment, la recherche d’image permet aujourd’hui de repérer des contenus très intéressants comme des infographies, tableaux, graphiques, etc., mais au format image. Récupérer les données contenues dans ces images est souvent un casse-tête et nécessite souvent de les réécrire manuellement.

Depuis quelques années, on voit de plus en plus se développer des solutions d’océrisation qui permettent d’extraire automatiquement le texte et les chiffres d’une image. Un excellent moyen de gagner du temps.

Parmi ces outils, on pourra citer tout d’abord Microsoft qui a introduit au début de l’année 2019 une nouvelle fonctionnalité sur Excel mais uniquement depuis l’app mobile Excel sur Android ou Ios. Il suffit de choisir l’option « Insérer des données à partir d’une image » dans l’application, prendre une photo du tableau que l’on souhaite importer (photo d’un document papier, livre ou même une photo de son écran d’ordinateur) et Excel importe automatiquement le tableau et toutes les données directement dans un tableur Excel.

On trouve ensuite différents petits outils pour extraire du texte d’une image comme

Tous ces outils sont gratuits. La qualité varie selon la langue, la qualité de l’image, etc.

Tirer parti des contenus multimédias dans ses livrables reste un défi

On ne peut conclure sans constater qu’il n’existe pas encore de solution idéale pour tirer parti au mieux des contenus multimédias dans ses livrables de veille et de recherche d’information.

On voit bien qu’il y a pratiquement toujours besoin de transcrire ces contenus en texte dans ses livrables soit en les résumant soit en proposant quelques extraits courts. Pour le moment donc, il faudra multiplier les petits outils qui permettront de gagner du temps au niveau de l’analyse et on surveillera avec attention les évolutions des outils de transcription automatique et d’océrisation dans les prochaines années.

Mais cela soulève aussi des questions juridiques car les contenus multimédias sont aussi protégés par le droit d’auteur.

Les abonnés peuvent poster des commentaires ! N'hésitez pas à vous abonner à Bases et Netsources...