Des données, encore des données, toujours plus de données…

lundi 12 novembre 2018 par Franck Missongo

90% des données dans le monde ont été créées au cours des deux dernières années. La production actuelle, d'environ 2,5 milliards d’octets par jour, devrait même doubler dans les trois prochaines années, selon les dernières études.

Cette explosion des volumes tirée par la multiplication des sources (PC, laptops, tablettes, smartphones, Cloud etc…) et qui se caractérise également par une forte augmentation des types de formats (emails, audio, vidéos, messages instantanés, données structurées…) touche plus particulièrement le monde de l’entreprise. En effet ce nouveau degré de complexité qui dépasse l'intuition et les capacités humaines d'analyse surpasse également les fonctionnalités des outils informatiques classiques de gestion de base de données.

De ce fait les juristes qui conseillent les sociétés confrontées à l’obligation de procéder à l’examen de leurs données numériques pour des raisons légales ou réglementaires, sont amenés à se familiariser avec les outils d’investigations digitales les plus adaptés à cet exercice.

Cette connaissance des outils d’investigations numériques dit « forensiques » est en effet déterminante pour répondre efficacement à un double challenge : Collecter et Identifier les données pertinentes parmi des milliers voir des millions de données multiformes et d’origines multiples, dans un délai contraint.

Un degré de connaissance disparate

La connaissance des outils est très inégalement répartie parmi les acteurs juridiques. On distingue deux groupes : celui des cabinets internationaux, rompus à l’utilisation des différents logiciels de revue de documents voir pour certains, aux subtilités du codage prédictif et celui des autres juristes, souvent plus locaux, qui demeurent peu familiers de ces technologies et de ce fait, continuent de procéder de manière largement artisanale.

Cette disparité s’explique en grande partie par la persistance de 2 idées reçues :

  1. Ces technologies ne seraient adaptées qu’aux très gros dossiers, c'est-à-dire ceux dont les quantités de données sont les plus volumineux
  2. Le coût financier associé à leur utilisation serait très élevé.

En réalité, il n’existe pas de volumes minimum pour l’utilisation d’un logiciel de revue de documents et le coût financier est en constante baisse en raison des effets combinés de l’évolution des technologies et de l’augmentation de l’offre. Cette plus grande sélection des solutions proposées ajoute cependant un degré de complexité additionnel : Comment choisir ?

Les critères de sélection

À l’heure du choix, il est important de garder à l’esprit l’objectif premier : il s’agit avant tout de choisir la solution qui va permettre, dans les meilleures conditions de coût et de durée, d’accélérer la découverte des documents pertinents tout en garantissant le caractère probant de la méthode. D’un point de vue purement technologique, il faut s’interroger sur les 4 éléments clés suivants :

  • La traçabilité des données et des sources
  • Les options de réduction des volumes et de filtrage des documents
  • La gamme des outils analytiques d’aide à la revue (ex : Catégorisation, Workflow, Intelligence artificielle…)
  • La simplicité d’utilisation de l’outil et le niveau de support technique

Cette liste n’est naturellement pas exhaustive et d’autres critères tels que l’expérience du prestataire, voir son lieu de présence, sont susceptibles d’être déterminants, mais généralement, ils seront dictés par les spécificités du dossier.  Dans tous les cas, l’évolution des pratiques est inévitable. Il incombe par conséquent à tous les acteurs de renforcer leur connaissance sur ces sujets afin de pouvoir appréhender au mieux cette tendance forte, pas prête de s’arrêter.