« Aujourd’hui, énormément d’entreprises veulent faire du Data Analytics, du big data, de l’IA ou du deep learning ». « Pourtant, sans le carburant nécessaire à l’alimentation de ce type de projet, rien ne peut se faire. Or l’essence, ce sont les données ».
Alors que les données structurées sont stockées dans un datawarehouse, une base de données où elles sont facilement requêtables et rapidement interprétables, la démarche est tout autre pour les données non structurées. Ces dernières, provenant d’un grand nombre de sources, doivent être stockées, elles, dans un entrepôt de données : le Data Lake.
Vos données valent de l’or : maîtrisez-les !
La Data Analytics permet de comprendre un métier, mais aussi ce qui n’est pas optimal au sein d’une entreprise, dans ses process par exemple. Grâce à l’utilisation d’un datalake, on peut exploiter un processus métier, et éventuellement l’optimiser. Maîtriser ses propres données revêt dès lors un aspect capital. « Si quelqu’un dispose de vos données de manière enrichie, les comprend plus vite, est plus agile que vous, il peut très vite repérer ce qui ne fonctionne pas dans votre processus, vous dire quoi faire, voire le faire à votre place. Là est le danger ». « Confier son datalake à un tiers sans se poser de question, par exemple pour des problématiques de communication entre une DSI métier et une DSI informatique, c’est prendre le risque de se faire ubériser. »
Il est donc capital de ne pas stocker les données n’importe où et de protéger son capital intellectuel et de métier. « Un opérateur de cloud public, même s’il anonymise les données, peut les monétiser », explique le CTO. « Les entreprises ne sont pas à l’abri de se faire doubler ». D’où l’importance, capitale, de penser à conserver sa souveraineté.