Linkedin lance WhereHows, un outil de référentiel de métadonnées


Linkedin fait partie des réseaux sociaux professionnels les plus célèbres et les plus sollicités, aussi bien par les demandeurs d’emploi, les étudiants, que les employeurs (entreprises, organisations, etc.). En perpétuelle évolution et désireux de toujours répondre aux attentes de ses utilisateurs, Linkedin a tout récemment ouvert le WhereHows qui n’est autre qu’un outil de référentiel de métadonnées.

Quelles sont les fonctions de WhereHows ?

wherehows.jpg

WhereHows est ce que l’on appelle un outil d’intégration de données qui a été développé en interne, par l’équipe Data du réseau social professionnel. Présenté comme un projet open source sur GitHub, WhereHows a pour principale fonction de rendre possible et de faciliter la création d’un référentiel centralisé de métadonnées et d’un portail des processus relatifs aux bases de donnéesutilisées dans l’entreprise, notamment les informations concernant les utilisateurs. A titre d’exemple : WhereHows permet aux équipes de Linkedin de recueillir et retrouver facilement des informations concernant plus de 25 000 jeux de données (à condition que celles-ci proviennent de HDFS), ou des informations sur les 22 000 autres que l’on retrouve dans l’application Teradata.
L’avantage majeur de cet outil est qu’il permet de collecter les métadonnées depuis une grande multitude de sources. Ces métadonnées serviront ensuite à effectuer divers traitements analytiques.

Du Crowdsourcing pour récupérer les informations

du-crowdsourcing-pour-recuperer-les-informations.jpg

Le WhereHows utilise le Crowdsourcing pour la récupération des informations. Le système de fonctionnement suit le schéma suivant :
L’outildistingue les données au sein du référentiel, puis se met à les organiser et à les associer. Pour ce faire, WhereHows a recours à deux interfaces qui ne sont autres qu’une application web (qui sert à data lineage à la collaboration dans une communauté) et une API (qui intervient dans l’automatisation des traitements).
Une fois ces opérations effectuées, l’outil fait correspondre les données aux processus et aux individus, et ce de façon àpermettre la collecte des informations selon leur sens sur une mode Crowdsourcing.