Microsoft annonce la préversion d’Azure Data Catalog

Joseph Sirosh, le vice-président de Microsoft en charge de l’apprentissage statistique et de la gestion de l’information, vient d’annoncer la disponibilité dès aujourd’hui d’une préversion de Microsoft Azure Data Catalog.

Il s’agit d’un service de gestion des métadonnées des sources d’information d’entreprise.

Les promesses des données massives et de l’apprentissage statistique ne seront en effet tenues que si les sources de données de l’entreprise sont connues et exploitées : il ne s’agit pas d’enregistrer des milliards d’informations pour les oublier aussi tôt.

 

Les utilisateurs déclarent leurs sources de données, et le service collecte les métadonnées de ces sources, comme le nom des attributs et leur type.

Seules les métadonnées sont sauvegardées dans le nuage informatique, et non pas les sources de données, qui peuvent également résider dans le nuage, ou au contraire dans les serveurs internes de l’entreprise.

 

Ce catalogue est alors utilisé par d’autres acteurs, comme des analystes, des data scientists et d’autres employés, pour rechercher et filtrer des sources de données. Ils peuvent annoter et étiqueter les métadonnées des sources choisies, ce qui enrichit le système et facilite la compréhension des schémas, l’intérêt d’une source de données et la façon dont elle est utilisée par l’entreprise.

La philosophie du service Azure Data Catalog est donc l’externalisation ouverte, qui permet de combler le fossé entre la direction des systèmes d’information, qui garde le contrôle des sources de données, et les spécialistes métiers, qui peuvent partager leur savoir-faire.

 

Une fois une source de données choisie, elle peut être ouverte avec tout logiciel adéquat : Microsoft Excel, client de base de données.

Comme ce genre d’ouverture n’est pas approprié pour toutes les organisations, ou pour toutes les sources de données, des outils de gestion de contrôle d’accès sont aussi disponibles.