Artistes de données • Enregistrer
Les scientifiques des données sont importants, mais ce dont le monde a besoin en ce moment, ce sont des artistes des données, selon les analystes du Gartner Data and Analytics Summit à Sydney, en Australie.
Les analystes Sally Parker et Peter Krinsky ont expliqué que les artistes des données sont des personnes qui posent des questions plus larges – et peut-être tangentielles – sur les données et ce qu’elles pourraient révéler une fois que les scientifiques des données recherchent.
Pour illustrer le concept, ils ont partagé une étude de cas d’un opérateur de transport public en Belgique qui a utilisé la science des données pour essayer de comprendre pourquoi certains de ses véhicules sont tombés en panne. En raison de l’évolutivité du projet, l’équipe d’analyse a développé un plan de projet de 20 jours avec la moitié du temps consacré à la préparation des données et le reste consacré au développement d’un modèle.
Cet effort n’a pas produit d’informations utiles, mais il a mis l’équipe des données en contact avec l’équipe des opérations. Dès que ces derniers ont vu les données sur les bus en panne, ils ont rapidement montré qu’ils étaient utilisés sur des routes de montagne, et donc soumis à plus de pression.
Les bus à roulettes sur différents itinéraires répartissent la charge et économisent des dizaines de millions.
Les analystes n’ont fourni aucun aperçu de la façon dont les artistes de données se sont développés. Au lieu de cela, ils ont suggéré que la collaboration interdisciplinaire et le fait de veiller à ne pas supposer que les données contiennent des informations prometteuses sont des étapes utiles.
Le couple a partagé l’histoire de l’astronome du XVIe siècle Tycho Brahe, qui a fait des observations approfondies pour prouver sa conviction que le soleil tournait autour de la Terre. Le collaborateur de Brahe, Johannes Kepler, a utilisé les mêmes données pour prouver que la Terre tourne autour d’un sol.
« Parfois, tout ce dont nous avons besoin pour réussir, c’est d’un changement de perspective », a déclaré Krinsky.
La paire a également recommandé aux organisations de collecter moins de données, car la collecte de données agrégées crée des risques de sécurité. Le couple a cité l’exemple d’une chaîne hôtelière qui analyse les clients en utilisant seulement deux points de données : s’ils utilisent la salle de sport et s’ils choisissent des aliments sains. Ces deux pépites suffisent à personnaliser les offres et ont bien moins de valeur pour les criminels que d’autres informations.
Les deux analystes ont également préconisé l’utilisation de données synthétiques, car elles sont moins chères à collecter et entraînent moins de problèmes de confidentialité.
Les données synthétiques peuvent également permettre de simuler des événements difficiles à observer. Les analystes ont déclaré que la société d’équipements de technologie de voiture autonome Alphabet Waymo l’utilisait pour simuler le passage aux ambulances qui se frayent un chemin à grande vitesse et pour effectuer plus de tests sur les voitures autonomes que ce qui est possible sur les routes réelles.
Le mot-clé a également recommandé aux équipes informatiques de devenir des «gardiens des données» qui investissent dans les métadonnées afin que les équipes puissent identifier et utiliser rapidement les données dont elles ont besoin, plutôt que des «plombiers des données» qui se concentrent sur l’infrastructure. ®