La science des données est-elle morte ?

L’apprentissage automatique et la science des données sont maintenant partout, l’actualité le montre assez. En exploitant des jeux de données immenses, il devient possible de résoudre n’importe quel problème, comme détecter si quelqu’un s’est fait voler son identité en ligne ou jouer au go.

Le problème, c’est que, pour atteindre ces résultats, il faut de la créativité, pas simplement une capacité d’écrire du code : en d’autres termes, il faut des scientifiques des données. Ils sont cependant une ressource rare, que les entreprises s’arrachent.

La solution est toute trouvée dans un grand nombre de cas : des services en ligne proposant les modèles de sociétés privées, appelables par une API REST ou autre. Ainsi, un même genre de problème est résolu une seule fois, avec des jeux de données de plus grande taille, qui grandissent sans cesse avec l’utilisation de la plateforme. C’est notamment le cas d’IBM Watson, dont les capacités n’ont de cesse d’étonner.

L’efficacité de ces services est souvent extrêmement bonne, largement suffisante pour ne pas justifier l’engagement d’un scientifique des données. Dans certains cas, des solutions plus spécifiques peuvent apporter une meilleure performance, une prédiction juste dans 95 % des cas plutôt que 80 % en utilisant un service tout fait, mais avec un coût autre — et un bénéfice plus que très relatif, selon le cas d’utilisation. Dans d’autres cas, battre un service en ligne (de traduction automatique, notamment) requiert des compétences très poussées, des solutions algorithmiques avancées et une puissance de calcul pas à la portée du premier venu.

Ce constat est suffisant pour que certains affirment d’ores et déjà que la science des données telle qu’on la connaît pour l’instant est morte et enterrée : il n’y a plus besoin d’engager quelqu’un qui a des compétences spécifiques dans ce domaine, pour la plupart des besoins. Le scientifique des données “du futur” aura donc tendance à devenir un chef d’orchestre, qui arrange savamment les différentes API avec des données traitées en conséquence.

Ce ne serait pas le premier domaine à subir une telle évolution. La recherche opérationnelle était autrefois présente dans bon nombre d’entreprises, avec des services dédiés, bon nombre des tâches sont maintenant reprises par des sociétés qui proposent des logiciels clé-en-main — les services de recherche opérationnelle ont depuis souvent fusionné avec ceux de science des données.

Néanmoins, dans tous les cas, des gens avec ces compétences spécifiques restent requis : d’un côté, il faut construire ces services en ligne ; de l’autre, tous les besoins ne sont pas remplis par des logiciels existants, il faudra toujours développer, de temps à autre, une solution sur-mesure.

N’est-ce pas ?

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s