Mesurer la bonne conduite automobile grâce à la science des données
Aurélie Labbe dirige un projet de recherche avec Intact Assurance
11 octobre 2017
Certaines compagnies d’assurance automobile offrent aux clients qui le souhaitent des primes réduites, adaptées à la qualité de leur conduite, en échange d’un monitorage de leurs déplacements. À l’aide d’un boîtier déposé à l’intérieur du véhicule ou d’une application mobile qu’ils téléchargent, ces conducteurs enregistrent leurs données de localisation GPS chaque fois qu’ils sont au volant. Après analyse, il devient possible de déterminer leur vitesse, déplacements, virages, freinages... Bref, de connaître presque tout de leurs habitudes de conduite.
Ces types de programmes ont leurs adeptes parmi les gens qui y voient une bonne façon d’économiser, mais ils sont encore peu utilisés au Canada et surtout, la façon d’analyser les données transmises n’est pas optimale. Cependant, le projet d’une équipe de chercheurs en science des données, sous la direction de la professeure agrégée Aurélie Labbe, devrait permettre une nette amélioration de cette approche en faisant progresser la technologie sous-jacente.
Des outils plus précis et plus réalistes
En effet, la professeure au département de sciences de la décision vient d’obtenir une subvention d’engagement partenarial du Conseil de recherches en sciences naturelles et en génie du Canada (CRSNG) pour réaliser la première phase d’un projet de recherche avec la compagnie Intact Assurance.
Intact offre déjà un programme de primes ajustées à la conduite qui repose sur une estimation de ce que signifient les données de déplacements des automobilistes, pour ensuite déterminer si leur conduite pose plus ou moins de risque. Ultimement, le projet de recherche avec Aurélie Labbe va permettre à l’assureur d’obtenir un meilleur modèle d’analyse et de faire une meilleure segmentation de sa clientèle.
À plus court terme cependant, il est nécessaire de préparer ces quantités massives de données GPS — le big data — qui, dans leur état actuel, sont imprécises et demandent à être mieux contextualisées avant d’être interprétées. C’est la phase actuelle du projet de recherche, qui vient de commencer et s’étalera sur six mois.
Le map matching permet de corriger les erreurs contenues dans les données GPS pour déterminer la trajectoire réelle qui a été empruntée par un automobiliste.
Le map matching ou nettoyage des données
Aurélie Labbe et son équipe ont donc entamé une opération connue sous le nom de map matching et qui consiste à « nettoyer » les erreurs que contiennent fréquemment les données géospatiales. « Le signal GPS se trompe souvent d’un, deux ou trois mètres. Il peut parfois donner l’impression qu’un véhicule roule sur le toit d’un immeuble ou dans le fossé à côté d’une route, si l’on se fie aux données brutes », explique la professeure. À cette étape, le travail des chercheurs consistera à établir des modèles probabilistes pour établir les trajectoires qui correspondent à la réalité. Ces modèles seront construits à l’aide d’algorithmes de map matching, qu’il faudra comparer au préalable, afin de choisir le meilleur.
Pour ce faire, la chercheuse et son équipe devront se livrer eux-mêmes à un exercice de collecte de données, en empruntant des trajectoires variées dans les rues de Montréal, munis d’un dispositif enregistrant continuellement la position de leur véhicule. C’est la comparaison des données collectées par le boîtier avec leurs trajectoires réelles qui va permettre d’établir la marge d’erreur et de voir quel algorithme permet le mieux de décrire ce qui s’est passé.
« Il y a toujours du map matching à faire quand on utilise le GPS. Ce que l’utilisateur reçoit, ce sont les données transformées. Notre recherche pourrait permettre d’améliorer la précision globale de certains outils GPS », dit Aurélie Labbe. Et elle ajoute : « On ne trouvera pas un algorithme gagnant. Il se pourrait qu’un certain algorithme performe mieux sur les autoroutes, mais moins bien dans les grandes villes. »
Transformer les données en scores de conduite
Quant à la deuxième phase du projet, elle permettra, une fois les apports financiers gouvernementaux confirmés, de poursuivre la collaboration entre l’entreprise et les chercheurs sur une période de plusieurs mois. Le travail de la chercheuse et son équipe consistera alors à analyser les trajectoires de quelque 350 000 utilisateurs, soit environ 15 téraoctets de données de géolocalisation. L’objectif de cette analyse, dont la méthodologie précise devra être élaborée lors de la phase 2, sera d’établir des scores de bonne conduite réellement performants, qui distinguent mieux les bons conducteurs des conducteurs plus à risque.
L’idée représente une avancée selon la professeure-chercheuse, car elle repose sur une évaluation plus précise du risque réel posé par chaque conducteur. « Cela permet de sortir des mécanismes traditionnels selon lesquels des facteurs tels que l’âge, le sexe ou la marque de la voiture déterminent le coût de la prime d’assurance », remarque-t-elle.
Un échange de connaissances
Ce projet s’inscrit dans un partenariat déjà entamé entre Intact Assurance et l’Institut de valorisation des données (IVADO), qui reçoit de l’assureur une subvention d’un million de dollars sur 5 ans. En retour, Intact bénéficie d’une expertise lui permettant d’optimiser ses opérations, entre autres par rapport à son programme de primes adaptées à la conduite.
« Le but est vraiment l’échange. (…) [Ce genre de partenariat] nous permet aussi de faire des avancées dans des domaines où nous ne sommes pas aussi autonomes qu’on le voudrait. On pense que ça va être très “payant” au niveau des connaissances », explique Jean-François Larochelle, directeur principal du laboratoire de données chez Intact.
Plus rentable pour les assureurs?
L’entreprise souhaite bien entendu améliorer son expertise, ce qui lui permettrait de surpasser ses concurrents au Canada et de se rapprocher voire de rejoindre le degré de développement technologique de certains grands groupes d’assurance américains ayant déjà fait beaucoup de recherche dans ce domaine
Il est bien sûr avantageux pour un assureur d’être en mesure d’évaluer avec précision le risque posé par ses assurés, mais Jean-François Larochelle indique que l’objectif est surtout de mieux servir les clients : « On cherche à davantage personnaliser pour récompenser les bons clients. C’est plutôt cela notre approche. »
À propos d’Aurélie Labbe
Mathématicienne et biostatisticienne, Aurélie Labbe détient une maîtrise en statistique de l’Université de Montréal et un doctorat dans la même discipline de l’Université de Waterloo. Elle s’est consacrée pendant plus de 15 ans au développement d’outils statistiques pour données massives, avec application dans le domaine de la génomique et de la neuroscience. Ses intérêts de recherche s’orientent maintenant vers les systèmes intelligents en transport, particulièrement dans les villes, en lien avec la gestion de la circulation et la sécurité routière. Elle s’est jointe au département des sciences de la décision de HEC Montréal en septembre 2016.
Pour en apprendre plus sur la science des données et mieux comprendre les différents termes et concepts qui s’y rattachent, consultez notre glossaire Big data, intelligence artificielle et science des données.