L’algorithme Predict the Parliament a donné ses favoris pour les législatives françaises. Ce modèle prévoit qu’au soir du second tour, l’alliance entre la République en marche et le Modem obtiendra une confortable majorité.

L’ex-Premier ministre Manuel Valls s’impose de peu face à la candidate de la France Insoumise Farida Amrani, Marine Le Pen échoue à rentrer au Parlement et le secrétaire du Parti socialiste Jean-Christophe Cambadélis est battu par le candidat la République en marche (LREM) et secrétaire d’État au Numérique Mounir Mahjoubi. Telles sont quelques-unes des prévisions pour les législatives de l’algorithme Predict the Parliament, développé par des étudiants de l’école d’ingénieurs Télécom ParisTech.

Ces derniers avaient déjà tenté de prévoir l’issue de l’élection présidentielle française grâce au big data... avec une pincée de réseaux sociaux. Leur modèle - Predict the President - avait échoué à anticiper le duel Emmanuel Macron-Marine Le Pen au second tour. Ils sont de retour, assurent avoir retravaillé leur algorithme et sont prêts à en découdre avec les élections législatives.

La carte du premier tour La carte de la France à l'issue du premier tour des législatives 2017 d'après l'algorithme Predict the parliament. © Predict the parliament

Mélenchon mieux que Le Pen

Les résultats de Predict the Parliament pour le premier et second tour, mis en ligne jeudi 8 juin, ont de quoi rassurer le président Emmanuel Macron. Il obtiendrait 278 sièges à l’Assemblée nationale et la majorité absolue en s’alliant avec le Modem du ministre de la Justice François Bayrou (289 sièges). Le parti de droite Les Républicains deviendrait la principale force d’opposition (105 députés) et les socialistes enregistreraient un nouveau coup dur avec seulement 65 députés. Jean-Luc Mélenchon pourrait se vanter de faire mieux que sa grande rivale Marine Le Pen, puisque son mouvement, la France insoumise, serait en mesure de constituer un groupe parlementaire, tandis que le Front national n’aurait que cinq sièges, loin des 15 élus requis pour former un groupe.

La répartition des sièges d'après Predict the parliament La répartition des sièges à l'Assemblée nationale d'après les prédictions de l'algorithme Predict the president. © Predict the parliament

Les créateurs de Predict the Parliament sont plutôt confiants quant à la précision de leur algorithme. "Nous l’avons appliqué aux législatives de 2012, et dans 80 % des cas, il a su dire si le candidat atteignait le deuxième tour ou pas", note Davy Bensoussan, l’un des cinq étudiants de Télécom ParisTech, contacté par France 24. Leur modèle serait plus fiable que celui appliqué à l’élection présidentielle essentiellement parce qu’il ne prend plus en compte "le sentiment sur les réseaux sociaux" (comme le nombre de tweets positifs).

"L’analyse des réseaux sociaux est prometteuse, mais en l’état actuel, c’est encore au stade de prototype", reconnaît Raphaël Vignes, un autre des cinq étudiants de Télécom ParisTech. Lors de l’élection présidentielle, la prise en compte de Twitter - où les soutiens de François Fillon étaient très actifs - avait abouti à surestimer les intentions de vote pour le candidat de droite. De plus, analyser ces données serait bien plus fastidieux que dans le cas de la présidentielle, puisqu’il y a plus de 6 800 candidats à suivre. "La localisation exacte des personnes qui tweetent est souvent inconnue, ce qui pose un problème de plus pour des élections qui ne sont pas à échelle nationale", remarque Raphaël Vignes.

Predict the Parliament retient une approche beaucoup plus historique. L’algorithme puise dans les données publiques de l’Insee et du ministère de l’Intérieur pour analyser les résultats des élections législatives, circonscription par circonscription, et de la présidentielle depuis 1997 pour en tirer des conclusions. D’autres variables comme le taux de chômage, les inégalités de revenus, la répartition de la population par catégorie socioprofessionnelle, sont ajoutées au modèle pour l'affiner.

Solère, le seul à être élu dès le premier tour ?

Ce recours au passé peut sembler inapproprié dans le paysage politique actuel en pleine recomposition. Il n’y a, en effet, aucun historique électoral pour un parti tout neuf comme LREM et l’électorat semble plus enclin que jamais à se détourner des élus issus des partis traditionnels. "Représenter un nouveau parti comme celui du président a, en effet, été l’une des difficultés de la modélisation", reconnaît Davy Bensoussan. Mais il assure qu’il y a des tendances de fond qui se retrouvent, quelles que soient les circonstances politiques : l’algorithme a découvert qu’il y avait une forte prime au sortant, surtout s’il a déjà été élu plusieurs fois à son poste, et que les candidats issus de la majorité présidentielle s’en sortent mieux. Ainsi tous les ministres du gouvernement d’Edouard Philippe seraient élus.

La situation se corse lorsque ces deux variables (prime au sortant, prime au candidat LREM) entrent en collision comme dans la circonscription de Jean-Christophe Cambadélis. Le socialiste est un vieux routier des législatives qui se fait réélire depuis 1997, tandis que Mounir Mahjoubi est l’un de ces représentants de la société civile qui font figure d’étoile montante de la galaxie macronienne. "Dans ces cas-là, les autres critères entrent en jeux pour faire pencher la balance dans un sens ou l’autre", schématise Davy Bensoussan.

Predict the Parliament a particulièrement surpris ses concepteurs dans un cas précis : celui de Thierry Solère, dans la 9e circonscription des Hauts-de-Seine. Ce député démissionnaire de LR est le seul, sur les 577 circonscriptions, à obtenir la majorité absolue au premier tour, alors "qu’en général, il y a une trentaine de candidats qui sont élus au premier tour", rappelle Davy Bensoussan. Pour les créateurs du modèle, cette situation inédite illustre la grande recomposition politique en cours où il n’y a plus de grands favoris.

Première publication : 09/06/2017