L’Anelis, association des anciens étudiants de l’ISIMA, a rencontré Violaine Antoine, responsable de la filière F4, Modélisation mathématique et science des données.
Une interview qui permet de découvrir la filière :
Q : Bonjour Violaine, pouvez-vous nous dire quel est votre rôle au sein de la Filière 4 “Modélisation mathématique et science des données” ?
Bonjour, je suis responsable de la filière F4. Je m’occupe, en concertation avec les principaux enseignants de la F4, de la cohérence du programme avec les attentes des entreprises.
Q : Quel est l’objectif de cette formation, et quelles en sont les particularités ?
La filière F4 comprend toutes les notions de mathématiques dont un informaticien a besoin pour proposer des modèles mathématiques, évaluer des systèmes complexes et développer des applications numériques.
Le terme « modélisation mathématique » de la filière F4 regroupe un ensemble de concepts mathématique permettant de modéliser des systèmes réels complexes par des modèles numériques. Dans ce cadre, nous retrouvons plus spécifiquement la notion de recherche opérationnelle et de calcul scientifique. Une introduction à la mécanique du solide et à la CAO est également réalisée.
Le terme « science des données » de la F4 correspond quant à lui à l’enseignement des notions d’apprentissage automatique et de fouille de données d’un point de vue statistique, mathématique et informatique. La mise en place de telles méthodes nécessite des connaissances en modélisation mathématique. Les enseignements dispensés en F4 dans la thématique de la sciences des données se basent donc très souvent sur les enseignements relatifs à la modélisation mathématique.
Q : Ce terme science de données a été ajouté au nom de la filière dès 2017, mais quels sont concrètement les sont les changements apportés au programme ?
La data science est une technique qui emploie de nombreux fondamentaux mathématiques. Pour ces raisons, nous avons conservé un bon nombre de matières qui représentent autant un socle pour la data science que pour la modélisation mathématique.
Certaines matières ont néanmoins maintenant une coloration science des données par l’ajout d’exemples concrets dans ce domaine. Nous avons également, au fil de ces dernières années, augmenté le nombre de cours liés à la science de données : des statistiques avancées, des cours de machine learning et de deep learning sont maintenant dispensés.
Q : Comment les étudiants ont-ils accueilli ces changements ? Les cours des années précédentes ont-ils dû être adaptés ?
Les étudiants sont très demandeurs de cours en science de données. Ils sont de manière générale ravis d’acquérir des connaissances dans le domaine.
Les cours d’apprentissage (surtout profond) sont mis à jour chaque année, le domaine évoluant rapidement. Quelques autres cours sont ou vont être adaptés pour pouvoir donner des prérequis à certains chapitres des cours de data science.
Ainsi, un point sur les Processus Décisionnels de Markov vont être mis en place pour le chapitre d’apprentissage par renforcement. Certaines méthodes d’optimisation, notamment avec des moments, vont être mises en place en optimisation car elles sont couramment utilisées en apprentissage profond.
Q : Pour être plus concret, avez-vous des exemples de projets donnés aux étudiants ?
Au cours des deux dernières années, 32 % des sujets de projet concernaient la thématique de la science des données, 23 % la modélisation mathématique, 23 % correspondent plus spécifiquement à la recherche opérationnelle, 9 % au traitement d’images et les 13 % finaux rassemblent tout autre sujet allant de la cryptographie à l’implémentation de logiciels en R ou C++.
Les sujets en relation avec le deep learning sont récurrents. Par exemple, nous avons eu cette année une étude sur « l’application du deep learning pour l’analyse forensique (NDLR : analyse d’un système informatique après incident) de paquets réseau ». Les projets en collaboration avec les entreprises sont également omniprésents. Dans ce cadre nous avons eu par exemple un sujet sur l’étude des prix de ventes et un sur l’hybridation de modèle fonctionnel et corrélatif.
Q : Vous évoquez les entreprises. Avec l’évolution de la formation, de nouvelles opportunités s’ouvrent aux ZZs. Quels sont les nouveaux secteurs professionnels dans lesquels nous pourront retrouver des ZZ issus de la filière 4 ?
Grâce aux changements effectués par la filière, les ZZs peuvent intégrer les services d’analyse des données et intelligence artificielle des grands secteurs industriels, des transporteurs et des entreprises de services du numérique.
Ils ont également maintenant la possibilité de rejoindre des entreprises spécialisées à la science et l’intelligence des données, ou des centres de recherche et développement.
Les métiers liés à la F4 sont généralement : développeur scientifique, ingénieur en recherche et développement et ingénieur en science des données.
Q : De nouvelles entreprises ont-elles manifesté un intérêt pour la filière ? Quelles sont les tendances du monde professionnel que vous voyez se dessiner ?
De nombreuses entreprises se mettent à analyser leurs données stockées afin de mieux les comprendre et d’en ressortir des informations. Ces quatre dernières années, nous avons vu s’accroître le nombre de stages dans la thématique de la science des données, dont une bonne partie sur le sujet de l’apprentissage profond. Cette tendance est encore en expansion.
Depuis moins longtemps, nous remarquons également un intérêt croissant sur le sujet des séries temporelles. Les nouvelles entreprises intéressées par la filière F4 sont celles qui recherchent des étudiants avec de solides bases mathématiques pour réaliser des analyses de données.
Q : Et en interne à l’école, quels impacts ont eu ces changements ?
L’analyse de données est un sujet qui intéresse également d’autres filières et qui est également introduit dans ces filières. Ainsi, un des changements majeurs est la mutualisation du cours d’apprentissage profond entre la filière F2 (Génie Logiciel et Systèmes Informatiques) et F4.
Q : Comment voyez-vous l’avenir de la filière et quels seront les principaux changements à venir dans les prochaines années ?
La filière F4 va garder une thématique science de donnée importante. Il est envisagé d’élargir les techniques étudiées en cours à des structures de données spécifiques telles que les séries temporelles.
Q : Le mot de la fin ?
La science des données est un sujet d’intérêt récent pour de nombreuses entreprises. La filière F4 s’est rapidement adaptée à ce nouveau contexte tout en conservant les objectifs de la formation : former des étudiants à la modélisation mathématique de systèmes complexes.