Data scientist H/F Data scientist H/F …

Caisse des Dépôts et Consignations
in Paris, Ile-de-France
Permanent, Full time
Last application, 17 May 21
Negotiable
Caisse des Dépôts et Consignations
in Paris, Ile-de-France
Permanent, Full time
Last application, 17 May 21
Negotiable
Caisse des Dépôts et Consignations
.

La Caisse des Dépôts et ses filiales forment un groupe public au service de l'intérêt général et du développement économique des territoires. Elle agit en appui des politiques publiques conduites par l'Etat et les collectivités locales, prioritairement pour répondre aux grands défis de société : transition territoriale, transition énergétique et écologique, transition démographique et transition numérique. Elle assure également la gestion de grands mandats publics (fonds privés, retraite, financement du logement social…) et intervient comme banquier du service public de la justice et de la sécurité sociale.
Elle est, au travers de la Direction des prêts de sa Banque des territoires, le financeur principal du secteur du logement social avec près de 80% de sa dette représentant 160Mds€ d'encours.
Equipe
Au sein de la direction des prêts, le service Pilotage et Statistiques a pour missions de valoriser les données nécessaires au pilotage de l'activité de prêt, pour comprendre les dynamiques d'activité et y participer par des approches innovantes (apporter de la performance, mieux comprendre la concurrence, mieux cibler les prospects etc). Il est à ce titre Product Owner de Diapason, qui est le SI permettant d'avoir une vision 360 de l'activité globale de prêt (le caractère industriel de l'activité de prêt conduit par nature à disposer de très importants volumes de données d'intérêt).
Il est par ailleurs chargé de réaliser et mettre en œuvre :
* Un ensemble de reportings réguliers alimentant le pilotage stratégique de l'activité ;
* Les prévisions d'activité de prêt (signatures - versements), alimentant notamment la fixation des objectifs des DR, les PMT (BDT - Fonds d'Epargne (FE) et Etablissement Public CDC) ou encore les travaux relatifs à l'équilibre ALM des Fonds d'Epargne ;
* Le développement d'approches quantitatives innovantes (économétrie - machine learning - deep learning) afin d'éclairer ou faciliter l'activité opérationnelle de prêt. C'est notamment sur ce dernier champ que s'inscrit cette offre de poste, sans être exclusive.

Le mot du manager : pouvoir déployer les méthodes quantitatives innovantes, sur des données présentant des volumes importants compte-tenu du caractère industriel de l'activité prêteur, approches appliquées à des problématiques concrètes et opérationnelles en lien avec le caractère stratégique de cette activité et sa prise directe avec l'intérêt général, c'est ce que permet vraiment le poste proposé !

Au sein de la Direction des prêts de la Banque des Territoires, le Data Scientist sera à titre principal amené à réaliser divers études / analyses et à mettre en œuvre divers outils de machine learning. Il pourra être amené, ponctuellement et lorsque cela est nécessaire, à participer à l'activité de production de données du service.

Les missions à réaliser seront variées :

Mise en œuvre d'algorithmes de textmining sur les différents documents à disposition de la direction des prêts (pièce justificative des clients…) :
* Extraction automatique d'informations
* Classification de documents
* Correction d'erreurs
Pour cela, la connaissance de différentes approches statistiques dont l'utilisation de réseaux de neurones est nécessaire.

Analyse de données / modèles prédictifs :
* Réalisation de statistiques descriptive, de classification et d'analyse : ces travaux pourront notamment participer à comprendre les dynamiques à l'œuvre en matière d'activité, ou encore de classer les clients en fonction d'un ensemble de différents déterminants pour les cibler au mieux ;
* Construction de modèles prédictifs : un ensemble de prévisions seront mises en œuvre, et des travaux visant une industrialisation des prévisions d'activité et leur amélioration ;
* Travaux de collecte / croisement de base de données
* La mise en œuvre de ces outils permettra, par exemple, d'éclairer les choix / analyse de la direction et de proposer des outils d'aide à la décision de type logit et forêt aléatoire (random forest, XGBoost etc).

Prise en main d'autres projets en développement :
* Mise en œuvre d'outils de webscrapping : le data scientist aura, notamment, pour mission de développer le champ des informations récupérées de manière automatique sur le net, d'une part pour améliorer la connaissance de la concurrence pour adapter l'offre, et d'autre part pour améliorer les services pouvant être proposés aux clients ;
* Statistique spatiale / cartographie / exploitation de base de données géographiques

Vous avez :
- De formation scientifique supérieure (BAC+5)
- Solide expérience en modélisation / mathématiques appliquées et machine learning
- Bonne maîtrise aussi bien les statistiques classiques que les dernières évolutions dans le domaine de l'IA et du deep learning. Vous savez mettre en œuvre des outils d'IA dans le domaine du traitement du texte, de l'image et de données plus classiques.
- Excellente connaissance de la programmation en particulier python et les librairies tensorflow, scikitlearn, pandas, numpy
- Capacité à construire des solutions opérationnelles ET industrialisables pertinentes

Qualités personnelles attendues :
Vous disposez des capacités personnelles suivantes :
- Qualités d'analyse, de synthèse et de rédaction
- Bonnes qualités relationnelles
- Curieux, rigoureux, autonomes, en capacité de faire des propositions innovantes.

Caisse des Dépôts et Consignations logo
More Jobs Like This
See more jobs
Close
Loading...
Loading...