1 Feature engineering assurance : anciennete du
Feature engineering assurance : anciennete du contrat, CRM, zone tarifaire, age du vehicule, puissance, km/an.
Point cle
Maitriser cet outil est essentiel pour industrialiser le projet central.
2 Variables derivees : ratio sinistres/anciennete, densite
Variables derivees : ratio sinistres/anciennete, densite de la zone.
3 Encodage : target encoding pour les
Encodage : target encoding pour les zones (beaucoup de modalites), one-hot pour les categories a peu de modalites.
4 Selection : importance par permutation, VIF
Selection : importance par permutation, VIF pour la multicolinearite, forward selection.
5 Pipeline scikit-learn : ColumnTransformer + Pipeline
Pipeline scikit-learn : ColumnTransformer + Pipeline pour la reproductibilite.
Synthese
5.0.1 Les points essentiels
- Feature engineering assurance : anciennete du contrat, CRM
- Variables derivees : ratio sinistres/anciennete, densite de la
- Encodage : target encoding pour les zones (beaucoup
- Selection : importance par permutation, VIF pour la
- Pipeline scikit-learn : ColumnTransformer + Pipeline pour la
Auto-evaluation
Comment appliquer ce concept dans le projet central ?
Comment appliquer ce concept dans le projet central ?
Comment appliquer ce concept dans le projet central ?
Comment appliquer ce concept dans le projet central ?