Ikram Lasfari

Ikram Lasfari

Data Scientist / Data Analyst

Profil

Diplômée d'un Mastère en Pilotage de Projets en Intelligence Artificielle, je mets à profit mon expertise en data science, modélisation et visualisation de données, renforcée par une expérience pratique dans l'optimisation de la performance commerciale et opérationnelle. Doté d'un double profil Data Scientist / Data Analyst, je suis actuellement à la recherche d'un CDI et disponible immédiatement.

Compétences

Analyse et Modélisation

PythonPandasNumPyscikit-learnRSAS

Data Visualisation

Power BITableauLooker StudioDAXMatplotlibSeaborn

Bases de données et Cloud

SQLMySQLPostgreSQLBigQuery

Machine Learning et Deep Learning

RégressionClassificationSéries temporellesClusteringText MiningComputer VisionTransformers

Outils et Méthodes

GitVS CodeMarkdownMéthodes AgilesGestion de projetMiroTrello

Formations

Mastère Data et Intelligence Artificielle

Groupe Nexa — Titre RNCP Niveau 7 (Bac+5) : Cheffe de Projet Data et Intelligence Artificielle

2024 – 2025

Licence Informatique Industrielle

Université Le Havre Normandie

2022 – 2023

Certificats

Google Data Analytics – Certificat Professionnel

Coursera / Google

5 mois

Cycle analytique complet : préparation et nettoyage des données, analyse exploratoire, visualisation, storytelling, R et étude de cas finale.

Certificat – Power BI Avancé

Groupe Numérique SNCF

2 jours

Création de requêtes et intégration de données hétérogènes, conception de colonnes et mesures en DAX, construction de rapports interactifs et partage de tableaux de bord.

Badge de formation – Programmation SAS I : Les fondamentaux

SAS Training Platform (SAS Institute)

2025

Bases du langage SAS, importation et manipulation de données, préparation des datasets pour l'analyse statistique.

EXPÉRIENCES PROFESSIONNELLES

SNCF Logo

Alternante Performance Data

Direction Commerciale et Marketing

SNCF Voyageurs TER Hauts-de-France

12 mois
  • Conception et développement d'un outil stratégique d'aide à la décision combinant Machine Learning et visualisation Power BI, permettant d'améliorer de 3 à 5 % le taux d'occupation sur certaines lignes grâce à une meilleure répartition des billets promotionnels.
  • Production de retours d'expérience (REX) et analyse des ventes (chiffre d'affaires, trafic, segmentation) afin d'évaluer la performance des offres et d'alimenter les décisions marketing et pricing.
  • Participation à la conception et à l'automatisation de dashboards Power BI (DAX, mises à jour automatiques) pour faciliter le pilotage des KPI clés des Directions de Ligne.
  • Rédaction en Markdown, via l'outil Curseur, de la documentation du projet d'aide à la décision (méthodologie, besoins fonctionnels, cas d'usage) pour accompagner son cadrage et son déploiement.

Référentes

Florence Delahaye

Responsable Performances commerciales - Data

florence.delahaye@sncf.fr

Cyrielle Toussaint

Cheffe de Pôle Commercialisation

cyrielle.toussaint@sncf.fr
TTI Logo

Alternante Data et Supply Chain

Tissus Techniques Indémaillables, Roubaix

10 mois
  • Analyse des données d'approvisionnement sous Excel, incluant le nettoyage, la structuration et la création de Tableaux Croisés Dynamiques (TCD) pour suivre les niveaux de stock, réduire les ruptures récurrentes et améliorer l'anticipation des réassorts.
  • Automatisation du processus de facturation client, grâce à la centralisation des données et à l'utilisation de formules avancées (SI, RECHERCHEV/XLOOKUP, SOMME), permettant de réduire d'environ 30 % le temps de traitement et de fiabiliser les montants facturés.
  • Analyse comparative des transporteurs, basée sur des KPI logistiques (coûts, délais, réclamations, performance), afin d'identifier les prestataires les moins performants et d'appuyer les décisions de renégociation ou de changement de contrat.

Projets

1

Prévision du taux d'occupation des TER

Développement d'un modèle de séries temporelles (Prophet) pour prédire le taux d'occupation des TER, incluant exploration des données, préparation des features et évaluation via RMSE.

Résultat :

Le modèle atteint 70 % de précision, permettant d'anticiper les pics de fréquentation et d'améliorer le pilotage de l'offre TER.

PythonProphetTime Series
2

Analyse des facteurs influençant les ventes TER

Construction d'un modèle Random Forest pour identifier les variables clés impactant les ventes de billets TER (heure de départ, période, jour de semaine, jours fériés).

Résultat :

Production d'un score d'attractivité fondé sur l'importance de ces variables, permettant d'identifier les trains à fort potentiel et de renforcer les décisions commerciales et pricing.

scikit-learnRandom ForestFeature ImportanceMachine Learning

Langues

ArabeLangue maternelle
FrançaisCourant
AnglaisProfessionnel
EspagnolNotions

Qualités

Esprit d'initiative
Autonomie et sens d'organisation
Adaptabilité
Travail d'équipe