CV DÉTAILLÉ

Kabil Ben Amor

Data Engineer  ·  5 ans d'expérience

Kafka Airflow PySpark AWS PostgreSQL
← Retour au Profil

Parcours Professionnel

5 ans d'expérience en data engineering, software et formation — du pipeline ETL au machine learning

Medactis
Avr. 2024 – Présent
En cours
📍 Tunis, Tunisie
En cours
Software & Data Engineer

Développement et maintenance de pipelines de données médicales et d'APIs d'administration pour Medactis, plateforme SaaS de gestion de laboratoires d'analyses. Conception de l'architecture data Bronze/Silver/Gold, ingestion d'événements Kafka et normalisation automatisée des données.

Réalisations clés
  • Pipelines ETL Airflow ingérant des événements Kafka avec orchestration de DAGs complexes
  • Modélisation PostgreSQL Bronze/Silver/Gold avec reconstructions idempotentes par partition
  • APIs NestJS pour dashboards d'administration — gestion des résultats et des patients
  • Migration des données lab legacy : normalisation, enrichissement et qualité automatisés
  • Pipelines d'ingestion automatisés avec contrôles qualité, normalisation et enrichissement
  • Tests de performance JMeter et optimisations caching pour les endpoints critiques
Technologies utilisées
Apache Kafka Apache Airflow Python Pandas PostgreSQL NestJS TypeScript JMeter Docker Redis
🏥 Pipeline médical en production · Architecture Bronze/Silver/Gold
Caplogy
Nov. 2022 – Jan. 2024
1 an 2 mois
📍 France (Remote)
Data Engineering Instructor

Formateur en Data Engineering pour Caplogy, organisme de formation spécialisé en technologies Big Data. Conception et animation de workshops pratiques sur PySpark, Kafka, Airflow et les architectures Data Lake AWS. Accompagnement de 48 étudiants vers la certification Scrum Master SMC®.

Réalisations clés
  • Conception et animation de workshops Spark batch et streaming, Kafka, Airflow
  • Architecture Data Lake AWS : S3 (stockage), Glue (catalogage), Athena (requêtage)
  • 48 étudiants accompagnés — 87% de taux de réussite à la certification Scrum Master SMC®
  • Web scraping automatisé avec Selenium et BeautifulSoup pour cas pratiques
  • Création de supports pédagogiques et projets fil rouge sur données réelles
Technologies utilisées
PySpark Apache Airflow Apache Kafka Python SQL AWS S3 AWS Glue AWS Athena Selenium BeautifulSoup
🎓 48 étudiants formés · 87% de réussite SMC®
Emaar
Fév. 2021 – Juin 2022
1 an 4 mois
📍 Qatar (Remote)
Software Engineer Freelancer

Développement en freelance d'une plateforme immobilière pour Emaar, l'un des plus grands promoteurs immobiliers du Moyen-Orient. Conception et développement full-stack de la plateforme de gestion d'agences immobilières, de l'architecture à la livraison.

Réalisations clés
  • Plateforme de gestion d'agences immobilières de bout en bout
  • APIs RESTful avec Spring Boot et frontend Angular — architecture MVC
  • Containerisation Docker et déploiement AWS (ECS Fargate, EC2, RDS, EFS)
  • Pipeline CI/CD avec Jenkins pour l'intégration et le déploiement continus
  • Modélisation base de données MySQL et optimisation des requêtes critiques
Technologies utilisées
Spring Boot Angular MySQL Docker Jenkins AWS ECS AWS EC2 AWS RDS AWS EFS Java
🏗️ Plateforme immobilière Qatar · Full-stack end-to-end
Téluq University
/ LICEF Institute
Fév. 2020 – Oct. 2020
8 mois
📍 Montréal, Canada
Research Assistant Data Science

Assistant de recherche au LICEF (Laboratoire en Informatique Cognitive et Environnements de Formation) de l'Université TÉLUQ à Montréal. Recherche sur l'évaluation automatique de la douleur chronique par deep learning multimodal — données physiologiques et comportementales.

Réalisations clés
  • Collecte et prétraitement de données sur 25 patients (75% de données exploitables)
  • Modèle multimodal de deep learning pour l'évaluation de la douleur chronique
  • +32% d'amélioration de la précision par rapport aux approches monomodales (baseline)
  • Comparaison de modèles CNN, SVM et KNN sur données physiologiques et vidéo
  • Traitement du signal (EMG, EEG) et extraction de features multimodales
Technologies utilisées
Python TensorFlow / Keras Deep Learning CNN SVM KNN Signal Processing NumPy Pandas scikit-learn
🧠 +32% de précision · Publication de recherche multimodale

Projets Réalisés

Projet de data engineering financier en temps réel

Real-Time Financial Transaction Processing

Pipeline de traitement de transactions financières en temps réel : Kafka + Spark Structured Streaming à 10 000+ événements/seconde, traitement stateful avec watermarks et déduplication, scoring fraude + alerting, sinks PostgreSQL et Delta Lake.

Kafka + Spark PostgreSQL + Delta Fraud Detection

Formation & Certifications

Parcours académique et certifications professionnelles

🎓 Formations
2017 – 2020
Diplôme d'Ingénieur en Génie Logiciel & Data Engineering
ENIT — École Nationale d'Ingénieurs de Tunis
2015 – 2017
Cycle Préparatoire — Mathématiques & Physique
Institut Préparatoire aux Études d'Ingénieurs de Monastir
🏆 Certifications

Databricks Fundamentals

Databricks Academy

Big Data Modeling and Management

University of California

Introduction to Kubernetes

Linux Foundation

Scrum SFC

Scrum Study

🌐 Langues
Anglais
Full Professional
Français
Full Professional
Arabe
Langue maternelle

Me Contacter

Disponible pour des missions de data engineering, conseil ou formation

Voir la page BilTek → Dossier de Compétences →