🎓 B3 IADATA
Analyse et Exploration de Données avec Python, SQL, DuckDB et Streamlit
35 heures | 5 séances | 5 projets pratiques
🎯 Objectifs Pédagogiques
- Développer une compréhension approfondie des méthodes et outils d'analyse de données
- Apprendre à préparer, explorer et analyser des ensembles de données complexes
- Acquérir des compétences en visualisation de données
- Explorer les techniques avancées d'analyse de données et de machine learning
- Sensibiliser aux enjeux éthiques et de confidentialité dans le traitement des données
📚 Les 5 Séances
Séance 1 – Introduction à la Data Analysis et aux Outils Data
⏱️ 7 heures
📊 Débutant
🛠️ Python, DuckDB, SQL
Comprendre les enjeux de l'analyse de données et prendre en main les outils principaux : Python, SQL et DuckDB.
Python
Pandas
DuckDB
SQL
Jupyter
Séance 2 – SQL Analytique avec DuckDB
⏱️ 7 heures
📊 Intermédiaire
🛠️ SQL, DuckDB
Maîtriser SQL pour interroger efficacement des datasets volumineux : jointures, agrégations, window functions.
SQL avancé
DuckDB
Window Functions
CTE
Jointures
Séance 3 – Nettoyage, Analyse Statistique et Exploration avec Python
⏱️ 7 heures
📊 Intermédiaire
🛠️ Python, Pandas, NumPy
Nettoyer et transformer les données, réaliser une analyse statistique descriptive complète.
Pandas
NumPy
Statistiques
Nettoyage
EDA
Séance 4 – Data Visualisation et Applications Interactives avec Streamlit
⏱️ 7 heures
📊 Intermédiaire
🛠️ Streamlit, Plotly
Créer des visualisations pertinentes et construire des applications data interactives.
Streamlit
Plotly
Matplotlib
Seaborn
Dashboard
Séance 5 – Analyse Prédictive et Projet Data Complet
⏱️ 7 heures
📊 Avancé
🛠️ Scikit-learn, ML
Comprendre les bases du machine learning et mettre en place un projet data de bout en bout.
Scikit-learn
Machine Learning
Classification
Régression
Pipeline ML
🚀 Projets Pratiques
Choisissez un projet parmi les 5 proposés et réalisez-le de A à Z.
📊 Dashboard KPIs E-commerce
Difficulté: ⭐⭐⭐ | Durée: 60min
Créer un dashboard Power BI professionnel avec KPIs temps réel pour une startup e-commerce.
Python
Power BI
PostgreSQL
📖 Voir le projet →
📱 Analyse Cohortes Application Mobile
Difficulté: ⭐⭐⭐⭐ | Durée: 60min
Analyser la rétention des utilisateurs et comprendre pourquoi 60% partent après J+1.
Polars
Marimo
Lifelines
📖 Voir le projet →
📈 Attribution Marketing Multi-Touch
Difficulté: ⭐⭐⭐⭐ | Durée: 60min
Modèle d'attribution pour optimiser 500k€ de budget marketing annuel.
Python
Scipy
Power BI
📖 Voir le projet →
👥 People Analytics - Prédiction Turnover
Difficulté: ⭐⭐⭐⭐ | Durée: 60min
Prédire et prévenir les départs en entreprise (25% turnover, 50k€/départ).
Scikit-learn
SHAP
Streamlit
📖 Voir le projet →
📦 Supply Chain Analytics
Difficulté: ⭐⭐⭐⭐ | Durée: 60min
Optimiser stock : -15% ruptures, -30% surstocks, +5M€ économies.
DuckDB
Prophet
Great Tables
📖 Voir le projet →
👥 Projet de Groupe
Projet collaboratif | Durée: Variable
Consultez le document de référence pour les projets de groupe.
Collaboration
Projet
Groupe
📄 Voir le PDF →
🛠️ Toolbox
Ressources complémentaires et documentation pratique pour la formation.
🛠️ Boîte à outils
Accédez à tous les documents de référence : Python, SQL, Power BI, Git, VS Code...
📚 Ouvrir la Toolbox →
💻 TPs Python
Travaux pratiques avec exercices, données et corrections pour mettre en pratique les concepts.
📝 Accéder aux TPs →
📚 Ressources Complémentaires
🎓 Progression Pédagogique
Consultez le document officiel de progression pédagogique.
Voir le document
💡 Support
Besoin d'aide ? Consultez les exemples et corrections pour chaque séance.
Voir les exemples