🎓 B3 IADATA

Analyse et Exploration de Données avec Python, SQL, DuckDB et Streamlit

35 heures | 5 séances | 5 projets pratiques

35h
Volume horaire
5
Séances
5
Projets
100%
Pratique

🎯 Objectifs Pédagogiques

  • Développer une compréhension approfondie des méthodes et outils d'analyse de données
  • Apprendre à préparer, explorer et analyser des ensembles de données complexes
  • Acquérir des compétences en visualisation de données
  • Explorer les techniques avancées d'analyse de données et de machine learning
  • Sensibiliser aux enjeux éthiques et de confidentialité dans le traitement des données

📚 Les 5 Séances

Séance 1 – Introduction à la Data Analysis et aux Outils Data

⏱️ 7 heures 📊 Débutant 🛠️ Python, DuckDB, SQL

Comprendre les enjeux de l'analyse de données et prendre en main les outils principaux : Python, SQL et DuckDB.

Python Pandas DuckDB SQL Jupyter

Séance 2 – SQL Analytique avec DuckDB

⏱️ 7 heures 📊 Intermédiaire 🛠️ SQL, DuckDB

Maîtriser SQL pour interroger efficacement des datasets volumineux : jointures, agrégations, window functions.

SQL avancé DuckDB Window Functions CTE Jointures

Séance 3 – Nettoyage, Analyse Statistique et Exploration avec Python

⏱️ 7 heures 📊 Intermédiaire 🛠️ Python, Pandas, NumPy

Nettoyer et transformer les données, réaliser une analyse statistique descriptive complète.

Pandas NumPy Statistiques Nettoyage EDA

Séance 4 – Data Visualisation et Applications Interactives avec Streamlit

⏱️ 7 heures 📊 Intermédiaire 🛠️ Streamlit, Plotly

Créer des visualisations pertinentes et construire des applications data interactives.

Streamlit Plotly Matplotlib Seaborn Dashboard

Séance 5 – Analyse Prédictive et Projet Data Complet

⏱️ 7 heures 📊 Avancé 🛠️ Scikit-learn, ML

Comprendre les bases du machine learning et mettre en place un projet data de bout en bout.

Scikit-learn Machine Learning Classification Régression Pipeline ML

🚀 Projets Pratiques

Choisissez un projet parmi les 5 proposés et réalisez-le de A à Z.

📊 Dashboard KPIs E-commerce

Difficulté: ⭐⭐⭐ | Durée: 60min

Créer un dashboard Power BI professionnel avec KPIs temps réel pour une startup e-commerce.

Python Power BI PostgreSQL
📖 Voir le projet →

📱 Analyse Cohortes Application Mobile

Difficulté: ⭐⭐⭐⭐ | Durée: 60min

Analyser la rétention des utilisateurs et comprendre pourquoi 60% partent après J+1.

Polars Marimo Lifelines
📖 Voir le projet →

📈 Attribution Marketing Multi-Touch

Difficulté: ⭐⭐⭐⭐ | Durée: 60min

Modèle d'attribution pour optimiser 500k€ de budget marketing annuel.

Python Scipy Power BI
📖 Voir le projet →

👥 People Analytics - Prédiction Turnover

Difficulté: ⭐⭐⭐⭐ | Durée: 60min

Prédire et prévenir les départs en entreprise (25% turnover, 50k€/départ).

Scikit-learn SHAP Streamlit
📖 Voir le projet →

📦 Supply Chain Analytics

Difficulté: ⭐⭐⭐⭐ | Durée: 60min

Optimiser stock : -15% ruptures, -30% surstocks, +5M€ économies.

DuckDB Prophet Great Tables
📖 Voir le projet →

👥 Projet de Groupe

Projet collaboratif | Durée: Variable

Consultez le document de référence pour les projets de groupe.

Collaboration Projet Groupe
📄 Voir le PDF →

🛠️ Toolbox

Ressources complémentaires et documentation pratique pour la formation.

🛠️ Boîte à outils

Accédez à tous les documents de référence : Python, SQL, Power BI, Git, VS Code...

📚 Ouvrir la Toolbox →

💻 TPs Python

Travaux pratiques avec exercices, données et corrections pour mettre en pratique les concepts.

📝 Accéder aux TPs →

📚 Ressources Complémentaires

📖 Documentation

🎓 Progression Pédagogique

Consultez le document officiel de progression pédagogique.

Voir le document

💡 Support

Besoin d'aide ? Consultez les exemples et corrections pour chaque séance.

Voir les exemples