Livres sur la Science des Données et son Introduction

  1. Cathy O'Neil, Rachel Schutt
    Doing Data Science: Straight Talk from the Frontline
    O'Reilly Media, 2013.
    (Introduction à la science des données, ses enjeux, outils et méthodologies).
  2. Joel Grus
    Data Science from Scratch: First Principles with Python
    O'Reilly Media, 2019.
    (Conception de la science des données avec Python, notamment les concepts clés mathématiques et pratiques).
  3. François Husson, Julie Josse, Jérémy Pagès
    Analyse de données avec R : Principes et méthodologies
    Presses Universitaires de Rennes, 2020.
    (Approfondissement des méthodes et outils pour l’analyse de données).
  4. Sebastien Brivet
    Mathématiques et Algèbre Linéaire pour la Data Science et le Machine Learning
    Editions ENI, 2021.
    (Ouvrage spécifique sur les bases mathématiques adaptées aux sciences des données).
  5. Anil Maheshwari
    Data Analytics Made Accessible
    Amazon, 2020.
    (Livre d’introduction adapté pour comprendre le big data, l’analyse de données et leur rôle dans les sciences des données).

Livres spécifiques aux outils mathématiques

  1. Gilbert Strang
    Linear Algebra and Its Applications
    Cengage, 5th Edition, 2016.
    (Une introduction approfondie à l’algèbre linéaire avec des applications pertinentes en sciences des données).
  2. Trevor Hastie, Robert Tibshirani, Jerome Friedman
    The Elements of Statistical Learning: Data Mining, Inference, and Prediction
    Springer, 2009.
    (Une référence pour les bases de l’apprentissage automatique, particulièrement les modèles linéaires).
  3. David S. Watkins
    Fundamentals of Matrix Computations
    Wiley, 3rd Edition, 2010.
    (Exploration détaillée des matrices et de leur importance dans les calculs en sciences des données).
  4. Norman Matloff
    Statistical Regression and Classification: From Linear Models to Machine Learning
    Chapman & Hall/CRC, 2017.
    (Lien clair entre régression linéaire et algorithmes de machine learning).

Webographie

Sites web et cours en ligne

  1. Coursera
  2. Khan Academy
  3. 3Blue1Brown (YouTube)
  4. Towards Data Science (Medium)
  5. Data Science Central

Documentation officielle des outils mentionnés dans le cours

  1. Python :
    • NumPy : https://numpy.org/doc/stable/
    • Pandas : https://pandas.pydata.org/docs/
    • Matplotlib & Seaborn : https://matplotlib.org/stable/index.html
    • Jupyter Notebook :

    Revues et publications

    1. The Journal of Data Science
    2. Springer – Journal of Big Data
      • Références récentes dans les domaines du big data et de la science des données.
        https://journalofbigdata.springeropen.com 

    Modifié le: mercredi 15 janvier 2025, 21:34