ISBN 9782322250745 404 pages FORMAT 17x22 cm Prix Public TTC 39.90 €

En librairie

DATA SCIENCE avec PYTHON 3.10

Ce livre est destiné aux personnes souhaitant avoir une première immersion dans le domaine de l'analyse de données avec le langage de programmation Python et les librairies dédiées à l'analyse de données que sont NumPy, Pandas, Matplotlib et Seaborn.

Dans ce livre, nous verrons principalement comment explorer, manipuler et visualiser des données structurées, c'est-à-dire des tableaux contenant des lignes et des colonnes que vous pouvez comparer à un tableau EXCEL. Le but recherché de ce livre est de fournir à l'utilisateur une prise en main technique utilisant Python avec les librairies dédiées à l'analyse de données, mais aussi les outils disponibles pour ces analyses. En revanche, nous n'introduirons pas les méthodologies d'analyse statistique avec Python, ni le Machine Learning proprement dit puisqu'il faudrait un livre à part dédié à cette fin.

Cet ouvrage permettra au lecteur de maîtriser les différentes structures de données disponibles afin de les manipuler, de les explorer, de les nettoyer et de les visualiser pour en faire ressortir des tendances et des idées. À la fin de ce livre, vous aurez tout le bagage nécessaire avec le langage Python, et vous serez autonome pour manipuler et visualiser l'ensemble des tableaux de données qui vous intéressent. Avec la dernière partie de ce livre, vous verrez comment réaliser une application complète, autonome et fenêtrée, avec Python et PyQt5 pour charger une source de données et pour visualiser divers types de graphiques à l'aide des librairies Matplotlib et Seaborn.

Il est vivement recommandé au lecteur d'avoir une première expérience avec la pratique de la programmation en langage Python. En téléchargement gratuit avec ce livre, vous avez accès à l'ensemble du code sous forme de notebooks Jupyter et de solutions de projets PyCharm.

Ce livre commence par une introduction permettant de voir comment installer les notebooks Jupyter à partir d'une distribution Anaconda, quels sont les usages courants dans l'édition des scripts, et une présentation sur ce que représente l'analyse de données de nos jours.

La première partie aborde l'utilisation de la librairie NumPy qui est une librairie Python dédiée au calcul scientifique fournissant des fonctions très performantes de calcul, mais aussi des structures de données spécialisées et remarquablement performantes. Nous y verrons notamment comment créer un tableau de type ndarray, l'indexation, les opérations mathématiques, les manipulations des tableaux et une introduction aux matrices.

La seconde partie aborde l'utilisation de la librairie Pandas qui est une librairie Python dédiée à la Data Science (que l'on traduit par science des données). Il s'agit de la librairie Python la plus populaire et la plus performante pour faire de l'analyse de données. Cette librairie Pandas amène avec elle deux nouvelles structures essentielles pour l'analyse de données qui sont les structures Series et DataFrame. Nous y verrons notamment la lecture de fichiers (format texte, format EXCEL et format JSON), l'exportation des données, la structure Series, la structure DataFrame, et les manipulations avancées.

La troisième partie aborde l'utilisation de la librairie Matplotlib qui est une librairie graphique très connue en Python car elle est puissante, très simple à prendre en main et chaque élément de la figure peut être configuré finement via un grand nombre de paramètres disponibles. Nous y verrons notamment comment préparer un jeu de données, comment réaliser un graphique de type nuage de points, et comment composer les principaux types de graphiques.

La quatrième partie aborde l'utilisation de la librairie Seaborn qui est la librairie la plus populaire pour la visualisation de graphique. En réalité, cette librairie s'appuie sur Matplotlib et elle apporte des fonctions supplémentaires permettant de générer des graphiques plus travaillés, aux allures plus modernes, et ce de manière très simple. Nous y verrons notamment l'utilisation des thèmes, des contextes, des palettes de couleurs, les différents types de graphiques (nuage de points, boîte à moustaches, histogramme, carte thermique, etc), et les graphiques multi-grilles.

La cinquième partie aborde la création d'une application autonome, fonctionnelle et fenêtrée pour visualiser des graphiques élaborés avec les librairies Matplotlib et Seaborn. Nous y verrons notamment comment utiliser le composant FigureCanvasQTAgg pour visualiser des graphiques aux allures modernes dans un projet PyCharm avec Python et la librairie des contrôles PyQt5.

Ressources complémentaires

Consulter le sommaire détaillé du livre => en cliquant ici

Télécharger gratuitement le code source de programmation => en cliquant ici

Disponible dans les librairies en ligne

Fiche auteur chez Amazon France => par ici

Chez Amazon France => commander ici

Chez Books On Demand => commander ici