Liste des 10 meilleurs livres et descriptions de science des données pour le généraliste

Liste Des 10 Meilleurs Livres Et Descriptions De Science Des Donnees Pour Le Generaliste



La science des données est le domaine d'étude qui traite de grandes quantités de données en utilisant des méthodes, des processus, des algorithmes et des systèmes scientifiques pour trouver les modèles invisibles, dériver des informations significatives, prendre des décisions commerciales dans les entreprises et également les utiliser dans des institutions non commerciales. Les institutions non commerciales comprennent les secteurs de la santé, des jeux, de la reconnaissance d'images, des systèmes de recommandation, de la logistique, de la détection des fraudes (institutions bancaires et financières), de la recherche sur Internet, de la reconnaissance vocale, de la publicité ciblée, de la planification des itinéraires des compagnies aériennes et de la réalité augmentée. La science des données est un sous-ensemble de l'intelligence artificielle. Les données utilisées pour l'analyse peuvent provenir de nombreuses sources différentes et sont présentées sous différents formats. Certaines des données sources peuvent être normalisées; d'autres peuvent ne pas être normalisés.

En d'autres termes, différentes méthodologies sont utilisées pour collecter les données (pluriel de datum). Ensuite, des connaissances (conclusions précieuses) sont extraites des données assemblées. Dans le processus, après la collecte des données, la recherche est effectuée sur celles-ci (données) pour obtenir de nouvelles données (résultats) à partir desquelles les problèmes sont résolus.







La science des données en tant que discipline (majeure) existe au niveau licence et master à l'université. Cependant, seules quelques universités dans le monde proposent la Data Science en licence ou en master. Au niveau licence, l'étudiant obtient un diplôme en science des données. C'est comme un diplôme à usage général. Au niveau de la maîtrise, l'étudiant repart avec un diplôme d'études supérieures en science des données, spécialisé en analyse de données, en ingénierie des données ou en tant que scientifique des données.



Cela pourrait surprendre le lecteur et peut-être malheureusement, que l'apprentissage automatique, la modélisation, les statistiques, la programmation et les bases de données soient des connaissances préalables pour étudier la science des données au niveau du baccalauréat malgré le fait qu'il s'agit de cours universitaires respectés à part entière, étudiés en d'autres disciplines au niveau licence ou master. Néanmoins, lorsqu'un étudiant se rend dans une université pour étudier la science des données au niveau du diplôme, tous ces cours seront toujours étudiés, parallèlement ou avant les cours appropriés, pour la science des données.



La science des données pour le baccalauréat ou ses spécialisations comme l'analyse de données, l'ingénierie des données ou en tant que scientifique des données sont toujours en cours de développement ; bien qu'ils aient atteint un stade où ils sont appliqués dans les industries après avoir été étudiés (à l'université). La science des données est une discipline relativement très nouvelle, dans l'ensemble.





N'oubliez pas qu'il faut d'abord être généraliste avant de devenir spécialiste. Les distinctions entre les programmes spécialisés ne sont pas encore claires. Les distinctions entre les programmes généralistes et spécialisés ne sont pas encore claires.

Étant donné que la science des données est une discipline relativement nouvelle, les livres prescrits dans ce document sont basés sur la couverture du contenu et non sur la pédagogie (la qualité de l'enseignement du livre). Et ils sont pour le programme de baccalauréat (généraliste). Il existe différentes formations généralistes.



La liste

Pour plus de détails et achat possible par carte de crédit, un lien hypertexte pour chacun des livres est donné. Aucun des livres ne couvre tous les cours généralistes.

Mathématiques essentielles pour la science des données : calcul, statistiques, théorie des probabilités et algèbre linéaire

Écrit par : Hadrien Jean

  • Publisher: Hadrien Jean
  • Date de publication : après le 30 septembre 2020
  • Langue : ‎Anglais
  • Nombre de pages : ‎plus de 400

Le contenu de ce livre peut être considéré comme le cours de mathématiques pour la science des données. Bien qu'il ne soit pas recommandé d'apprendre la science des données par lui-même, un diplômé du secondaire qui souhaite apprendre la science des données par lui-même devrait commencer par ce livre.

Contenu : Calcul ; Statistiques et probabilités ; Algèbre linéaire; Scalaires et vecteurs ; matrices et tenseurs ; Envergure, dépendance linéaire et transformation spatiale ; Systèmes d'équations linéaires ; vecteurs propres et valeurs propres ; Décomposition en valeurs singulières.

https://www.essentialmathfordatascience.com/

Un guide de bon sens sur les structures de données et les algorithmes : améliorez vos compétences de base en programmation / 2e édition

Écrit par : Jay Wengrow

  • Editeur : Pragmatic Bookshelf
  • Date de publication : 15 septembre 2020
  • Langue : ‎Anglais
  • Dimensions : 7,5 x 1,25 x 9,25 pouces
  • Nombre de pages : ‎508

Ce livre traite des algorithmes et des structures de données utilisés en Data Science. En supposant que quelqu'un apprend la science des données par lui-même après avoir obtenu son diplôme d'études secondaires, il s'agit du prochain livre à lire après avoir lu le livre de mathématiques précédent. Les exemples de programmes sont donnés en JavaScript, Python et Ruby.

Contenu : pourquoi les structures de données sont importantes ; Pourquoi les algorithmes sont importants ; O Oui! Notation Big O ; Accélérer votre code avec Big O ; Optimisation du code avec et sans Big O ; Optimisation pour les scénarios optimistes ; Big O dans Everyday Code ; Recherche ultra-rapide avec tables de hachage ; Créer un code élégant avec des piles et des files d'attente ; Récursivité récursive avec récursivité ; Apprendre à écrire en récursif ; Programmation dynamique; Algorithmes récursifs pour la vitesse ; Structures de données basées sur des nœuds ; Accélérer toutes les choses avec les arbres de recherche binaires ; Garder vos priorités droites avec Heaps ; Cela ne fait pas de mal d'essayer; Connecter tout avec des graphiques ; Faire face aux contraintes d'espace ; Techniques d'optimisation du code

Science des données plus intelligente : réussir avec des projets de données et d'IA de niveau entreprise / 1 St Edition

Écrit par : Neal Fishman, Cole Stryker et Grady Booch

  • Éditeur : Wily
  • Date de publication : 14 avril 2020
  • Langue : ‎Anglais
  • Nombre de pages : ‎286

Contenu : Gravir l'échelle de l'IA ; Cadrage de la partie I : Considérations pour les organisations utilisant l'IA ; Encadrement de la partie II : Considérations relatives au travail avec les données et l'IA ; Retour sur l'analytique : plus d'un marteau ; Un regard vers l'avenir sur l'analyse : tout ne peut pas être un clou ; Aborder les disciplines opérationnelles sur l'échelle de l'IA ; Maximiser l'utilisation de vos données : être axé sur la valeur ; Valoriser les données avec une analyse statistique et permettre un accès significatif ; Construire pour le Long Terme; A Journey's End: Une IA pour l'IA.

Apprentissage automatique : une perspective probabiliste (série Calcul adaptatif et apprentissage automatique) Édition illustrée

Écrit par : Kevin P. Murphy

  • Editeur : The MIT Press
  • Date de publication : 24 août 2012
  • Langue : ‎Anglais
  • Dimensions : 8,25 x 1,79 x 9,27 pouces
  • Nombre de pages : ‎1104

Ce livre est bien pour les débutants. Encore une fois, comme tout le reste des livres prescrits dans ce document, ce livre ne couvre pas tout le nécessaire pour le programme généraliste qui, malheureusement, n'est toujours pas finalisé (les programmes spécialisés ne sont également toujours pas finalisés). Le débutant typique ici est un diplômé du secondaire avec un laissez-passer en mathématiques et en informatique.

Contenu : Introduction (Apprentissage automatique : quoi et pourquoi ?, Apprentissage non supervisé, Quelques concepts de base en apprentissage automatique) ; Probabilité; Modèles génératifs pour données discrètes ; modèles gaussiens ; statistiques bayésiennes ; Statistiques fréquentistes ; Régression linéaire; Régression logistique; Modèles linéaires généralisés et famille exponentielle ; Modèles graphiques dirigés (réseaux de Bayes) ; Modèles de mélange et algorithme EM ; Modèles linéaires latents ; Modèles linéaires creux ; Graines; processus gaussiens ; Modèles de fonction de base adaptatifs ; Modèles de Markov et modèles de Markov cachés ; Modèles d'espace d'états ; Modèles graphiques non orientés (champs aléatoires de Markov) ; Inférence exacte pour les modèles graphiques ; Inférence variationnelle ; Plus d'inférence variationnelle ; inférence de Monte Carlo ; Inférence Monte Carlo en chaîne de Markov (MCMC); regroupement ; Apprentissage de la structure du modèle graphique ; Modèles de variables latentes pour données discrètes ; L'apprentissage en profondeur.

La science des données pour les entreprises : ce que vous devez savoir sur l'exploration de données et la pensée analytique des données / 1ère édition

Écrit par : Tom Fawcett et Foster Provost

  • Editeur : O'Reilly Media
  • Date de publication : 17 septembre 2013
  • Langue : ‎Anglais
  • Dimensions : 7 x 0,9 x 9,19 pouces
  • Nombre de pages : ‎413

Contenu : Pensée analytique des données ; Problèmes commerciaux et solutions de science des données ; Introduction à la modélisation prédictive : de la corrélation à la segmentation supervisée ; Ajustement d'un modèle aux données ; Le surajustement et son évitement ; Similitude, voisins et clusters ; Pensée analytique décisionnelle I : Qu'est-ce qu'un bon modèle ? ; Visualisation des performances du modèle ; preuves et probabilités ; Représenter et extraire du texte ; Décision Analytique Pensée II : Vers l'Ingénierie Analytique ; Autres tâches et techniques de science des données ; Science des données et stratégie commerciale ; Conclusion.

https://www.amazon.com/Data-Science-Business-Data-Analytic-Thinking/dp/B08VL5K5ZX

Statistiques pratiques pour les scientifiques des données : 50+ concepts essentiels utilisant R et Python / 2e édition

Écrit par : Peter Bruce, Andrew Bruce et Peter Gedeck

  • Editeur : O'Reilly Media
  • Date de publication : 2 juin 2020
  • Langue : ‎Anglais
  • Dimensions : 7 x 0,9 x 9,1 pouces
  • Nombre de pages : ‎368

Contenu : analyse exploratoire des données, distributions de données et d'échantillonnage, expériences statistiques et tests de signification, régression et prédiction, classification, apprentissage automatique statistique, apprentissage non supervisé.

Le livre du pourquoi : la nouvelle science de la cause et de l'effet

Écrit par : Judea Pearl, Dana Mackenzie

  • Editeur : Basic Book
  • Date de publication : 15 mai 2018
  • Langue : ‎Anglais
  • Dimensions : 6,3 x 1,4 x 9,4 pouces
  • Nombre de pages : ‎432

Alors que de nombreux livres de science des données utilisent l'industrie commerciale pure à titre d'illustration, ce livre utilise l'industrie médicale et d'autres disciplines à titre d'illustration.

Contenu : Introduction : Mind over Data ; L'échelle de causalité ; Des boucaniers aux cobayes : la genèse de l'inférence causale ; De la preuve aux causes : le révérend Bayes rencontre M. Holmes ; Confondre et déconfondre : ou tuer la variable cachée ; Le débat enfumé : purifier l'air ; Paradoxes à gogo ! ; Au-delà de l'ajustement : la conquête du mont Intervention ; Contrefactuels : des mondes miniers qui auraient pu exister ; Médiation : la recherche d'un mécanisme ; Big Data, intelligence artificielle et les grandes questions.

Construire une carrière en science des données

Écrit par : Emily Robinson et Jacqueline Nolis

  • Editeur : Manning
  • Date de publication : 24 mars 2020
  • Langue : ‎Anglais
  • Dimensions : 7,38 x 0,8 x 9,25 pouces
  • Nombre de pages : ‎354

Contenu : Premiers pas avec la science des données ; Trouver votre emploi en science des données ; S'installer dans la science des données ; Évoluer dans votre rôle en science des données.

https://www.manning.com/books/build-a-career-in-data-science

La science des données pour les nuls / 2e édition

Écrit par : Lillian Pierson

  • Éditeur : Pour les nuls
  • Date de publication : 6 mars 2017
  • Langue: français
  • Dimensions : 7,3 x 1 x 9 pouces
  • Nombre de pages : ‎384

Ce livre suppose que le lecteur possède déjà les connaissances pré-requises en mathématiques et en programmation.

Contenu :  Envelopper votre tête autour de la science des données ; Explorer les pipelines et l'infrastructure d'ingénierie des données ; Application des informations basées sur les données aux entreprises et à l'industrie ; Apprentissage automatique : apprendre à partir des données avec votre machine ; Mathématiques, probabilités et modélisation statistique ; Utilisation du clustering pour subdiviser les données ; Modélisation avec des instances ; Construire des modèles qui exploitent des appareils de l'Internet des objets ; Suivre les principes de conception de visualisation de données ; Utilisation de D3.js pour la visualisation de données ; Applications Web pour la conception de visualisation ; Explorer les meilleures pratiques en matière de conception de tableaux de bord ; Faire des cartes à partir de données spatiales ; Utilisation de Python pour la science des données ; Utiliser Open Source R pour la science des données ; Utilisation de SQL en science des données ; Faire de la science des données avec Excel et Knime ; Science des données dans le journalisme : clouer les cinq W (et un H) ; plonger dans la science des données environnementales ; Science des données pour stimuler la croissance du commerce électronique ; Utilisation de la science des données pour décrire et prédire l'activité criminelle ; Dix ressources phénoménales pour les données ouvertes ; Dix outils et applications gratuits pour la science des données.

Extraction d'ensembles de données massifs / 3 rd Edition

Écrit par : Jure Leskovec, Anand Rajaraman, Jeffrey David Ullman

  • Editeur : Cambridge University Press
  • Date de publication : 13 février 2020
  • Langue: français
  • Dimensions : 7 x 1 x 9,75 pouces
  • Nombre de pages : ‎565

Ce livre suppose également que le lecteur possède déjà les connaissances pré-requises en mathématiques et en programmation.

Contenu : Exploration de données ; MapReduce et la nouvelle pile logicielle ; Algorithmes utilisant MapReduce ; Recherche d'articles similaires ; Flux de données minières ; analyse des liens ; Ensembles d'éléments fréquents ; regroupement ; Publicité sur le Web; systèmes de recommandation ; Graphiques de réseaux sociaux miniers ; réduction de la dimensionnalité ; Apprentissage automatique à grande échelle.

Conclusion

Les distinctions entre les programmes spécialisés ne sont pas encore claires. Les distinctions entre les programmes généralistes et spécialisés ne sont pas non plus encore claires. Cependant, après avoir lu la liste de livres donnée, le lecteur sera en mesure de mieux apprécier les rôles particuliers de l'analyste de données, de l'ingénierie des données et du scientifique des données, puis d'aller de l'avant.