Mon panier Mon panier
(0) articles
Mon compte Mon compte
Moteur de recherche
Catalogue : Détail

Modélisation prédictive et apprentissage statistique avec R


9782710811787-Modélisation prédictive et apprentissage statistique avec R
Auteurs : TUFFERY Stéphane

TUFFERY Stéphane

Stéphane TUFFÉRY est responsable des études statistiques dans un grand groupe bancaire. Il intervient à l’Institut des Actuaires et il est Maître de Conférences associé à l’Université de Rennes 1, où il enseigne le data mining et les méthodes de Big Data. Il a été traduit en anglais et a récemment publié "Modélisation prédictive et apprentissage statistique avec R" (2e édition) dans la même collection.


FaceBook Google+ Tweeter Imprimer
Commentaire : 

2e édition actualisée et augmentée


ISBN : 9782710811787
broché      17 x 24 cm      420 pages
Date de publication : Juillet 2017



Issu de formations devant des publics variés, cet ouvrage présente les principales méthodes de modélisation statistique et de machine learning, à travers le fil conducteur d’une étude de cas. Chaque méthode fait l’objet d’un rappel de cours et est accompagnée de références bibliographiques, puis est mise en œuvre avec des explications détaillées sur les calculs effectués, les interprétations des résultats et jusqu’aux astuces de programmation permettant d’optimiser les temps de calcul. À ce sujet, une annexe est consacrée au traitement des données massives.


L’ouvrage commence par les méthodes de classement classiques et les plus éprouvées, mais aborde rapidement les méthodes plus récentes et les plus avancées : régression ridge, lasso, elastic net, boosting, forêts aléatoires, Extra-Trees, réseaux de neurones, séparateurs à vaste marge (SVM). A chaque fois, le lien est fait entre la théorie et les résultats obtenus pour montrer qu’ils illustrent bien les principes sous-jacents à ces méthodes. L’aspect pratique est aussi privilégié, avec l’objectif de permettre au lecteur une mise en œuvre rapide et efficace dans son travail concret. L’exploration et la préparation préliminaire des données sont d’ailleurs décrites, ainsi que le processus de sélection des variables. Une synthèse finale est faite de toutes les méthodes présentées et de leurs points forts.
La mise en œuvre s’appuie sur le logiciel libre R et sur un jeu de données public. Ce dernier peut être téléchargé sur Internet et présente l’intérêt d’être riche, complet et de permettre des comparaisons grâce aux nombreuses publications dans lesquelles il est cité. Quant au logiciel statistique R, non seulement il est devenu la lingua franca de la statistique et de la data science et le logiciel le plus répandu dans le monde universitaire, mais il a aussi conquis le monde de l’entreprise, à tel point que tous les logiciels commerciaux proposent désormais une interface avec R (ce point est abordé dans une annexe). Outre qu’il est disponible pour tous, dans tous les environnements, il est aussi le plus riche statistiquement et c’est le seul logiciel permettant de mettre en œuvre toutes les méthodes présentées dans cet ouvrage. Enfin, son langage de programmation particulièrement élégant et adapté au calcul mathématique permet de se concentrer dans le codage sur les aspects statistiques sans les difficultés de programmation rencontrées avec d’autres logiciels. R permet d’arriver directement à l’essentiel et de mieux comprendre les méthodes exposées dans l’ouvrage.

 

Le Code R utilisé dans l’ouvrage est disponible sur cette page dans la partie "Bonus/lire".


Table des matières :


Présentation du jeu de données. Préparation des données. Exploration des données. Discrétisation automatique supervisée des variables continues. La régression logistique. La régression logistique pénalisée ridge. La régression logistique pénalisée lasso. La régression logistique PLS. L’arbre de décision CART. L’algorithme PRIM. Les forêts aléatoires. Le bagging. Les forêts aléatoires de modèles logistiques. Le boosting. Les Support Vector Machines. Les réseaux de neurones. Synthèse des méthodes prédictives. Annexes. Bibliographie. Index des packages R utilisés.

Autour du livre
Feuilleter un extrait
Feuilleter un extrait
Lire le dossier de presse
Lire le dossier de presse
Ecouter une interview
Ecouter une interview
Voir une vidéo associée
Voir une vidéo associée
Voir le site web du livre
Voir le site web du livre
Ouvrages du même auteur
Le data mining et la data science sont de plus en plus répandus dans les entreprises et les organisations soucieuses d’extraire l’information...
>> En savoir plus
68 €
Ajouter au panier Ajouter au panier
Comprendre les principes théoriques de la statistique est une chose ; savoir les mettre en pratique en est une autre, et le fossé peut être...
>> En savoir plus
39 €
Ajouter au panier Ajouter au panier
Ouvrages du même thème
Pour réaliser une enquête par sondage, la procédure de référence suppose que la composition de l’échantillon...
>> En savoir plus
35 €
Ajouter au panier Ajouter au panier
Cette introduction aux principales notions des probabilités dont le praticien sera amené à se servir est rédigée pour...
>> En savoir plus
64 €
Ajouter au panier Ajouter au panier
Le recueil d’information par sondage dans une population est une pratique courante. Cet ouvrage de référence expose les fondements...
>> En savoir plus
70 €
Ajouter au panier Ajouter au panier
Cet ouvrage, consacré aux approches non paramétriques et semi-paramétriques en régression, propose au lecteur une exploration,...
>> En savoir plus
40 €
Ajouter au panier Ajouter au panier
Catalogue libraire

DAUDIN DISTRIBUTION
1, rue Guynemer - CS 30504
78771 Magny Les Hameaux Cedex
Tél. : 01 30 48 74 50
Fax  : 01 34 98 02 44
E-mail : info@daudin.fr

EDITIONS OPHRYS

5, avenue de la République

75011 PARIS

FRANCE

Tél. : 01 45 78 33 80

E-mail : info@ophrys.fr

 

N° Siret : 562 046 102 000 58

TVA : FR 25562046102

APE : 5814Z

Suivez-nous
FacebookGoogle+YouTube