Spark : valorisez vos données en temps réel avec Spark ML et Hadoop

Fiche technique

Format : Broché
Nb de pages : XIV-287 pages
Poids : 566 g
Dimensions : 18cm X 25cm
Date de parution :
ISBN : 978-2-10-079432-4
EAN : 9782100794324

Spark

de

chez Dunod

Collection(s) : InfoPro

Paru le | Broché XIV-287 pages

Professionnels

34.00 Disponible - Expédié sous 6 jours ouvrés
Ajouter au panier

Quatrième de couverture

Spark

Valorisez vos données en temps réel avec Spark ML et Hadoop

Depuis 2015, Spark s'impose comme le standard de facto pour le big data. En apportant simplicité d'usage, puissance de calcul, analyses en temps réel, algorithmes de machine learning et deep learning, le tout accessible en Python, Spark est devenu la porte d'entrée incontournable des projets de valorisation de données.

Alors que vient de sortir Spark 3, avec son lot d'innovations (Koalas, DeltaLake, et gestion des GPU) les environnements simplifiés « clicks boutons » sont légion (DataBricks, Dataiku RapidMiner, etc.). Mais pour les utiliser à bon escient, il vous faudra comprendre son fonctionnement interne afin de paramétrer correctement votre cluster et vos applications. C'est ce que propose ce livre : vous emmener dans une compréhension fine des tenants et aboutissants de Spark.

De plus, l'analyse des données n'est utile que dans des cas business précis. C'est pourquoi nous insistons sur une méthode d'analyse des données qui vous permettra de connaître les étapes d'un projet de machine learning, et les questions indispensables à se poser pour réussir une analyse pertinente. Nous l'illustrons via un exemple complet d'une entreprise (virtuelle) de location de vélo en libre service.

Ainsi, en lisant ce livre vous maîtriserez l'outil et la méthode adéquats pour valoriser vos données de manière éclairée, vous assurant une meilleure efficacité et rentabilité de vos projets data.

Biographie

Romain Jouin est le co-fondateur de Mémorandum (conseil en data-stratégie) et principal chez Ayming. Spécialiste de la valorisation des données, il accompagne les entreprises de toute taille dans leurs projets de valorisation de la data. Il est co-auteur de la Boite à outils de la stratégie Big Data parue chez Dunod.