Edureka
Spécialisation PySpark for Data Science

Ce spécialisation n'est pas disponible en Français (France)

Nous sommes actuellement en train de le traduire dans plus de langues.
Edureka

Spécialisation PySpark for Data Science

Unlock the potential of PySpark for data science, mastering data processing and analytics , and machine learning to drive insightful decision-making.

Edureka

Instructeur : Edureka

Inclus avec Coursera Plus

Approfondissez votre connaissance d’un sujet
niveau Intermédiaire

Expérience recommandée

4 mois
à 5 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Approfondissez votre connaissance d’un sujet
niveau Intermédiaire

Expérience recommandée

4 mois
à 5 heures par semaine
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Master the fundamentals of Big Data and PySpark to process data using RDDs and DataFrames.

  • Optimize data science workflows by leveraging advanced PySpark DataFrame and SQL operations.

  • Build machine learning models with PySpark MLlib, applying regression and clustering techniques.

  • Implement data streaming with structured streaming and explore NLP for text processing in big data.

Compétences que vous acquerrez

  • Catégorie : Data Streaming
  • Catégorie : Deep Learning
  • Catégorie : Model Building and Evaluation
  • Catégorie : RDD Transformations
  • Catégorie : Natural Language Processing
  • Catégorie : Data Processing
  • Catégorie : Pyspark
  • Catégorie : Machine Learning
  • Catégorie : Data Engineering
  • Catégorie : Spark Streaming
  • Catégorie : Data Processing with PySpark
  • Catégorie : Model Evaluation
  • Catégorie : PySpark
  • Catégorie : Model Building
  • Catégorie : SQL Querying with PySpark
  • Catégorie : Advanced DataFrame Operations

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Améliorez votre expertise en la matière

  • Acquérez des compétences recherchées auprès d’universités et d’experts du secteur
  • Maîtrisez un sujet ou un outil avec des projets pratiques
  • Développez une compréhension approfondie de concepts clés
  • Obtenez un certificat professionnel auprès de Edureka
Certificat professionnel Coursera

Obtenez un certificat professionnel

Ajoutez cette qualification à votre profil LinkedIn ou à votre CV

Partagez-le sur les réseaux sociaux et dans votre évaluation de performance

Certificat professionnel Coursera

Spécialisation - 3 séries de cours

Ce que vous apprendrez

  • Explore the fundamental concepts of Big Data and the components of the Hadoop ecosystem.

  • Explain the architecture and key principles of Apache Spark and its role in big data processing.

  • Utilize RDD transformations and actions to effectively process large-scale datasets with PySpark.

  • Execute advanced DataFrame operations, including data manipulation and aggregation techniques.

Compétences que vous acquerrez

Catégorie : Apache Hadoop
Catégorie : SQL Querying with PySpark
Catégorie : Data Manipulation
Catégorie : Data Processing
Catégorie : PySpark
Catégorie : Relational Databases
Catégorie : Data Engineering
Catégorie : Distributed Computing
Catégorie : SQL
Catégorie : RDD Transformations
Catégorie : Apache Spark
Catégorie : Data Transformation
Catégorie : Advanced DataFrame Operations
Catégorie : Big Data

Ce que vous apprendrez

  • Implement machine learning models using PySpark MLlib.

  • Implement linear and logistic regression models for predictive analysis.

  • Apply clustering methods to group unlabeled data using algorithms like K-means.

  • Explore real-world applications of PySpark MLlib through practical examples.

Compétences que vous acquerrez

Catégorie : Supervised Learning
Catégorie : Data Processing
Catégorie : Regression Analysis
Catégorie : PySpark
Catégorie : Model Building
Catégorie : Machine Learning
Catégorie : Distributed Computing
Catégorie : Unsupervised Learning
Catégorie : Data Processing with PySpark
Catégorie : Model Evaluation
Catégorie : Predictive Modeling
Catégorie : Apache Spark
Catégorie : Feature Engineering
Catégorie : Big Data
Catégorie : Machine Learning Algorithms

Ce que vous apprendrez

  • Analyze streaming data to extract insights and trends in real-time applications.

  • Analyze real-time data streams and apply Spark Streaming techniques for efficient processing.

  • Develop robust streaming applications using Spark's Structured Streaming for fault-tolerant processing.

  • Implement NLP techniques to process and analyze textual data efficiently.

Compétences que vous acquerrez

Catégorie : Performance Tuning
Catégorie : Data Pipelines
Catégorie : Natural Language Processing
Catégorie : Real Time Data
Catégorie : Data Processing
Catégorie : PySpark
Catégorie : Data Engineering
Catégorie : Scalability
Catégorie : Distributed Computing
Catégorie : Data Cleansing
Catégorie : Apache Kafka
Catégorie : Deep Learning
Catégorie : Software Architecture
Catégorie : Spark Streaming
Catégorie : Apache Spark
Catégorie : Interactive Data Visualization
Catégorie : Text Mining
Catégorie : Data Transformation
Catégorie : Dashboard

Instructeur

Edureka
Edureka
66 Cours72 154 apprenants

Offert par

Edureka

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Coursera Plus

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

Foire Aux Questions