rdds

Here are 14 public repositories matching this topic...

roshankoirala / pySpark_tutorial

Implementation of Spark code in Jupyter notebook. Topics include: RDDs and DataFrame, exploratory data analysis (EDA), handling multiple DataFrames, visualization, Machine Learning

visualization machine-learning sql apache-spark exploratory-data-analysis regression pyspark classification dataframe spark-sql pyspark-tutorial spark-ml rdds

Updated Aug 26, 2020
Jupyter Notebook

akshitvjain / realtime-twitter-trends-analytics

Star

A big data project to develop a real-time data pipeline for analyzing the popularity and sentiments of trending topics on Twitter.

Updated Jun 21, 2022
Scala

aiwithqasim / pyspark_bigdata

Star

Getting started with PySpark for Big data analysis

python pyspark mllib graphx rdds

Updated Aug 24, 2022
Jupyter Notebook

TrainingByPackt / Big-Data-Processing-with-Apache-Spark-eLearning

Star

Efficiently tackle large datasets and perform big data analysis with Spark and Python

python spark dataset structured-streaming spark-mllib rdds

Updated Jan 11, 2019
Python

Ayoub-etoullali / Activites-Pratiques-BigData

Star

MapReduce Job Development, RDDs Programming, Medical Data Management, Sales Analysis, And Efficient Data Integration For Big Data Analysis. Spark: Big Data Processing, SQOOP Integration, And Spark Structured Streaming For Real-Time Data.

real-time spark apache-spark pyspark data-integration mapreduce real-time-data sqoop mapreduce-jobs sales-analysis spark-structured-streaming mapreduce-java real-time-database big-data-processing rdds sqoop-export sqoop-import big-data-analysis medical-data-management

Updated Jun 7, 2023
Java

thiagoneye / course-pyspark

Star

Pyspark studies.

python data-science machine-learning sql big-data spark apache-spark optimization cluster distributed-computing apache pyspark data-engineering dataframe spark-sql rdds

Updated Dec 28, 2022
Python

DavideAG / BigData

Star

Spark, RDDs and Map Reduce applications related to the BigData @polito course (2019-2020). A set of personal notes are already provided.

spark hadoop notes bigdata hadoop-mapreduce mapreduce-java rdds

Updated Sep 9, 2020
Java

drewm8080 / data_mining_spark_rdds

Star

Data Mining using Spark Rdds

spark rdds

Updated Jan 15, 2024
Python

quadrantofsola / PySpark_RDD

Star

Analysis of Clinical Trial Dataset using PySpark RDD implementation.

bigdata pyspark databricks databricks-notebooks rdds

Updated May 22, 2022

mdarm / map-reduce-project

Star

Project on MapReduce for the Μ111 - Big Data Management course, NKUA, Spring 2023.

distributed-systems query-optimization parquet-files spark-sql mapreduce-python rdds query-execution-plan

Updated Jul 21, 2023
TeX

AjmalSarwary / IoT---assignment-IBM-Data-Science-Specialization

Star

This assignment was part of an IoT motion sensor App running on a watch, predicting actions of the individual wearing the watch based on his arm movements; this IoT Analytics assignments is one of a series of data pipeline coding challenges in the IBM course Scalable Data Science.

data-science big-data apache-spark data-engineering spark-streaming iot-device spark-sql stream-analytics etl-pipeline rdds

Updated Jul 30, 2022
Jupyter Notebook

Thanaraklee / PySpark-Big-Data-RDD-Operations

Star

This project illustrates Apache Spark RDD operations, from creation and transformation to actions and results, enhancing users' understanding of distributed data processing.

python big-data spark pyspark rdds

Updated Aug 21, 2023
Jupyter Notebook

lakshay2k / Spark_Playground

Star

Here I play with the services offered by Apache Spark and try to learn them in more depth.

spark apache-spark broadcast wordcount accumulators rdds

Updated Jun 4, 2021
Jupyter Notebook

estelacode / big_data

Star

📈📊 Big Data Notebooks . ▫️ Análisis masivos de datos con pyspark ▫️ Ingesta de datos. ▫️ Algoritmos de machine learning con datos masivos. ▫️ Procesamiento de mensajes en tiempo real con Kafka.

machine-learning big-data apache-spark hdfs logistic-regression apache-kafka decision-trees pyspark-notebook apache-hadoop rdds pyspark-sql

Updated Aug 31, 2024
Jupyter Notebook

Improve this page

Add a description, image, and links to the rdds topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the rdds topic, visit your repo's landing page and select "manage topics."

Learn more

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

rdds

Here are 14 public repositories matching this topic...

roshankoirala / pySpark_tutorial

akshitvjain / realtime-twitter-trends-analytics

aiwithqasim / pyspark_bigdata

TrainingByPackt / Big-Data-Processing-with-Apache-Spark-eLearning

Ayoub-etoullali / Activites-Pratiques-BigData

thiagoneye / course-pyspark

DavideAG / BigData

drewm8080 / data_mining_spark_rdds

quadrantofsola / PySpark_RDD

mdarm / map-reduce-project

AjmalSarwary / IoT---assignment-IBM-Data-Science-Specialization

Thanaraklee / PySpark-Big-Data-RDD-Operations

lakshay2k / Spark_Playground

estelacode / big_data

Improve this page

Add this topic to your repo