Usando `pySpark`:

Consola

docker exec -it master bash
root@588acf96a879:/app# pyspark

file = spark.read.text("/dataset/yahoo-symbols-201709.csv")
file.count()
for line in file.take(10):
  print(line)

Acceda al Jupyter Notebook aqui, los notebook disponibles en ese workshop están en Github