Dans le cadre de la découverte du module Spark ML, j'ai déroulé depuis un environnement Notebook (JupyperHub) couplé à cluster Spark (mais pas utilisé) un premier exercice (orienté classification sur des variables qualitatives à l'aide d'algorithmes linéaires) en guise de découverte dans ce nouveau monde. Ce référentiel s'enrichira progressivement en fonction de ma découverte de ce module spécifique de Spark.
- Classification d'une fleur d'Iris avec la fourniture de ses caractéristiques (longueur et largeur de ses pétales et sépales, ainsi que son type) en fonction de l'apprentissage d'un jeu de données équitable relatif à 50 caractériques pour 3 types donnés.