PERCORSO
Il focus iniziale del corso verterà sulle strutture dato (RDD e Dataframe) e la loro manipolazione. Verranno introdotti inoltre le librerie di Spark per lo streaming Real-time e per il Machine Learning. Per la prima libreria verrà costruito un esempio di flusso stream all’interno della community edition di Databricks oppure usando i servizi Azure.
La libreria di Machine Learning verrà usata per svolgere delle analisi pratiche di Dataset, sia guidate che sotto forma di esercitazione da svolgere in maniera autonoma.
Il corso ha la durata di 2 giorni e al termine delle lezioni riceverai un Attestato di Frequenza che certifica il percorso seguito e la dispensa che comprende le presentazioni e il codice utilizzato durante il corso.