Percorso professionalizzante Diventa Data Scientist


In sintesi

Percorso pensato per fornire conoscenze avanzate su tecniche e strumenti per la gestione, l’analisi, la visualizzazione di dati e per il successivo loro uso con tecniche di machine learning su tre tematiche principali: clustering, classificazione e regressione.
Per la partecipazione al percorso è richiesta esperienza di programmazione in un qualsiasi linguaggio; per chi non ha conoscenze è richiesta la partecipazione al Percorso Python.

Target

Figure professionali del settore creditizio-finanziario che desiderano acquisire una visione integrata del processo di gestione e utilizzo dei dati e dei big data. Data scientist, business analyst, data analyst, technical manager, consultant.

 

Obiettivi

Il percorso trasferisce al partecipante le conoscenze necessarie ad apprendere tecniche e strumenti per la gestione, l’analisi, la visualizzazione di dati e per il successivo loro uso con tecniche di machine learning su tre tematiche principali: clustering, classificazione e regressione.

Data
Dal 7 ottobre 2020
Sede

Aula virtuale, attraverso piattaforma dedicata, con possibilità di interazione real time con i docenti

Anno
2020
Richiedi informazioni

Modulo 1
GESTIONE E VISUALIZZAZIONE DEI DATI
07/10/2020
09/10/2020
Modulo 2
TECNICHE DI MACHINE LEARNING PER L’ANALISI DEI DATI
28/10/2020
30/10/2020
Modulo 3
TECNICHE DI DEEP LEARNING PER L’ANALISI DEI DATI
10/11/2020
12/11/2020
Modulo di approfondimento
Tecniche di text processing
25/11/2020
27/11/2020
*Prezzo associato ABI
Presentazione

Il percorso professionalizzante “Diventa Data Scientist”, ha l’obiettivo di trasferire strumenti e soluzioni pratico-operative attraverso casi di studio, team-working e momenti di hands-on. I moduli sono autoconsistenti ma solo chi frequenta dell’intero percorso può sostenere il test finale di attestazione delle conoscenze acquisite.

Per la partecipazione al percorso “Diventa Data Scientist” è richiesta esperienza di programmazione Python; per chi non ha conoscenze è richiesta la partecipazione al Percorso Python.

PRIMO MODULO

Concetti avanzati per la gestione dei dati in Python
Data Modeling and Understanding: libreria Numpy

• Tipi di dato Numpy
• Operazioni base su vettori e matrici
• Funzioni universali e broadcasting
• Analisi statistiche avanzate
• I/O con Numpy
• Hands-on ed esercizi

Data Management, Processing and Cleaning: libreria Pandas

  • Oggetti in Pandas
  • Indicizzazione e selezione in Pandas
  • Operazioni di base in Pandas
  • Metodi per la pulizia dei dati
  • Combinazione e aggregazione dei dati
  • Integrazione con Microsoft Excel
  • Integrazione e omogeneizzazione di diversi data set
  • Hands-on ed esercizi

Data Visualization: librerie Matplotlib, Seaborn, Plotly

  • Istogrammi, fitting, bar graph e tendenze
  • Serie temporali, intervalli di confidenza e boxplot
  • Scatter plot, heatmap e densità di probabilità
  • Aggregazione, selezione e sampling
  • Hands-on ed esercizi

Copyright

SECONDO MODULO

Introduzione al Machine learning

  • Dati di training, validation e test: definizione e creazione
  • Metriche di valutazione dell’efficacia dei modelli di Machine learning
  • Ottimizzazione e selezione del modello prodotto
  • Overfitting e underfitting
  • Machine learning con la libreria scikit-learn

Metodi non Supervisionati: Clustering

  • Introduzione al problema del Clustering
  • Tipologie di Clustering: densità, k-means, gerarchico, ecc.
  • Similarità tra oggetti e ottimizzazione
  • Clustering con la libreria scikit-learn

– K-means
– Density-based clustering
– Hierarchical clustering


• Hands-on ed esercizi (dati numerici e testo)

Metodi Supervisionati: Classificazione

  • Introduzione al problema di classificazione
  • Classificazione binaria e multi-etichetta
  • Matrice di confusione e metriche di bontà della classificazione
  • Classificazione con la libreria scikit-learn

– Logistic regression, kNN
– Alberi di decisione
– SVM

• Hands-on ed esercizi (dati numerici e testo)


Metodi Supervisionati: Regressione

  • Introduzione al problema di regressione
  • Matrice di confusione e metriche di bontà della classificazione
  • Regressione con la libreria scikit-learn

    – Regressione lineare
    – Ridge, lasso
    – Alberi di regressione

  • Hands-on ed esercizi

Copyright

Elisa Isacco
e.isacco@abiservizi.it
06.6767.517