Mathematical methods for data science

Teaching in italian
Metodi matematici per la data science
Teaching
Mathematical methods for data science
Subject area
SECS-S/06
Reference degree course
DATA SCIENCE FOR THE HUMAN AND SOCIAL SCIENCES
Course type
Master's Degree
Credits
8.0
Teaching hours
Frontal Hours: 48.0
Academic year
2023/2024
Year taught
2024/2025
Course year
2
Language
ITALIAN
Curriculum
Data Analytics
Reference professors for teaching
CIURLIA Pierangelo
DURANTE FABRIZIO

Teaching description

Si richiedono le conoscenze di base di matematica acquisite durante il percorso di studi, nonché elementi di calcolo delle probabilità e statistica.

Introduzione ai metodi matematici per la Data Science.

Al termine del corso lo studente/la studentessa conosce i principali metodi matematici per l’estrazione di informazione da insiemi di dati di grandi dimensioni.

 

Risultati attesi secondo i descrittori di Dublino:

Conoscenza e capacità di comprensione (knowledge and understanding)

Conoscenza e capacità di comprensione dei principali metodi matematici idonei ad affrontare alcuni problemi di analisi di dati ad alta dimensionalità.

 

Capacità di applicare conoscenza e comprensione (applying knowledge and understanding)

Capacità di implementare algoritmi e procedure per l’analisi dei dati, specialmente ad alta dimensionalità.

 

Autonomia di giudizio (making judgements)

Valutare criticamente i risultati ottenuti dall’applicazione di un particolare metodo matematico all’analisi di un problema applicativo, evidenziandone possibili limitazioni.

 

Abilità comunicative (communication skills)

Presentare con un linguaggio appropriato un’analisi di dati, nonché le metodologie matematiche ivi utilizzate.

 

Capacità di apprendimento (learning skills)

Individuare gli strumenti matematici più adatti per risolvere problemi rilevanti per la data science, realizzando in modo autonomo la relativa elaborazione computazionale.

Lezioni frontali ed esercitazioni. Laboratorio di analisi dei dati con R.

Modalità di esame: progetto di analisi dei dati e prova orale.

Modalità di accertamento: La prova d’esame consiste di due parti:

  • preparazione e presentazione orale di un lavoro progettuale di analisi di dati con il linguaggio di programmazione R (50%),
  • prova orale durante la quale si attesta l'acquisizione da parte dello studente dei contenuti del corso (50%).

 

Non sono previste differenze nelle modalità d’esame fra studenti frequentanti e non frequentanti.

 

L’Università del Salento “promuove e garantisce l’inclusione e la partecipazione effettive degli studenti con disabilità” (art. 10 dello Statuto). Lo studente/la studentessa disabile e/o con DSA, che intende usufruire di un intervento individualizzato per lo svolgimento della prova d’esame deve contattare l'Ufficio Integrazione dell'Università del Salento.

Materiale didattico e tutte le informazioni sull’insegnamento (incluso orario di ricevimento) saranno disponibili sulla pagina web dell’insegnamento su

elearning.unisalento.it.

Richiami sulla regressione lineare. Il metodo OLS come minimizzazione del rischio. Errore di addestramento ed errore di generalizzazione. Selezione del modello di regressione: validazione incrociata.

 

Selezione del modello lineare. Algoritmo Best Subset Selection. Regolarizzazione. Regressione ridge e lasso.

 

Algoritmi k-NN per la regressione e la classificazione.

 

Alberi di decisione. Combinazione di modelli (random forest, boosting).

Materiale didattico presentato a lezione sarà distribuito nella pagina dell’insegnamento su elearning.unisalento.it. 

Libri di testo consigliati:
James, G., Witten, D., Hastie, T., Tibshirani, R.: An Introduction to Statistical Learning with Applications in R. Springer, 2022. Second edition. Free available at https://www.statlearning.com/
Boehmke, B. and Greenwell, B.: Hands-on Machine Learning with R. Free available at https://bradleyboehmke.github.io/HOML/

Semester
Second Semester (dal 03/03/2025 al 06/06/2025)

Exam type
Compulsory - Related/Supplementary

Type of assessment
Oral - Final grade

Course timetable
https://easyroom.unisalento.it/Orario

Download teaching card (Apre una nuova finestra)(Apre una nuova finestra)