Statistics and mathematics for data science - Mod. II

Teaching in italian
Statistica e matematica per la data science - Mod. II
Teaching
Statistics and mathematics for data science - Mod. II
Subject area
SECS-S/02
Reference degree course
DATA SCIENCE FOR THE HUMAN AND SOCIAL SCIENCES
Course type
Master's Degree
Credits
8.0
Teaching hours
Frontal Hours: 48.0
Academic year
2023/2024
Year taught
2023/2024
Course year
1
Curriculum
Percorso comune
Reference professor for teaching
ARIMA SERENA

Teaching description

Conoscenze di statistica e matematica di base.

Il corso introduce gli studenti agli strumenti fondamentali per l’analisi statistica e matematica relativi alla data science. Dopo aver richiamato le nozioni di base, si approfondiranno i principali metodi inferenziali basati sull’approccio di verosimiglianza e gli strumenti matematici per la stima. Il metodo Bayesiano verrà introdotto e verranno illustrate le principali procedure inferenziali.

Il corso intende fornire agli studenti i principali strumenti statistici per l’analisi di fenomeni reali di tipo psicologico e sociale, in particolare:

Conoscenze e comprensione.

Acquisire una conoscenza dei principali metodi matematici e statistici per l’inferenza mediante l'utilizzo di testi di riferimento, materiale didattico ed esercitazioni in aula. Inoltre saranno illustrati temi di avanguardia quali l'uso di metodi quantitativi nell'ambito del data science per le scienze umane e sociali.

Capacità di applicare conoscenze e comprensione.

Applicare e discutere gli strumenti più avanzati della statistica e della data sciencea nell'ambito dell'analisi dei dati sperimentali.

Autonomia di giudizio.

Interpretare i dati in modo da formulare conclusioni autonome in ambito quantitativo.

Abilità comunicative.

Comunicare metodi e tecniche per la risoluzione di problemi quantitativi a interlocutori specialisti e non specialisti.

Capacità di apprendimento.

Aver sviluppato le competenze necessarie per intraprendere studi successivi con un alto grado di autonomia.

Le lezioni tradizionali di tipo frontale verranno accompagnate da esercitazioni su argomenti che saranno oggetto della prova d’esame.

Esame scritto con quesiti a risposta multipla ed esercizi. Eventuale progetto.

Introduzione alla scienza statistica

Statistica: descrizioni e inferenze;

Tipi di dati e variabili;

Raccolta dei dati e casualizzazione;

Statistiche descrittive: sintetizzare i dati univariati e multivariati.

 

Distribuzioni di probabilità

Introduzione alla probabilità

Variabili aleatorie e distribuzioni di probabilità

Valori attesi delle variabili aleatorie

Distribuzioni di probabilità discrete

Distribuzioni di probabilità continue

Generazione numeri casuali

Distribuzioni congiunte, condizionate e indipendenza

Correlazione tra variabili aleatorie

 

Distribuzioni campionarie

Le distribuzioni campionarie: distribuzioni di probabilità delle statistiche

Teorema del limite centrale: distribuzione campionaria normale per campioni di grandi dimensioni

 

Inferenza statistica: stima

Stime puntuali e intervalli di confidenza

Funzione di verosimiglianza e stima di massima verosimiglianza

Determinare la dimensione del campione prima di raccogliere i dati

Ricampionamento computazionale e intervalli di confidenza bootstrap

L’approccio bayesiano all’inferenza statistica

 

Inferenza statistica: test di significatività

Test del rapporto di verosimiglianza e intervalli di confidenza

Test non parametrici

 

Classificazione e clustering

Classificazione: analisi discriminante lineare e alberi

Analisi dei cluster

A. Agresti, M. Kateri (2022) Statistica per data scientist, EGEA

Semester
First Semester (dal 18/09/2023 al 12/01/2024)

Exam type
Characterizing

Type of assessment

Course timetable
https://easyroom.unisalento.it/Orario

Parent teaching
Statistics and mathematics for data science (LM81)

Download teaching card (Apre una nuova finestra)(Apre una nuova finestra)