Data Mining

Teaching in italian
Data Mining
Teaching
Data Mining
Subject area
ING-INF/05
Reference degree course
DATA SCIENCE FOR THE HUMAN AND SOCIAL SCIENCES
Course type
Master's Degree
Credits
8.0
Teaching hours
Frontal Hours: 48.0
Academic year
2025/2026
Year taught
2026/2027
Course year
2
Language
ITALIAN
Curriculum
PERCORSI COMUNE/GENERICO
Reference professor for teaching
DEL COCO MARCO

Teaching description

Non sono previsti particolari prerequisiti

Il corso prevede la trattazione dei seguenti argomenti:

  • Nozioni fondamentali sull'Analisi dei Dati e Big Data
  • Fondamenti di Database Relazionali
  • Database Non Relazionali
  • Analisi Dati in Python

Conoscenze e comprensione: Gli studenti acquisiranno le seguenti competenza:

· Conoscere i principali strumenti e approcci per l’analisi dei dati

· Comprendere il funzionamento e lútilizzo dei principali algoritmi di data mining e dei vari contesti di applicazione

 

Capacità di applicare conoscenze e comprensione: : Gli studenti acquisiranno le seguenti competenza:

 

  • Utilizzare i principali algoritmi di machine learning e data mining
  • Visualizzare i dati con strumenti di base per la rappresentazione grafica

 

Capacità di giudizio: Gli studenti sono guidati a sviluppare un approccio critico agli argomenti trattati, confrontando diverse soluzioni a uno stesso problema e imparando a individuare e proporre in modo autonomo l’alternativa più efficace ed efficiente.

 

Comunicazione: gli studenti devono imparare a comunicare con pubblici eterogenei, comunicando le proprie idee in modo logico, coerente ed efficace.

Lezione frontale, lavori di gruppo

L'esame consiste nella presentazione di un progetto pratico da concordare con il docente.

Classifiers IDM (3, 6)

  • Introduzione al problema della classificazione
  • Decision Trees
  • K-nearest neighbors classifier
  • Support Vector Machines
  • Bayes and naive Bayes classifiers
  • Ensemble classifiers
  • The overfitting problem
  • Class Imbalance
  • Model Evaluation
  • Hyperparameter
  • Model Selection and Comparison

Neural Network IDM (6)

  • Introduction to neural networks.
  • The Perceptron.
  • Activation and Loss Functions.
  • Optimization problem and gradient descent
  • Stochastic Gradient Descent
  • Multilayer Neural Networks

Time Series Forecasting

  • Naive approaches
  • RNN
  • LSTM
  • GRU
  • Evaluation procedure

Clustering IDM (5)

  • Introduzione al problema del clustering
  • Curse of dimensionality
  • K-means e K-means++
  • Hierarchical clustering
  • Density-based clustering (DBSCAN)
  • Clusters Evaluation

Recommendation systems MMD(9.1, 9.2, 9.3 9.5)

  • Recommendations
  • The long tail phenomenon
  • Content-based raccomandation
  • Collaborative filtering
  • The Netflix Challenge

Link analysis MMD(5.1, 5.5)

  • Introduction to graph
  • PageRank
  • Hubs and Authorities

Introduction to Data Mining (2nd Edition) - Pang-Ning TanMichael SteinbachAnuj KarpatneVipin Kumar

Python for Data Analysis, (3rd Edition)

Mining of Massive Datasets - Jure LeskovecAnand RajaramanJeff Ullman

Semester
Second Semester (from 01/03/2027 to 04/06/2027)

Exam type
Optional - Characterizing

Type of assessment
Oral - Final grade

Download teaching card (Opens New Window)(Opens New Window)