- Human and Social Sciences
- Master's Degree in DATA SCIENCE FOR THE HUMAN AND SOCIAL SCIENCES
- Data Mining
Data Mining
- Teaching in italian
- Data Mining
- Teaching
- Data Mining
- Subject area
- ING-INF/05
- Reference degree course
- DATA SCIENCE FOR THE HUMAN AND SOCIAL SCIENCES
- Course type
- Master's Degree
- Credits
- 8.0
- Teaching hours
- Frontal Hours: 48.0
- Academic year
- 2025/2026
- Year taught
- 2026/2027
- Course year
- 2
- Language
- ITALIAN
- Curriculum
- PERCORSI COMUNE/GENERICO
- Reference professor for teaching
- DEL COCO MARCO
Teaching description
Non sono previsti particolari prerequisiti
Il corso prevede la trattazione dei seguenti argomenti:
- Nozioni fondamentali sull'Analisi dei Dati e Big Data
- Fondamenti di Database Relazionali
- Database Non Relazionali
- Analisi Dati in Python
Conoscenze e comprensione: Gli studenti acquisiranno le seguenti competenza:
· Conoscere i principali strumenti e approcci per l’analisi dei dati
· Comprendere il funzionamento e lútilizzo dei principali algoritmi di data mining e dei vari contesti di applicazione
Capacità di applicare conoscenze e comprensione: : Gli studenti acquisiranno le seguenti competenza:
- Utilizzare i principali algoritmi di machine learning e data mining
- Visualizzare i dati con strumenti di base per la rappresentazione grafica
Capacità di giudizio: Gli studenti sono guidati a sviluppare un approccio critico agli argomenti trattati, confrontando diverse soluzioni a uno stesso problema e imparando a individuare e proporre in modo autonomo l’alternativa più efficace ed efficiente.
Comunicazione: gli studenti devono imparare a comunicare con pubblici eterogenei, comunicando le proprie idee in modo logico, coerente ed efficace.
Lezione frontale, lavori di gruppo
L'esame consiste nella presentazione di un progetto pratico da concordare con il docente.
Classifiers IDM (3, 6)
- Introduzione al problema della classificazione
- Decision Trees
- K-nearest neighbors classifier
- Support Vector Machines
- Bayes and naive Bayes classifiers
- Ensemble classifiers
- The overfitting problem
- Class Imbalance
- Model Evaluation
- Hyperparameter
- Model Selection and Comparison
Neural Network IDM (6)
- Introduction to neural networks.
- The Perceptron.
- Activation and Loss Functions.
- Optimization problem and gradient descent
- Stochastic Gradient Descent
- Multilayer Neural Networks
Time Series Forecasting
- Naive approaches
- RNN
- LSTM
- GRU
- Evaluation procedure
Clustering IDM (5)
- Introduzione al problema del clustering
- Curse of dimensionality
- K-means e K-means++
- Hierarchical clustering
- Density-based clustering (DBSCAN)
- Clusters Evaluation
Recommendation systems MMD(9.1, 9.2, 9.3 9.5)
- Recommendations
- The long tail phenomenon
- Content-based raccomandation
- Collaborative filtering
- The Netflix Challenge
Link analysis MMD(5.1, 5.5)
- Introduction to graph
- PageRank
- Hubs and Authorities
Introduction to Data Mining (2nd Edition) - Pang-Ning Tan, Michael Steinbach, Anuj Karpatne, Vipin Kumar
Python for Data Analysis, (3rd Edition)
Mining of Massive Datasets - Jure Leskovec, Anand Rajaraman, Jeff Ullman
Semester
Second Semester (from 01/03/2027 to 04/06/2027)
Exam type
Optional - Characterizing
Type of assessment
Oral - Final grade