STATISTICS FOR HIGH DIMENSIONAL DATA AND COMPSTAT LAB | Università degli studi di Bergamo - Didattica e Rubrica

STATISTICS FOR HIGH DIMENSIONAL DATA AND COMPSTAT LAB

Attività formativa monodisciplinare
Codice dell'attività formativa: 
38097

Scheda dell'insegnamento

Per studenti immatricolati al 1° anno a.a.: 
2021/2022
Insegnamento (nome in italiano): 
STATISTICS FOR HIGH DIMENSIONAL DATA AND COMPSTAT LAB
Insegnamento (nome in inglese): 
STATISTICS FOR HIGH DIMENSIONAL DATA AND COMPSTAT LAB
Tipo di attività formativa: 
Attività formativa Affine/Integrativa
Tipo di insegnamento: 
Opzionale
Settore disciplinare: 
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA (SECS-S/02)
Anno di corso: 
2
Anno accademico di offerta: 
2022/2023
Crediti: 
9
Responsabile della didattica: 
Altri docenti: 
Mutuazioni

Altre informazioni sull'insegnamento

Modalità di erogazione: 
Didattica Convenzionale
Ciclo: 
Primo Semestre
Obbligo di frequenza: 
No
Ore di attività frontale: 
72
Ore di studio individuale: 
135
Ambito: 
Attività formative affini o integrative
Prerequisiti

Conoscenze base di probabilità ed inferenza statistica

Obiettivi formativi

L'obiettivo del corso è quello di fornire allo studente i metodi e gli strumenti per analizzare data set spazio-temporali cioè inerenti fenomeni che evolvono nello spazio e nel tempo.
Lo studente imparerà la modellazione statistica utile a descrivere le correlazioni spaziali e temporali inerenti i dati e utile ad effettuare previsioni nello spazio e nel tempo, valutando al contempo l'incertezza della previsione.
Tramite l'utilizzo degli ambienti Matlab e R, lo studente prenderà dimestichezza con i software di stima dei modelli statistici e di previsione spazio-temporale.

Contenuti dell'insegnamento

- Processi stocastici e serie storiche
- Funzione di autocovarianza
- Modelli per serie storiche stazionarie
- Modelli autoregressivi e a media mobile
- Stima dei modelli per serie storiche
- Modelli nello spazio degli stati e filtro di Kalman
- Stima tramite algoritmo EM dei modelli nello spazio degli stati
- Modelli per dati geostatistici
- Modelli gaussiani
- Funzioni di covarianza spaziale
- Modelli lineari generalizzati per dati geostatistici
- Stima parametrica dei modelli per dati geostatistici
- Previsione spaziale (kriging)
- Modelli per dati spazio-temporali
- Stima dei modelli spazio-temporali
- Previsione spazio-temporale

Metodi didattici

Il corso è strutturato in lezioni frontali teoriche in aula e lezioni frontali in laboratorio informatico. Le lezioni in aula affrontano la metodologia statistica mentre le lezioni in laboratorio sono basate sui software Matlab e R. Durante le lezioni in laboratorio gli studenti sono chiamati ad analizzare dataset provenienti da applicazioni reali tramite i metodi visti nelle lezioni teoriche.

Modalità verifica profitto e valutazione

La verifica profitto si basa sulla valutazione dell'output prodotto da un lavoro di gruppo. Nel lavoro di gruppo, svolto in Matlab, R o Python, gli studenti scelgono un dataset e lo analizzano tramite i metodi statistici imparati a lezione. Al gruppo sarà richiesto di presentare il lavoro davanti alla classe e di consegnare un report insieme al codice software implementato.

Prerequisites

Basic knowledge of probability and statistical inference

Educational goals

The aim of the course is to provide the student with the methods and tools to analyze space-time data sets, that is, data sets related to phenomena that evolve in space and time.
The student will learn the statistical modeling useful for describing the spatial and temporal correlations inherent in the data and useful for making predictions in space and time, while evaluating the uncertainty of the predictions.
Through the use of the Matlab and R environments, the student will become familiar with the software for estimating space-time statistical models and for space-time prediction.

Course content

- Stochastic processes and time series
- Autocovariance function
- Models for stationary time series
- Autoregressive and moving average models
- Estimation of time series models
- State space models and Kalman filter
- Estimation of state space models by EM algorithm
- Models for geostatistical data
- Gaussian models
- Spatial covariance functions
- Generalized linear models for geostatistical data
- Parametric estimation of models for geostatistical data
- Spatial prediction (kriging)
- Models for space-time data
- Estimation of space-time models
- Space-time prediction

Teaching methods

The course is structured into lectures in class, in which the context and methodologies are explained, and computer lab sessions (using Matlab and R softwares), in which students apply the methodologies to real-world data sets coming from various fields.

Assessment and Evaluation

Profit assessment is based on the evaluation of the output produced by group work. In the group work, developed using Matlab, R or Python, the students choose a dataset and analyze it using the statistical methods learned in class. The group will be required to present their paper in front of the class and submit the paper and the implemented software code.