Conoscenze equivalenti a un corso di Calcolo delle probabilità e inferenza statistica
In particolare è richiesta la conoscenza dei seguenti argomenti:
- Principali distribuzioni di probabilità
- Teorema di Bayes
- Stima e intervalli di confidenza
- Verifica di Ipotesi
In questo corso lo studente sviluppa le conoscenze necessarie a costruire modelli statistici a fini descrittivi, previsivi e di simulazione. In questo ambito impara ad analizzare i dati per comprendere la variabilità, selezionare le variabili e valutare l’incertezza delle corrispondenti previsioni usando un software statistico.
Sviluppa inoltre una significativa esperienza operativa tramite la realizzazione di un lavoro di gruppo su un progetto statistico di interesse per un Ingegnere gestionale, con l’utilizzo di software Matlab o R.
In particolare lo studente entra in contatto con i metodi di analisi delle serie storiche e di previsione statistica utili per descrivere la dinamica temporale di un fenomeno, per prevederne il comportamento futuro a breve termine e per effettuare analisi di scenario e simulazione. Particolare attenzione viene dedicata alla valutazione dell'incertezza di previsione.
Richiami di inferenza statistica.
Dati multivariati e la matrice di varianze-covarianze.
La distribuzione normale multivariata.
Il modello di regressione classico: le ipotesi del modello di regressione classico, stima con il metodo dei minimi quadrati e di massima verosimiglianza.
Previsione statica.
Selezione delle variabili, capacità previsiva, cross-validazione.
Test di ipotesi, test di adattamento, test di specificazione e test diagnostici per modelli di regressione: test di incorrelazione dei residui, test di omoschedasticità, test di normalità, test di ipotesi sui parametri di regressione, test di adattamento.
Modelli di regressione non parametrica e spline. Il modello di regressione con errori autocorrelati e\o eteroschedastici e minimi quadrati generalizzati.
I dati nel tempo e la funzione di autocorrelazione.
Modelli autoregressivi e a media mobile: modelli AR, MA, ARMA.
Stazionarietà e invertibilità dei modelli ARMA, modelli e ARIMA.
Stima dei parametri, problemi di selezione del modello più adatto a descrivere i dati.
La previsione dinamica nei modelli autoregressivi e a media mobile: previsione puntuale e intervallare, previsioni a passo uno e a passo maggiore di uno, confronto della capacità previsiva di differenti modelli.
Modelli di regressione con errori ARMA (regARIMA) e modelli variabili ritardate (ARIMAX), modelli con errori incorrelati ma eteroschedastici.
Modelli nello spazio degli stati: equazioni di stato, equazioni di misura, componenti stocastiche gaussiane, filtraggio, previsione e smoothing. Il problema dei valori iniziali, stima dei parametri incogniti discussione dei casi più rilevanti a fini applicativi.
Gli argomenti di cui sopra saranno collegati ad uno o più data set che verranno usati a) dal docente per illustrare i metodi e b) dallo studente che imparerà a lavorarci tramite Matlab, R o Python.
Lezioni frontali (70%)
Laboratorio con software Matlab o R (30%)
Forte caratterizzazione del corso per il lavoro di gruppo su un progetto di previsione statistica.
- Discussione in gruppo del progetto di fronte alla classe (50%)
- Discussione individuale dei metodi usati nel progetto (50%)
Undergraduate course in Probability and statistical inference
In particular, knowledge of the following topics is required:
- Main probability distributions
- Bayes' theorem
- Estimation and confidence intervals
- Hypothesis testing.
The student develops the knowledge necessary to build statistical models for descriptive, predictive and simulation purposes. They understand how to analyze data and assess the variability, and evaluate the forecasting uncertainty, using statistical software.
They develop significant operational experience through participation in a working group for the development of a statistical project, with the use of Matlab or R software.
In particular, the student works with time series analysis and statistical forecasting methodologies useful for describing time dynamics, predicting future short-term behaviour, and performing scenario and simulation analyses.
Particular attention is given to uncertainty assessment.
Multivariate data and the variance-covariance matrix.
The normal multivariate distribution.
The classical regression model: the hypotheses of the classical regression model, estimation with the least-squares and maximum likelihood method.
Static forecast.
Selection of variables, predictive capacity, cross-validation.
Hypothesis tests, adaptation tests, specification tests and diagnostic tests for regression models: residuals uncorrelation test, homoskedasticity test, normality test, hypothesis test on regression parameters, adaptation test.
Nonparametric and spline regression models. The regression model with autocorrelated and/or heteroskedastic errors and generalized least squares.
Data over time and the autocorrelation function.
Auto-regressive and moving average models: AR, MA, ARMA models.
Stationarity and invertibility of ARMA models, and ARIMA models.
Parameter estimation and model selection.
Model diagnostic and validation.
Dynamic forecasting in the autoregressive and moving average models: point and interval forecasting, one step and multi-step forecasts, comparison of the predictive capacity of different models.
Regression models with ARMA errors (regARIMA) and with delayed variables (ARIMAX), models with uncorrelated but heteroskedastic errors.
State-space models: state equations, measurement equations, Gaussian stochastic components, filtering, prediction and smoothing. The problem of initial values, estimation of unknown parameters discussion of the most relevant cases for application purposes.
The above topics will be linked to one or more data sets that will be used a) by the teacher to illustrate the methods and b) by the student who will learn to work on them through Matlab, R or Python.
Lectures (70%)
Computer Lab (30%)
Participation in a working group for the development of a statistical project,
- Project presentation and discussion in front of the class (50%)
- Individual oral examination on methods used to develop the project (50%)