STATISTICA E MODELLI STOCASTICI (I MODULO) | Università degli studi di Bergamo - Didattica e Rubrica

STATISTICA E MODELLI STOCASTICI (I MODULO)

Modulo Generico
Codice dell'attività formativa: 
21022-1

Scheda dell'insegnamento

Per studenti immatricolati al 1° anno a.a.: 
2020/2021
Insegnamento (nome in italiano): 
STATISTICA E MODELLI STOCASTICI (I MODULO)
Tipo di attività formativa: 
Attività formativa di Base
Tipo di insegnamento: 
Obbligatoria
Settore disciplinare: 
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA (SECS-S/02)
Anno di corso: 
2
Anno accademico di offerta: 
2021/2022
Crediti: 
6
Responsabile della didattica: 

Altre informazioni sull'insegnamento

Modalità di erogazione: 
Didattica Convenzionale
Lingua: 
Italiano
Ciclo: 
Annualità Singola
Obbligo di frequenza: 
No
Ore di attività frontale: 
48
Ambito: 
Matematica, informatica e statistica
Prerequisiti

Conoscenza dell'analisi matematica incluso il calcolo integrale, il calcolo differenziale e le serie.
Nozioni di calcolo matriciale e algebra e integrali multipli.

Obiettivi formativi

Al termine del modulo di Statistica lo studente ha le conoscenze di base del calcolo delle probabilità e dell’inferenza statistica, incluso la teoria della stima, la verifica delle ipotesi ed il modello di regressione.
In particolare sa usare la formula di Bayes, conosce le principali distribuzioni di probabilità continue e discrete. Sa calcolare gli intervalli di confidenza e sa eseguire i test per i più comuni modelli statistici nel caso di dati che provengono dal campionamento casuale semplice. Sa fare inferenza sul modello di regressione.
Sa usare Matlab per affrontare questi problemi.

Contenuti dell'insegnamento

Richiami di insiemistica ed esperimenti causali.
Assiomi e interpretazione della probabilità.
Probabilità condizionata, indipendenza e probabilità totali.
Schemi di campionamento con rimessa e senza rimessa.
Teorema di Bayes.
Variabili casuali discrete in generale, valore atteso, varianza, momenti.
Distribuzioni discrete: uniforme U(k), bernoulliana, Binomiale, ipergeometrica, di Poisson, Geometrica.
Variabili continue in generale, media, varianza e momenti.
Cenni al problema dell'esistenza dei momenti.
Distribuzione Rettangolare in (0,1) ed in (a,b)
La distribuzione normale: definizioni, proprietà, regole di calcolo, momenti, asimmetria e curtosi.
La distribuzione esponenziale negativa, processo di Poisson.
Distribuzione Gamma e legame con chi^2. Media e varianza del chi^2.
Teorema limite centrale per somma e media con esempi di binomiale, rettangolare e Gamma.
Calcolo della varianza della somma di variabili indipendenti.
Proprietà di media campionaria e varianza campionaria.
Statistiche e distribuzioni campionarie: Chiquadro e t di Student"

Introduzione all'Inferenza.
Stima della media, varianza e percentuali.
Teoria generale: nondistorsione, consistenza, efficienza (cenni).
Legge dei grandi numeri.
Cenni su consistenza, efficienza.
Intervalli di confidenza sulla media, sia per varianza nota che ignota.
Determinazione della numerosità campionaria.
Intervalli di confidenza sulla varianza.

Verifica d’ipotesi:
Introduzione ai test, P-value.
Approccio decisionale: Rischi di 1° e 2° tipo.
Potenza di un test.
Test sulla media nota e ignota la varianza.
Nesso fra IC e test.
Test asintotici basati sulla normale.
Test sulla percentuale.
Test sulla varianza.

Covarianza e correlazione.
Modello di regressione e minimi quadrati.
Scomposizione devianza ed R^2.
Test t e Intervalli di confidenza sui coefficienti.
Intervalli di confidenza sulla superficie di risposta e sulle previsioni.

Metodi didattici

Lezioni frontali, esercitazioni in aula ed in elearning.
Laboratori di Matlab.
La frequenza è necessaria.
Per l'esame è richiesto l’uso di Matlab.
Lo studente svolgerà un case study in gruppo, preparando una relazione che presenterà davanti alla classe.

Modalità verifica profitto e valutazione

-----------------
Modalità A
-----------------
Per chi può frequentare e prepararsi con continuità, tramite prove intermedie e svolgimento di un case study di gruppo.

I) Prove intermedie in presenza/a distanza.
- Una prova di autovalutazione da svolgere in autonomia con l'ausilio di Matlab.
- Quattro prove intermedie informatizzate che richiedono l'uso di Matlab.
Le quattro prove intermedie sono superate con una media di almeno 18/30.
I pesi di ciascuna domanda all'interno di un prova sono inizialmente paritetici così come le 4 prove hanno lo stesso peso.
È possibile recuperare la prova valutata col punteggio più basso durante l'appello ordinario;

II) Case study sulla regressione.
Svolgimento in gruppo di un case study sul tema della regressione lineare applicato a un data set fornito dai docenti.
Il paper che illustra il case study svilappato e lo script Matlab (.m) con i conti svolti vanno consegnati prima dell’orale.
Maggiori dettagli saranno forniti entro dicembre.

III) Presentazione e discussione a distanza del case study.
Presentazione di gruppo davanti alla classe e discussione su contenuti, risultati e metodologie utilizzate.
Ciascuno membro del gruppo deve rispondere anche ad una domanda teorica, valida per l'orale, inerente i metodi usati nel case study.
Nel caso di insufficienza alla domanda teorica, lo studente deve sostenere la prova orale, vedi punto IV).
Tutta la classe partecipa alla discussione di ciascun gruppo.

IV) Prova orale
Chi non presenta il lavoro di gruppo di cui alla modalità III) sostiene una prova orale finale che verte sui contenuti teorici e sul paper sviluppato in gruppo.

V) Gruppi.
Per svolgere il case study di cui sopra, gli studenti si aggregano in gruppi Ilias di quattro persone.
Ogni gruppo ha a disposizione un proprio repository ed un proprio forum per il lavoro a distanza.
Il case study viene caricato da un rappresentante designato dal gruppo seguendo le modalità che saranno indicate nell'apposita sezione di Ilias.

VI) Voto finale.
Il voto finale è ottenuto come media pesata tra il voto delle prove intermedie di cui al punto I) e quello della prova orale di cui ai punti III) o IV).
I pesi sono i seguenti:
- 50% per le quattro prove intermedie
- 50% per la prova orale

-----------------
Modalità B
-----------------
In appello ordinario con un'unica prova informatizzata ed un orale nello stesso appello.
La preparazione richiesta prevede la capacità sia di svolgere lo scritto con l'uso di Matlab che l'orale. La prova orale verte sulla discussione dei metodi trattati nel corso e valuta la comprensione del linguaggio, del formalismo e dei concetti a livello descrittivo ed interpretativo. Si veda a titolo di esempio l'elenco delle domande sottoriportate.

Prerequisites

Mathematical Analysis: Calculus, including derivatives and integrals.
Notions about matrix algebra and multiple integrals.

Educational goals

After this module, the student knows elements of applied probability theory, including discrete and continuous random variables and elements of statistical inference, including estimation, confidence intervals, hypothesis testing and regression models.
He/She is able to use Matlab to solve these problems.

Course content

Part 1 - Statistics

Random experiments.
Introduction to probability.
Conditional Probability, independence.
Bayes' theorem.
Discrete Random Variables. Expectation, variance, moments.
Bernoulli, Binomial, Hypergeometric, Poisson and Geometric distributions.
Continuous random variables. Existence of moments.
Uniform, Gaussian, Negative Exponential, Gamma, Chi-square distribution.
Poisson process.
Central limit theorem.

Statistical inference.
Estimation: unbiasedness, consistency and efficiency.
Sample mean, percentage and variance.
Laws of large numbers.
Confidence Intervals.

Test of Hypoteses: P-value.
Decision approach: 1st and 2nd type errors.
Significance and power.
Testing the mean and asymptotically Gaussian tests.
Testing for a percentage.
Testing for a variance.

Covariance and correlation.
Least squares and regression.
ANOVA of regression and determination coefficient.
Tests and Confidence Intervals for regression coefficients.
Confidence Intervals for responce surface.
Confidence Intervals for regression forecasts.

Teaching methods

Lectures, exercises and elearning.
Lab for Matlab.
A case study developed in group work.

Assessment and Evaluation

-----------------
Mode A
-----------------
For those who can attend and prepare continuously, through intermediate tests, group case studies and active participation in the forums.

I) Intermediate tests in presence/remote.
- A self-assessment test to be carried out independently with the help of Matlab.
- Four intermediate computerized tests that require the use of Matlab.
The four intermediate tests are passed with an average of at least 18/30.
The weights of each question within a test are initially equal as the 4 tests have the same weight.
It is possible to recover the test evaluated with the lowest score during the ordinary session;

II) Case study on regression.
Group carrying out of a case study on the topic of linear regression applied to a data set provided by the teachers.
The paper illustrating the developed case study and the Matlab (.m) script with the accounts carried out must be delivered before the oral exam.
More details will be provided by December.

III) Remote presentation and discussion of the case study.
Group presentation in front of the class and discussion on contents, results and methodologies used.
Each member of the group must also answer a theoretical question, valid for the oral exam, concerning the methods used in the case study.
In case of an insufficient theoretical answer, the student must take the oral exam, see point IV).
The whole class participates in the discussion of each group.

IV) Oral exam
Those who do not present the group work referred to in modality III) sustain a final oral exam that focuses on the theoretical contents and on the paper developed in the group.

V) Groups.
To carry out the above case study, students aggregate into Ilias groups of four people.
Each group has its own repository and its own remote working forum.
The case study is uploaded by a representative designated by the group following the procedures that will be indicated in the specific section of Ilias.

VI) Final grade.
The final grade is obtained as a weighted average between the grade of the intermediate tests referred to in point I) and that of the oral exam referred to in points III) or IV).
The weights are as follows:
- 50% for the four intermediate tests
- 50% for the oral exam
-----------------
Mode B
-----------------
In ordinary exam sessions with a single computerized test and an oral exam in the same appeal.
The required preparation includes the ability to carry out both the computations with Matlab and the oral exam. The oral exam focuses on the discussion of the methods covered in the course and evaluates the understanding of language, formalism and concepts