Conoscenza dell'analisi matematica incluso il calcolo integrale, il calcolo differenziale e le serie.
Nozioni di calcolo matriciale e algebra e integrali multipli.
Al termine del corso di Statistica lo studente ha le conoscenze di base del calcolo delle probabilità e dell’inferenza statistica, incluso la teoria della stima, la verifica delle ipotesi ed il modello di regressione.
In particolare sa usare la formula di Bayes, conosce le principali distribuzioni di probabilità continue e discrete. Sa calcolare gli intervalli di confidenza e sa eseguire i test per i più comuni modelli statistici nel caso di dati che provengono dal campionamento casuale semplice. Sa fare inferenza sul modello di regressione lineare e su modelli non lineari come spline e reti neurali.
Sa usare Matlab o R per affrontare questi problemi.
Richiami di insiemistica ed esperimenti causali.
Assiomi e interpretazione della probabilità.
Probabilità condizionata, indipendenza e probabilità totali.
Schemi di campionamento con rimessa e senza rimessa.
Teorema di Bayes.
Variabili casuali discrete in generale, valore atteso, varianza, momenti.
Distribuzioni discrete: uniforme U(k), bernoulliana, Binomiale, ipergeometrica, di Poisson, Geometrica.
Variabili continue in generale, media, varianza e momenti.
Cenni al problema dell'esistenza dei momenti.
Distribuzione Rettangolare in (0,1) ed in (a,b)
La distribuzione normale: definizioni, proprietà, regole di calcolo, momenti, asimmetria e curtosi.
La distribuzione esponenziale negativa, processo di Poisson.
Distribuzione Gamma e legame con chi^2. Media e varianza del chi^2.
Teorema limite centrale per somma e media con esempi di binomiale, rettangolare e Gamma.
Calcolo della varianza della somma di variabili indipendenti.
Proprietà di media campionaria e varianza campionaria.
Statistiche e distribuzioni campionarie: Chiquadro e t di Student"
Introduzione all'Inferenza.
Stima della media, varianza e percentuali.
Teoria generale: nondistorsione, consistenza, efficienza (cenni).
Legge dei grandi numeri.
Cenni su consistenza, efficienza.
Intervalli di confidenza sulla media, sia per varianza nota che ignota.
Determinazione della numerosità campionaria.
Intervalli di confidenza sulla varianza.
Verifica d’ipotesi:
Introduzione ai test, P-value.
Approccio decisionale: Rischi di 1° e 2° tipo.
Potenza di un test.
Test sulla media nota e ignota la varianza.
Nesso fra IC e test.
Test asintotici basati sulla normale.
Test sulla percentuale.
Test sulla varianza.
Covarianza e correlazione.
Modello di regressione e minimi quadrati.
Scomposizione devianza ed R^2.
Test t e Intervalli di confidenza sui coefficienti.
Intervalli di confidenza sulla superficie di risposta e sulle previsioni.
Modelli lineari generalizzati.
Cenni a modelli non lineari, splines e reti neurali.
Tecniche di model selection, cross-validazione e bootstrap.
Analisi dei residui e testing del modello.
Lezioni frontali ed esercitazioni.
Laboratori di Matlab.
La frequenza è necessaria.
Per l'esame è richiesto l’uso di Matlab/R.
Lo studente svolgerà un case study in gruppo, preparando una relazione che presenterà davanti alla classe.
-----------------
Modalità A
-----------------
Per chi può frequentare e prepararsi con continuità, tramite prove intermedie e svolgimento di un case study di gruppo.
I) Prove intermedie.
- Una prova di autovalutazione in ambiente R
- Quattro prove intermedie informatizzate che richiedono l'uso di R.
L'insieme delle quattro prove intermedie è superato con una media di almeno 18/30.
I pesi di ciascuna domanda all'interno di un prova sono inizialmente paritetici così come le 4 prove hanno lo stesso peso.
È possibile recuperare la prova valutata col punteggio più basso durante l'appello ordinario;
II) Case study sulla regressione.
Svolgimento in gruppo di un case study sul tema della regressione applicato a un data set fornito dai docenti.
Il paper che illustra il case study sviluppato e lo script R con i conti svolti vanno consegnati prima dell’orale.
Maggiori dettagli saranno forniti entro dicembre.
III) Presentazione e discussione del case study.
Presentazione di gruppo davanti alla classe e discussione su contenuti, risultati e metodologie utilizzate.
Ciascuno membro del gruppo deve rispondere anche ad una domanda teorica, valida per l'orale, inerente i metodi usati nel case study.
Nel caso di insufficienza alla domanda teorica, lo studente deve sostenere la prova orale, vedi punto IV).
Tutta la classe partecipa alla discussione di ciascun gruppo.
IV) Prova orale
Chi non presenta il lavoro di gruppo di cui alla modalità III) sostiene una prova orale finale che verte sui contenuti teorici e sul paper sviluppato in gruppo.
V) Gruppi.
Per svolgere il case study di cui sopra, gli studenti si aggregano in gruppi di quattro persone.
Il case study viene caricato seguendo le modalità che saranno indicate nel corso.
VI) Voto finale.
Il voto finale è ottenuto come media pesata tra il voto delle prove intermedie di cui al punto I) e quello della prova orale di cui ai punti III) o IV).
I pesi sono i seguenti:
- 40% per le quattro prove intermedie
- 60% per la prova orale
-----------------
Modalità B
-----------------
In appello ordinario con un'unica prova informatizzata ed un orale nello stesso appello.
La preparazione richiesta prevede la capacità sia di svolgere lo scritto con l'uso di Matlab che l'orale. La prova orale verte sulla discussione dei metodi trattati nel corso e valuta la comprensione del linguaggio, del formalismo e dei concetti a livello descrittivo ed interpretativo. Si veda a titolo di esempio l'elenco delle domande sottoriportate.
Materiale didattico:
https://teams.microsoft.com/l/team/19%3aeGK7mpgub7kEINHvh4MaLtUC7lZoplW3...
Mathematical Analysis: Calculus, including derivatives and integrals.
Notions about matrix algebra and multiple integrals.
After this course, the student knows elements of applied probability theory, including discrete and continuous random variables and elements of statistical inference, including estimation, confidence intervals, hypothesis testing and regression models, including the linear case, splines and neural networks.
They are able to use Matlab or R to solve these problems.
Random experiments.
Introduction to probability.
Conditional Probability, independence.
Bayes' theorem.
Discrete Random Variables. Expectation, variance, moments.
Bernoulli, Binomial, Hypergeometric, Poisson and Geometric distributions.
Continuous random variables. Existence of moments.
Uniform, Gaussian, Negative Exponential, Gamma, Chi-square distribution.
Poisson process.
Central limit theorem.
Statistical inference.
Estimation: unbiasedness, consistency and efficiency.
The sample mean, percentage and variance.
Laws of large numbers.
Confidence Intervals.
Test of Hypoteses: P-value.
Decision approach: 1st and 2nd type errors.
Significance and power.
Testing the mean and asymptotically Gaussian tests.
Testing for a percentage.
Testing for a variance.
Covariance and correlation.
Least squares and regression.
ANOVA of regression and determination coefficient.
Tests and Confidence Intervals for regression coefficients.
Confidence Intervals for response surface.
Confidence Intervals for regression forecasts.
Generalised linear models.
Outline of non-linear regression models, splines and neural networks.
Model selection, cross-validation, residual analysis and model testing.
Lectures and exercises.
Lab for Matlab/R.
A case study developed in group work.
-----------------
Mode A
-----------------
For those who can attend and prepare continuously, through intermediate tests, and a group case study.
I) Intermediate tests in presence.
- A self-assessment test on R software.
- Four intermediate computerized tests that require the use of R.
The four intermediate tests are passed with an average of at least 18/30.
The weights of each question within a test are initially equal and the 4 tests have the same weight.
It is possible to recover the test evaluated with the lowest score during the ordinary session.
II) Case study on regression.
Groups carry out a case study on linear regression applied to a data set provided by the instructors.
The paper illustrating the developed case study and the R scripts must be delivered before the oral exam.
More details will be provided by December.
III) Remote presentation and discussion of the case study.
Group presentation in front of the class and discussion on contents, results and methodologies used.
Each group member must also answer a theoretical question, valid for the oral exam, concerning the methods used in the case study.
In case of an insufficient theoretical answer, the student must take the oral exam, see point IV).
The whole class participates in the discussion of each group.
IV) Oral exam
Those who do not present the group work referred to in modality III) sustain a final oral exam that focuses on the theoretical contents and the paper developed in group.
V) Groups.
To carry out the above case study, students aggregate into groups of four.
VI) Final grade.
After passing the above exams, the final grade is obtained as a weighted average between the grade of the intermediate tests referred to in point I) and that of the oral exam referred to in points III) or IV).
The weights are as follows:
- 40% for the four intermediate tests
- 60% for the oral exam
-----------------
Mode B
-----------------
In ordinary exam sessions: a single computerized test and an oral exam in the same exam session.
The necessary preparation includes the ability to carry out both the computations with R and the oral exam. The oral exam discusses the course's methods and evaluates the understanding of language, formalism and concepts.