MODULO DI STATISTICA | Università degli studi di Bergamo - Didattica e Rubrica

MODULO DI STATISTICA

Modulo Generico
Codice dell'attività formativa: 
20111-1

Scheda dell'insegnamento

Per studenti immatricolati al 1° anno a.a.: 
2021/2022
Insegnamento (nome in italiano): 
MODULO DI STATISTICA
Tipo di attività formativa: 
Attività formativa di Base
Tipo di insegnamento: 
Obbligatoria
Settore disciplinare: 
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA (SECS-S/02)
Anno di corso: 
2
Anno accademico di offerta: 
2022/2023
Crediti: 
6
Responsabile della didattica: 
Mutuazioni
  • Corso di studi in INGEGNERIA DELLE TECNOLOGIE PER L'EDILIZIA - Percorso formativo in PERCORSO GENERICO

Altre informazioni sull'insegnamento

Ciclo: 
Annualità Singola
Obbligo di frequenza: 
No
Ore di attività frontale: 
48
Ore di studio individuale: 
90
Ambito: 
Formazione scientifica di base
Prerequisiti

E' necessario conoscere l'analisi matematica incluso il calcolo integrale, il calcolo differenziale e le serie.
Sono molto utili anche nozioni di calcolo matriciale e algebra e integrali multipli.
Perciò e fortemente consigliato fare gli esami di Analisi Matematica I e Geometria e algebra lineare prima di Statistica.

Obiettivi formativi

Al termine del modulo di Statistica lo studente ha le conoscenze di base del calcolo delle probabilità e dell’inferenza statistica, incluso la teoria della stima, la verifica delle ipotesi ed il modello id regressione. In particolare sa usare la formula di Bayes, conosce le principali distribuzioni di probabilità continue e discrete. Sa calcolare gli intervalli di confidenza e sa eseguire i test per i più comuni modelli statistici nel caso di dati che provengono dal campionamento casuale semplice. Sa fare inferenza sulla retta di regressione. Sa usare Excel per svolgere i conti relativi ai punti di cui sopra.

Contenuti dell'insegnamento

Richiami di insiemistica ed esperimenti causali.
Assiomi e interpretazione della probabilità.
Probabilità condizionata, indipendenza e probabilità totali.
Schemi di campionamento con rimessa e senza rimessa.
Teorema di Bayes.
Variabili casuali discrete in generale, valore atteso, varianza, momenti.
Distribuzione discreta uniforme U(k), bernoulliana, binomiale, ipergeometrica e Poisson.
Variabili continue in generale, media, varianza e momenti.
Cenni al problema dell'esistenza dei momenti.
Distribuzione rettangolare in (0,1) ed in (a,b)
La distribuzione normale: definizioni, proprietà, regole di calcolo, momenti, asimmetria e curtosi.
La distribuzione esponenziale negativa, processo di Poisson.
Distribuzione gamma e legame con chi^2. Media e varianza del chi^2.
Teorema limite centrale per somma e media con esempi su somme di binomiali, rettangolari e gamma.
Calcolo della varianza della somma di variabili indipendenti.
Proprietà di media campionaria e varianza campionaria.
Statistiche e distribuzioni campionarie: Chiquadro e t di Student"

Introduzione all'inferenza.
Stima della media, della varianza e della percentuale.
Teoria generale: nondistorsione, consistenza, efficienza (cenni).
Legge dei grandi numeri.
Cenni su consistenza ed efficienza.
Intervalli di confidenza (IC) sulla media, sia per varianza nota che ignota.
Determinazione della numerosità campionaria.
Intervalli di confidenza sulla varianza.

Verifica d’ipotesi:
Introduzione ai test, P-value.
Approccio decisionale: Rischi di 1° e 2° tipo.
Potenza di un test.
Test sulla media nota e ignota la varianza.
Nesso fra IC e test.
Test asintotici basati sulla normale.
Test sulla percentuale.
Test sulla varianza.

Covarianza e correlazione.
Retta di regressione e minimi quadrati.
Cenni sulla regressione multipla.
Scomposizione devianza ed R^2.
Test t e IC sui coefficienti.
IC sulla superficie di risposta e sulle previsioni

Metodi didattici

Lezioni frontali, esercitazioni in aula ed in elearning.
Laboratori con Excel.
La frequenza è indispensabile per le prove intermedie.
Per l'esame è richiesto l’uso di Excel.
Lo studente svolgerà un case study in gruppo, preparando una relazione che presenterà davanti alla classe.

Modalità verifica profitto e valutazione

-----------------
Modalità A
-----------------
Per chi può frequentare e prepararsi con continuità, tramite prove intermedie e un case study di gruppo.

I) Prove intermedie.
- Una prova di autovalutazione da svolgere in autonomia con l'ausilio di Excel.
- Quattro prove intermedie informatizzate che richiedono l'uso di Excel.
L'insieme delle quattro prove intermedie è superato con una media di almeno 18/30.
I pesi di ciascuna domanda all'interno di un prova sono inizialmente paritetici così come le 4 prove hanno lo stesso peso.
È possibile recuperare la prova valutata col punteggio più basso durante l'appello ordinario;

II) Case study sulla regressione.
Svolgimento in gruppo e presentazione di un case study sul tema della regressione lineare applicato a un data set fornito dai docenti.
Il paper che illustra il case study sviluppato e il foglio Excel con i conti svolti va consegnato prima dell’appello in data fissata durate il semestre.
Maggiori dettagli saranno forniti entro dicembre nell'apposita sezione in Ilias.

III) Presentazione e discussione in presenza/a distanza del case study.
Presentazione di gruppo davanti alla classe e discussione su contenuti, risultati e metodologie utilizzate.
Ciascuno membro del gruppo deve rispondere anche ad una domanda teorica, valida per l'orale, inerente i metodi usati nel case study.
Nel caso di insufficienza alla domanda teorica, lo studente deve sostenere la prova orale, vedi punto IV).
Tutti gli studenti partecipano alla discussione di ciascun gruppo.

IV) Prova orale
Chi non presenta il lavoro di gruppo di cui alla modalità III) sostiene una prova orale finale che verte sui contenuti teorici e sul paper sviluppato in gruppo.

V) Gruppi.
Per svolgere il case study di cui sopra, gli studenti si aggregano in gruppi Ilias di quattro persone.
Ogni gruppo ha a disposizione un proprio repository ed un proprio forum per il lavoro a distanza.
Il case study viene caricato da un rappresentante designato dal gruppo seguendo le modalità che saranno indicate durante il corso.

VI) Voto finale.
Il voto finale è ottenuto come media pesata tra il voto delle prove intermedie di cui al punto I), entrambe sufficienti, e quello della prova orale di cui ai punti III) o IV).
I pesi sono i seguenti:
- 40% per le quattro prove intermedie
- 60% per la prova orale

-----------------
Modalità B
-----------------
In appello ordinario con un'unica prova informatizzata ed un orale nello stesso appello.
La preparazione richiesta prevede la capacità sia di svolgere i conti dello scritto con l'uso di Excel che trattare gli argomenti teorici dell'orale. La prova orale verte sulla discussione dei metodi trattati nel corso e valuta la comprensione del linguaggio, del formalismo e dei concetti a livello descrittivo ed interpretativo. Sulla pagina dell’elearning è disponibile a titolo di esempio un elenco non esaustivo di domande possibili.

Altre informazioni
Prerequisites

Concepts of Mathematical Analysis, Calculus including derivatives, integrals and series are extensively used.
Moreover, notions about matrix algebra and multiple integrals are also used.

Educational goals

The student obtains elements of applied probability theory, including discrete and continuous random variables and elements of statistical inference, including estimation, hypothesis testing and simple regression analysis. They are able to use excel to perform related computations.

Course content

Random experiments.
Introduction to probability.
Conditional probability, independence.
Bayes' theorem.
Discrete random variables. Expectation, variance, moments.
Bernoulli, Binomial, Hypergeometric, Poisson and Geometric distributions.
Continuous random variables.
Existence of moments.
Uniform, Gaussian, Negative exponential, Gamma, Chi-square distribution.
Poisson process.
Central limit theorem.

Statistical inference.
Estimation: unbiasedness, consistency and efficiency.
Sample mean, percentage and variance.
Laws of large numbers.
Confidence Intervals.

Test of Hypoteses: P-value,
Neymann-Pearson approach: 1st and 2nd type errors.
Significance and power.
Testing the mean and asymptotically Gaussian tests.
Testing a percentage.
Testing variance.

Covariance and correlation.
Least squares and regression.
ANOVA of regression and determination coefficient
Tests and Confidence Intervals for regression coefficients.
Confidence Intervals for regerssion expected values.
Confidence Intervals for regression forecasts.

Teaching methods

Classroom lectures and tutorials using Excel.
A case study developed in group work and presented in front of the class.

Assessment and Evaluation

-----------------
Mode A
-----------------
For those who can attend and prepare continuously, through intermediate tests and a group case study.

I) Intermediate tests.
- A self-assessment test to be carried out independently with the help of Excel.
- Four computerized intermediate tests that require the use of Excel.
The four intermediate tests are passed with an average of at least 18/30.
The weights of each question within a test are initially equal as the 4 tests have the same weight.
It is possible to recover the test evaluated with the lowest score during the ordinary session;

II) Case study on regression.
Development in a group and presentation of a case study on the topic of linear regression applied to a data set provided by the teachers.
The paper that illustrates the case study developed and the excel sheet with the computations carried out must be delivered well before the exam.
More details will be provided by December.

III) Present / remote presentation and discussion of the case study.
Group presentation in front of the class and discussion on contents, results and methodologies used.
Each member of the group must also answer a theoretical question, valid for the oral exam, concerning the methods used in the case study.
In case of an insufficient theoretical question, the student must take the oral exam, see point IV).
All students participate in the discussion of the other groups and intervene with questions.

IV) Oral exam
Those who do not present the group work referred to in modality III) sustain a final oral exam that focuses on the theoretical contents and on the paper developed in the group.

V) Groups.
To carry out the above case study, students aggregate into Ilias groups of four people.
Each group has its own repository and its own remote working forum.
The case study is uploaded by a representative designated by the group following the procedures that will be indicated in the specific section of Ilias.

VI) Final grade.
After I) and IV) are passed, the final grade is obtained as a weighted average between the grade of the intermediate tests referred to in point I) and that of the oral exam referred to in points III) or IV).
The weights are as follows:
- 40% for the four intermediate tests
- 60% for the oral exam

-----------------
Mode B
-----------------
In ordinary exam sessions with a single computerized test and an oral exam in the same appeal.
The required preparation includes the ability to do statistical computations with the use of Excel and to show a theoretical understanding. The oral exam focuses on the discussion of the methods covered in the course and evaluates the understanding of language, formalism and concepts at a descriptive and interpretative level. A non-exhaustive list of possible questions is available as an example on the e-learning page.