Commenti

Analisi della varianza


L'analisi della varianza è un test statistico diffuso tra gli analisti e mira principalmente a verificare se esiste una differenza significativa tra le medie e se i fattori esercitano influenza su qualsiasi variabile dipendente.

I fattori proposti possono essere di origine qualitativa o quantitativa, ma la variabile dipendente deve essere necessariamente continua.

Poiché si tratta di un test molto diffuso e molti buoni software statistici e fogli di calcolo dispongono delle risorse disponibili, in questo capitolo non verrà approfondito questo metodo e si raccomanda la letteratura specializzata.

L'applicazione principale di ANOVA (analisi della varianza) è il confronto tra medie di diversi gruppi, chiamate anche trattamenti, come medie storiche di problemi di soddisfazione, aziende che operano contemporaneamente con redditi diversi, tra molte altre applicazioni.

Esistono due metodi per il calcolo della varianza: all'interno dei gruppi (MQG) e varianza media (MQR).

In un Anova, vengono calcolati questi due componenti della varianza. Se la varianza calcolata utilizzando la media (MQR) è maggiore della calcolata (MQG) utilizzando i dati appartenenti a ciascun singolo gruppo, ciò può indicare che esiste una differenza significativa tra i gruppi.

Esistono due tipi di problemi da risolvere con Anova: a livelli fissi oa livelli casuali. La casualità ha determinato il problema.

Nella stragrande maggioranza dei casi si tratta di livelli fissi, dopo che tutto il secondo tipo di problema (casuale) sorgerà solo quando si verifica uno studio che coinvolge una scelta casuale di fattori (in 10 lotti di produzione, vengono scelti solo 5 macchinari di produzione su 15). un totale di 20, ad esempio).

Tabella di analisi della varianza o tabella ANOVA

Fonte di variazione

SQ

GDL

MQ

Test F.

Tra i gruppi

SQG

K - 1

GLS

MQG / MQR

All'interno dei gruppi

SQR

N-K

RLS

totale

SQT

N-1

- SQT = SQG + SQR (misura la variazione complessiva di tutte le osservazioni).

- SQT è la somma dei quadrati totali, suddivisa in:

- SQG somma di gruppi quadrati (trattamenti), associati esclusivamente ad un effetto di gruppo

- SQR somma dei quadrati dei residui, dovuta esclusivamente a errore casuale, misurata all'interno di gruppi.

- MQG = media quadrata dei gruppi

- MQR = residuo medio quadrato (tra i gruppi)

- SQG e MQG: misura la variazione totale tra le medie

- SQR e MQR: misurano la variazione delle osservazioni in ciascun gruppo.

f = MQG

RLS

N - 1 = (K - 1) + (N - K)

SQT = SQG + SQR

MQG = SQG (K - 1)

L'ipotesi nulla sarà sempre respinta quando f calcolato è maggiore del valore tabulato. Allo stesso modo, se MQG è maggiore di MQR, l'ipotesi nulla viene respinta.

immagine

Fonte di variazione SQ (somma dei quadrati) GDL (g.l) MQ (media quadrata) Test F

Tra i gruppi

All'interno dei gruppi

totale

Se il test f indica differenze significative tra le medie e i livelli sono fissi, è interessante identificare quali mezzi differiscono l'uno dall'altro.

Calcola la deviazione standard delle medie;

Sx = , dove nc è la somma del numero di ciascuna variabile (gruppo) divisa per il numero di variabili.

Calcola il limite di decisione (ld)

3 x Sx

Ordinare le medie in ordine crescente o decrescente e confrontarle due per due. La differenza sarà significativa se maggiore di Ld.

Se il test f indica differenze significative tra le medie e i livelli sono casuali, è interessante identificare la stima dei componenti della variazione.

Il valore trovato sopra indicherà la variabilità totale tra i gruppi, indicando se è considerato significativo o meno.

Esempio (livelli fissi):

Un ricercatore ha condotto uno studio per vedere quale lavoro ha generato la maggiore soddisfazione dei dipendenti. Per questo, per un mese, sono stati intervistati 10 dipendenti. Alla fine di un mese i dipendenti hanno risposto a un questionario generando un punteggio per il benessere dei dipendenti.

messaggi

funzionari

1

2

3

1

7

5

8

2

8

6

9

3

7

7

8

4

8

6

9

5

9

5

8

6

7

6

8

7

8

7

9

8

6

5

10

9

7

6

8

10

6

6

9

Sommario

gruppo

contare

somma

media

varianza

1

10

73

7,3

0,9

2

10

59

5,9

0,544444

3

10

86

8,6

0,488889

ANOVA

Fonte di variazione

SQ

df

MQ

F

P-value

F critico

Tra gruppi

36,46667

2

18,23

28,29

2,37E-07

3,35

All'interno dei gruppi

17,4

27

0,64

totale

53,86667

29

Poiché f calcolato è maggiore di quello tabulato, l'ipotesi nulla a favore dell'ipotesi alternativa al rischio del 5% viene respinta.

Ci sono differenze significative tra i gruppi. MQG è molto più alto di MQR, indicando una forte varianza tra i gruppi.

1. Calcola la deviazione standard delle medie;

2. Calcola il limite di decisione (Ld)

3 x Sx

3. Ordinare le medie in ordine crescente o decrescente e confrontarle due per due.

5,9

7,3

8,6

x1 - x2 = - 1.4

x1 - x3 = - 2.7

x2 - x3 = - 1.3

Le tre differenze sono più piccole di Ld, quindi si può concludere che i mezzi differiscono l'uno dall'altro. Avanti: Regressione semplice (RLS)