Commenti

Regressione semplice (RLS)


In numerosi problemi, il ricercatore affronta due variabili che forniscono la previsione di comportamenti futuri.

Questa previsione può essere raggiunta attraverso uno studio che coinvolge l'equazione della linea di regressione, concepita attraverso il criterio (y, dipendente o risposta) e variabili indipendenti (x, noto anche come prognostico).

È una realtà comune nell'universo della ricerca, che coinvolge variabili come reddito, età, spese, tra molti altri.

Equazione della linea

Y = a1 + a2.x

Dove y è la variabile dipendente e x è la variabile indipendente.

il1 è il valore di y per xe a2.è il valore medio di y per unità x.

La relazione lineare tra le due variabili è misurata dal coefficiente di correlazione (R).

R varia da -1 a 1, dove 1 è la correlazione perfetta e il contrario indica una forte correlazione negativa. I valori vicini a zero indicano una scarsa correlazione.

Nell'esempio seguente, se ci fosse una R alta, y potrebbe essere previsto per eventi futuri.

Y

X

Spese di carburante

Km arrotondati

Reddito personale

Anni di studio

Numeri di difetto della parte

Ore di formazione di qualità

Il calcolo di R è un'operazione molto semplice per software con funzioni statistiche, essendo necessario per approfondire le procedure di calcolo.

In questo tipo di analisi è importante determinare quanto la linea di regressione rappresenta i dati. In questo caso, è necessario calcolare la R2 Pearson o coefficiente di determinazione.

A R2 0,80, l'80% della variabilità deriva da x. Al contrario, si può dire che il 20% della varianza di Y non è attribuibile alle differenze in x.

Per ottenere il test di ipotesi, formuliamo H0 e H.1 come segue:

H0 : p = 0

H1: p ≠ 0

Il calcolo di t viene eseguito attraverso la formula,

Essendo t calcolato maggiore di t tabulato, l'ipotesi nulla viene respinta.

Esempio

Un autista vuole prevedere le spese della sua auto in base alle miglia percorse al mese.

KM

SPESE (R $)

3203

400

3203

400

2603

340

3105

400

1305

150

804

100

1604

200

2706

300

805

100

1903

200

3203

400

3702

450

3203

400

3203

400

803

100

803

100

1102

130

3202

400

1604

150

1603

200

3203

400

3702

450

3403

440

Statistiche di regressione

R multiplo

0,993064678

R-Square

0,986177454

Quadrato a R regolato

0,985519237

Errore standard

127,508336

Osservazioni

23

Guardando la tabella sopra, possiamo vedere una forte correlazione tra le variabili, dove R è molto vicino a 1.

Le miglia guidate spiegano il 98% della varianza della spesa. Avanti: Regressione lineare multipla (RLM)


Video: Topolino e la Spada di Ghiaccio - Arrivo a Ululand (Settembre 2021).