COMPARATIA - METODE DE COMPARATIE NEPARAMETRICE PENTRU 2 ESANTIOANE, PENTRU ESANTIOANE INDEPENDENTE



COMPARATIA

Cand avem probe de comparatie intre 2 esantioane, folosim metode statistice oferite in functie de forma distributiei, care poate fi:

distributie simetrica: metode parametrice

distributie asimetrica:       metode neparametrice (in general pentru multimi reduse de date - grupe mici)

Metodele neparametrice se folosesc pentru esantioane de 2 tipuri:

esantioane independente

esantioane perechi

si metodele difera in functie de aceasta



Putem avea:

design intersubiect:     esantioane independente (proba medianei, test U - Mann-Whitney)

design intrasubiect:     esantioane perechi (proba semnelor, proba Wilcoxon)

METODE DE COMPARATIE NEPARAMETRICE PENTRU 2 EŞ ;ANTIOANE

Comparatia - o folosim cand vrem sa apreciem:

efectul unei experiente

influenta unui factor

METODE DE COMPARATIE PENTRU EŞ ;ANTIOANE INDEPENDENTE

PROBA MEDIANEI

Se utilizeaza cand:

distributia nu respecta criteriile de normalitate

cand avem un numar mare de note (ranguri) egale

Exista 2 cazuri:

a)     Mediana teoretica este o valoare din ansamblul de date

Condensam datele:


inferior medianei

egal

superior medianei

A




B





inferior si egal

Superior



inferior

superior si egal

A




A



B




B



c c

Conditie:

min (c c ) semnificativ

b)     Mediana teoretica NU este o valoare din ansamblul de date ; nu exista in sir


inferior medianei

superior medianei

A

frecvente observate

fo

B

Fo

fo

frecve-e observate - nr. cazuri constatate

c = semnificativ

Corectia lui Yates - se aplica la efective mici in unele casute din tabel:

a. Se aplica daca efectivele sunt mai mici decat 5, si atunci avem:

c =

b. Nu se aplica daca efectivele sunt mai mari decat 5, si atunci avem:

Calculam numai pe baza frecventelor observate:

c =

Gradul de libertate:

df = (c-1)(d-1) - c- coloane, d - randuri

PROBLEMA 1 - proba medianei - cand nu este o valoare a sirului

Doua clase de elevi cu profile diferite, teoretic si uman, au fost evaluate in ceea ce priveste coordonarea manuala.

Se studiaza sa se vada daca elevii proveniti din clasele cu profil real au mai dezvoltate abilitati de coordonare manuala, comparativ cu cei proveniti de la profilurile umaniste.

Rezultate obtinute la cele doua clase:

C.A

x











cotele

f











nr. subiecti

N = 20 (efectiv)

C.B

x











cotele

f











nr. subiecti

N = 16

Coordonarea manuala a fost stabilita cu ajutorul unei probe numite sinusoida cu arc, care a masurat numarul de erori (evaluarea poate fi facuta prin: timpul de parcurgere sau prin numarul de erori).

Variabile independente:

VI: A - profilul elevilor

a1 - real

a2 - uman

VD: X - performanta la coordonare in procesul de coordonare (operationalizata prin nr. de erori)

Design experimental: de baza

A

a1

a2

VD



Ipoteza de cercetare (ipoteza specifica) Hs:

Elevii proveniti de la profilul uman au o performanta mai ridicata in procesul de coordonare in comparatie cu elevii proveniti de la profilul real.

Ipoteza nula (atribuita hazardului):

Diferentele intre performantele elevilor proveniti de profilurile real si uman, in ceea ce priveste coordonarea manuala se datoreaza hazardului.

Avem doua esantioane independente - este o problema de comparatie:

daca distributiile sunt simetrice, atunci folosim metode parametrice: (grad mare de acuratete)

daca nu tinem cont de forma distributiei, atunci folosim metode neparametrice (evaluari mai de ansamblu)

Metode neparametrice:

proba medianei

testul U: mai putem tine cont de rang, dar nu-l putem utiliza atunci cand avem un numar mare de ranguri cu rezultate aproximativ egale (multi subiecti cu rezultate egale)

Avem: 6 subiecti cu cota 1 din totalul de 20

(f - frecventa - ne spune cati sunt)

6 din 20 reprezinta mai mult de 25% din valoarea esantionului - consideram ca avem multe ranguri egale

T folosim proba medianei

Daca esantioanele sunt extrase din aceeasi populatie, atunci media fiecarui esantion trebuie sa fie egala cu media populatiei.


Pasi:

I. Trebuie sa le punem impreuna esantioanele (condensam datele) si calculam ansamblul reunit de date

C.A+C.B

x











f












fc











N = 36
















II. Calculam mediana teoretica a ansamblului de date

locul med. =

loc.med. =  = 18,5: poz. 18 med. =

poz. 19

med. = media valorilor care ocupa pozitiile 18 si 19

pozitiile 17, 18: ocupate de valoarea 3

pozitiile 19, 20 , 21:   ocupate de valoarea 4 (apare de 3 ori)

valoarea care ocupa pozitia 18 este 3

valoarea care ocupa pozitia 19 este 4

mediana teoretica: = 3,5 (pentru Ho admisa)

III. Asezam datele in tabel

ne aflam in situatia in care mediana nu este o valoare a sirului

numaram numarul de subiecti care este:


inferior medianei

superior  medianei


cls. A


a


b

a+b=20

cls. B


c


d

c+d=16


a+c=18

b+d=28


(produsul diagonalei principale - produsul diagonalei secundare)

IV. Calculam c

Suntem in situatia in care avem mai mult de 5 cazuri (numai patru casute in tabel)

Calculam numai pe baza frecventelor observate (13, 5, 7, 11 - frecvente observate)

c =

c =  = 4,0 5

Trebuie sa raportam valoarea obtinuta la tabelul lui c referitor la numarul de grade de libertate

V. Calculam gradul de libertate

df = (c-1)(d-1), unde

df = gradul de libertate

c = coloane

r = randuri

df = (2-1) (2-1) = 1

Ne raportam la valorile critice la pragul de risc de:

p

df






c

Interpretare:

Intrucat valoarea calculata a lui c = 4,0 5 este mai mare decat valoarea critica la pragul de
0 ,0 5 = 3,84, sansele ipotezei nule sunt mai mici de 5%, ceea ce ne permite sa respingem ipoteza nula H0 si sa dam credit ipotezei specifice Hs.

Putem concluziona ca performantele elevilor din clasele cu profil real difera semnificativ fata de performantele elevilor din clasele cu profil uman, dar nu putem spune cum difera.

Daca valoarea lui c ar fi fost de ex. 2,0 5, atunci ea ar fi fost mai mica decat valoarea critica la pragul de 0 ,0 5, iar sansele ipotezei nule H0 ar fi fost mai mari de 5% si atunci nu ne-am fi putut asuma riscul si am fi suspendat decizia.

PROBLEMA 2 - proba medianei - cand este o valoare a sirului

Grup C

x









f









N = 14 (efectiv)

Grup E

x









f









N = 13

I. Condensam datele

C.A+C.B

x









f










fc









N = 27














II. Calculam mediana teoretica a ansamblului de date

locul med. =

loc.med. =  = 14:

mediana ocupa pozitia 14; valoarea care ocupa pozitia 14 este 7 T mediana = 7

III. Condensam datele (asezam datele in tabel)

Ne aflam in situatia in care mediana este o valoare a sirului


inferior medianei

egal

superior medianei

Grup C




Grup E





inferior si egal

superior



inferior

superior si egal

Grup C


a


B


Grup C


a


b

Grup E


c


D


Grup E


c


d

IV. Calculam c

Cu ajutorul corectiei lui Yates (suntem in situatia in care avem mai putin de 5 cazuri) - efective mici

c =            CORECTIA DE CONTINUITATE

c =  = 1,48

c =  = 0 ,90 7

Calculam: min (c c

Trebuie sa raportam valoarea obtinuta la tabelul lui c referitor la numarul de grade de libertate

V. Calculam gradul de libertate

df = (c-1)(d-1)

df = (2-1) (2-1) = 1

Ne raportam la valorile critice la pragul de risc de:

df         p





c

Interpretare:

Intrucat valoarea calculata a lui c2 = 0 ,90 7 este mai mica decat valoarea critica la pragul de
0 ,0 5 = 3,84, sansele ipotezei nule sunt mai mari de 5%, nu ne putem asuma riscul si suspendam decizia.


TESTUL U - MANN-WHITNEY

Se utilizeaza cand:

datele sunt sub forma de ranguri, clasificari

NU tine cont de forma distributiei

se prefera probei medianei pentru ca tine cont de pozitia datelor din clasificare
(tine cont de rangul fiecarui rezultat din clasificare)

Exista 2 cazuri:

a)       N1, N2 < 8

R1, R2 se raporteaza la un  tabel special intocmit de Mann si Whitney

b)      N1, N2 > 8

Se calculeaza variabila normala redusa Z

Z = , unde:

R1(2) - suma rangurilor grupului 1 (2)

N1(2) - efectivele grupului 1,2

Z variabila normala redusa - se raporteaza la valorile distributiei normale

PROBLEMA 3 - testul U pentru efective mai mari de 8



Trebuiesc evaluate efectele pe care le are instruirea programata asupra instruirii elevilor.

Am luat in studiu 2 clase, la care s-au folosit la una metodele traditionale de instruire si la cealalta metode de instruire programata.

CE (experimentala)

x




















f




















N = 27

CE (control)

x





















f





















N = 27

Cea mai mare frecventa a o are scorul 5, si este sub 20 % T folosim testul U

I. Combinam rezultatele celor 2 grupe intr-un ansamblu si le clasificam in ordine crescatoare sau descrescatoare

CC + CE

x






















f






















rang
















































































N = 54

II. Admitem ipoteza nula H0 : cele 2 esantioane sunt selectii intamplatoare din aceeasi colectivitate

a R.gr.exp. = a R.gr. c - suma rangurilor grupului experimental = suma rangurilor grupului de control

(pentru a se confirma Ho Rc=Re - sub Ho)

III. a R.gr.exp. = a rangul cotei (notei)

valorile nule se elimina

x= efectiv (frecventa) cu care apare) in grupa 1


Grupa 1


Grupa 2

x

f

R (rang)

fR


x

f

R

fR





















































































































































































a Rexp = 60 5                       a R c = 880

Efectivele sunt 27 > 8 (N 27>8)

Pentru verificare: Rexp + Rc = N (N+1)/2, unde N = N1 + N2

Re + Rc = 60 5 + 880 = 1.485

N(N+1)/2 = (54×55)/2= 1.485

IV. Se aflam in situatia in care: N1, N2 > 8

Se calculeaza variabila normala redusa Z

Z =

Z =

Z = - 2,38

IzI = 2,38 (valori absolute)

Cota Z se raporteaza la valorile distributiei normale

p

Z





Z = 2,38

Interpretare:

Intrucat valoarea calculata a lui Z este 2,38 , este mai mare decat valoarea critica la pragul de
0 ,0 5 = 1,96, sansele ipotezei nule sunt mai mici de 5%, ceea ce ne permite sa respingem ipoteza nula H0 si sa dam credit ipotezei specifice Hs, ceea ce inseamna ca performantele elevilor difera in functie de metoda de instruire utilizata.


Calcularea testului U Mann - Whitney in SPSS se realizeaza in felul urmator.

Modalitatile variabilei independente se introduc pe aceeasi coloana iar scorurile, adica operationalizarea  variabilei dependente, se va introduce pe alta coloana.

Pentru calcularea coeficientului testului U Mann - Whitney se vor parcurge urmatorii pasi (prezentate in ecranele de mai jos).







Astfel obtinem o analiza descriptiva a datelor, precum valoarea testului U Mann-Whitney Z = 227.0 0 la un p = .0 17 mai mic decat pragul critic de .0 5 prin urmare sansele ipotezei nule sunt mai mici de 5%, ceea ce ne permite sa respingem ipoteza nula H0 si sa dam credit ipotezei specifice Hs, ceea ce inseamna ca performantele elevilor difera in functie de metoda de instruire utilizata.