este o evaluare cantitativă a studiului statistic al relației dintre fenomene, utilizată în metode neparametrice.

Indicatorul arată modul în care suma diferențelor pătrate dintre rangurile obținute în timpul observării diferă de cazul lipsei conexiunii.

Scopul serviciului. Folosind acest calculator online puteți:

  • calculul coeficientului de corelare a rangului lui Spearman;
  • calcul interval de încredere pentru coeficientul și evaluarea semnificației acestuia;

Coeficientul de corelare a rangului lui Spearman se referă la indicatori pentru evaluarea gradului de apropiere a comunicării. Caracteristica calitativă a strângerii conexiunii a coeficientului de corelație de rang, precum și a altor coeficienți de corelație, poate fi evaluată cu ajutorul scalei Chaddock.

Calculul coeficientului constă din următorii pași:

Proprietățile coeficientului de corelație a rangului lui Spearman

Zona de aplicare. Coeficientul de corelare a rangului folosit pentru a evalua calitatea comunicarii intre doua populatii. În plus, semnificația sa statistică este utilizată atunci când se analizează datele pentru heteroskedasticitate.

Exemplu. Pe baza unui eșantion de variabile observate X și Y:

  1. creați un tabel de clasare;
  2. găsiți coeficientul de corelare a rangului lui Spearman și verificați semnificația acestuia la nivelul 2a
  3. evaluează natura dependenței
Soluţie. Să atribuim ranguri caracteristicii Y și factorului X.
XYrangul X, d xrangul Y, d y
28 21 1 1
30 25 2 2
36 29 4 3
40 31 5 4
30 32 3 5
46 34 6 6
56 35 8 7
54 38 7 8
60 39 10 9
56 41 9 10
60 42 11 11
68 44 12 12
70 46 13 13
76 50 14 14

Matricea de rang.
rangul X, d xrangul Y, d y(d x - d y) 2
1 1 0
2 2 0
4 3 1
5 4 1
3 5 4
6 6 0
8 7 1
7 8 1
10 9 1
9 10 1
11 11 0
12 12 0
13 13 0
14 14 0
105 105 10

Verificarea corectitudinii matricei pe baza calculului sumei de control:

Suma coloanelor matricei este egală între ele și suma de control, ceea ce înseamnă că matricea este compusă corect.
Folosind formula, calculăm coeficientul de corelare a rangului Spearman.


Relația dintre trăsătura Y și factorul X este puternică și directă
Semnificația coeficientului de corelare a rangului lui Spearman
Pentru a testa ipoteza nulă la nivelul de semnificație α, coeficientul general de corelație a rangului Spearman este egal cu zero în ipoteza concurentă Hi. p ≠ 0, trebuie să calculăm punctul critic:

unde n este dimensiunea eșantionului; ρ - eșantionul de coeficient de corelație a rangului Spearman: t(α, k) - punctul critic al regiunii critice cu două fețe, care se găsește din tabel puncte critice Distribuția lui Student, în funcție de nivelul de semnificație α și numărul de grade de libertate k = n-2.
Dacă |p|< Т kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками не значима. Если |p| >T kp - ipoteza nulă este respinsă. Există o corelație semnificativă de rang între caracteristicile calitative.
Folosind tabelul lui Student găsim t(α/2, k) = (0,1/2;12) = 1,782

Din moment ce T kp< ρ , то отклоняем гипотезу о равенстве 0 коэффициента ранговой корреляции Спирмена. Другими словами, коэффициент ранговой корреляции статистически - значим и ранговая корреляционная связь между оценками по двум тестам значимая.

Scurtă teorie

Corelația de rang este o metodă de analiză a corelațiilor care reflectă relațiile variabilelor ordonate după valoare crescătoare.

Rangurile sunt numerele de serie ale unităților agregate dintr-o serie clasificată. Dacă clasificăm o populație în funcție de două caracteristici, relația dintre care este studiată, atunci coincidența completă a rangurilor înseamnă cea mai apropiată conexiune directă posibilă, iar opusul complet al rangurilor înseamnă cel mai apropiat feedback posibil. Este necesar să clasați ambele caracteristici în aceeași ordine: fie de la valori mai mici ale caracteristicii la cele mai mari, fie invers.

În scopuri practice, utilizarea corelației de rang este foarte utilă. De exemplu, dacă se stabilește o corelație de rang înalt între două caracteristici calitative ale produselor, atunci este suficient să controlezi produsele doar prin una dintre caracteristici, ceea ce reduce costul și accelerează controlul.

Coeficientul de corelație de rang, propus de K. Spearman, se referă la o măsură neparametrică a relației dintre variabile măsurate pe o scară de rang. La calcularea acestui coeficient, nu sunt necesare ipoteze cu privire la natura distribuțiilor caracteristicilor în populație. Acest coeficient determină gradul de apropiere a conexiunii dintre caracteristicile ordinale, care în acest caz reprezintă rangurile mărimilor comparate.

Valoarea coeficientului de corelație Spearman se află în intervalul +1 și -1. Poate fi pozitiv sau negativ, caracterizând direcția relației dintre două caracteristici măsurate pe o scară de rang.

Coeficientul de corelare a rangului lui Spearman este calculat folosind formula:

Diferența dintre ranguri pe două variabile

numărul de perechi potrivite

Primul pas în calcularea coeficientului de corelare a rangului este ierarhizarea seriei de variabile. Procedura de clasare începe prin aranjarea variabilelor în ordinea crescătoare a valorilor lor. Diferite valori sunt atribuite ranguri, notate numere naturale. Dacă există mai multe variabile de valoare egală, li se atribuie un rang mediu.

Avantajul coeficientului de corelare a rangului Spearman este că este posibilă clasarea în funcție de caracteristici care nu pot fi exprimate numeric: este posibilă clasarea candidaților pentru o anumită poziție după nivelul profesional, după capacitatea de a conduce o echipă, după farmecul personal etc. Cu evaluările experților este posibil să ierarhizeze evaluările diferiților experți și să găsească corelațiile acestora între ei, pentru a exclude apoi din considerare aprecierile experților care sunt slab corelate cu evaluările altor experți. Coeficientul de corelare a rangului lui Spearman este utilizat pentru a evalua stabilitatea tendinței. Dezavantajul coeficientului de corelare a rangului este că aceleași diferențe de ranguri pot corespunde unor diferențe complet diferite ale valorilor caracteristicilor (în cazul caracteristicilor cantitative). Prin urmare, pentru acestea din urmă, corelarea rangurilor ar trebui considerată o măsură aproximativă a strângerii conexiunii, care are mai puțin conținut informațional decât coeficientul de corelație. valori numerice semne.

Exemplu de rezolvare a problemei

Sarcina

Un sondaj pe 10 studenți selectați aleatoriu care locuiesc într-un cămin universitar dezvăluie relația dintre scorul mediu din sesiunea anterioară și numărul de ore pe săptămână petrecute de student pentru studii independente.

Determinați puterea relației folosind coeficientul de corelare a rangului Spearman.

Dacă întâmpinați dificultăți în rezolvarea problemelor, site-ul oferă ajutor online studenților la statistică cu teste sau examene acasă.

Rezolvarea problemei

Să calculăm coeficientul de corelație de rang.

Variind Comparație de rang Diferența de rang 1 26 4.7 8 1 3.1 1 8 10 -2 4 2 22 4.4 10 2 3.6 2 7 9 -2 4 3 8 3.8 12 3 3.7 3 1 4 -3 9 4 12 3.7 15 4 3.8 4 3 3 0 0 5 15 4.2 17 5 3.9 5 4 7 -3 9 6 30 4.3 20 6 4 6 9 8 1 1 7 20 3.6 22 7 4.2 7 6 2 4 16 8 31 4 26 8 4.3 8 10 6 4 16 9 10 3.1 30 9 4.4 9 2 1 1 1 10 17 3.9 31 10 4.7 10 5 5 0 0 Sumă 60

Coeficientul de corelare a rangului lui Spearman:

Înlocuind valorile numerice, obținem:

Concluzia problemei

Relația dintre GPA din sesiunea anterioară și numărul de ore pe săptămână petrecute de student pentru studii independente este moderat puternică.

Dacă rămâneți fără timp pentru a finaliza un test, puteți comanda oricând o soluție urgentă la problemele de statistică de pe site.

In medie costul rezolvării unui test este de 700 - 1200 de ruble (dar nu mai puțin de 300 de ruble pentru întreaga comandă). Pretul este foarte influentat de urgenta deciziei (de la o zi la cateva ore). Costul ajutorului online pentru un examen/test este de la 1000 de ruble. pentru rezolvarea biletului.

Puteți pune toate întrebările despre cost direct în chat, după ce ați trimis în prealabil condițiile sarcinii și v-ați informat cu privire la intervalul de timp pentru soluția de care aveți nevoie. Timpul de răspuns este de câteva minute.

Exemple de probleme conexe

Raportul Fechner
Este prezentată o scurtă teorie și este luat în considerare un exemplu de rezolvare a problemei de calcul al coeficientului de corelație a semnului Fechner.

Coeficienții de contingență reciproci ai lui Chuprov și Pearson
Pagina conține informații despre metodele de studiu a relațiilor dintre caracteristicile calitative folosind coeficienții Chuprov și Pearson de contingență reciprocă.

În cazurile în care măsurătorile caracteristicilor studiate sunt efectuate pe o scară de ordine, sau forma relației diferă de cea liniară, studiul relației dintre două variabile aleatoare efectuate folosind coeficienți de corelație de rang. Luați în considerare coeficientul de corelație a rangului Spearman. La calcularea acestuia, este necesar să ierarhăm (ordonați) opțiunile de eșantion. Clasificarea este gruparea datelor experimentale în într-o anumită ordine, fie ascendent, fie descendent.

Operația de clasare se efectuează conform următorului algoritm:

1. O valoare mai mică i se atribuie un rang inferior. Cea mai mare valoare i se atribuie un rang corespunzător numărului de valori clasate. Cei mai mici valori i se atribuie un rang de 1. De exemplu, dacă n=7, atunci cea mai mare valoare va primi rangul numărul 7, cu excepția cazurilor prevăzute în a doua regulă.

2. Dacă mai multe valori sunt egale, atunci li se atribuie un rang care este media rangurilor pe care le-ar primi dacă nu ar fi egale. Ca exemplu, luați în considerare un eșantion ordonat crescător format din 7 elemente: 22, 23, 25, 25, 25, 28, 30. Valorile 22 și 23 apar o dată fiecare, astfel încât rândurile lor sunt, respectiv, R22=1 și R23=2. Valoarea 25 apare de 3 ori. Dacă aceste valori nu s-ar repeta, atunci rândurile lor ar fi 3, 4, 5. Prin urmare, rangul lor R25 este egal cu media aritmetică a 3, 4 și 5: . Valorile 28 și 30 nu se repetă, deci rangurile lor sunt respectiv R28=6 și R30=7. În sfârșit avem următoarea corespondență:

3. Suma totală a rangurilor trebuie să coincidă cu cea calculată, care este determinată de formula:

unde n - total valori clasate.

O discrepanță între sumele efective și cele calculate va indica o eroare făcută la calcularea rangurilor sau la însumarea acestora. În acest caz, trebuie să găsiți și să remediați eroarea.

Coeficientul de corelare a rangului lui Spearman este o metodă care permite determinarea puterii și direcției relației dintre două trăsături sau două ierarhii de trăsături. Utilizarea coeficientului de corelare a rangului are o serie de limitări:

  • a) Dependența de corelație asumată trebuie să fie monotonă.
  • b) Volumul fiecărei probe trebuie să fie mai mare sau egal cu 5. Pentru a determina limita superioară a probei, utilizați tabele de valori critice (Tabelul 3 din Anexă). Valoarea maximă a lui n din tabel este 40.
  • c) În timpul analizei, este posibil ca cantitate mare ranguri identice. În acest caz, trebuie făcută o modificare. Cel mai favorabil caz este atunci când ambele probe studiate reprezintă două secvențe de valori divergente.

Pentru a efectua o analiză a corelației, cercetătorul trebuie să aibă două eșantioane care pot fi clasate, de exemplu:

  • - două caracteristici măsurate în același grup de subiecți;
  • - două ierarhii individuale de trăsături identificate la doi subiecți folosind același set de trăsături;
  • - două ierarhii de grup de caracteristici;
  • - ierarhii individuale și de grup de caracteristici.

Începem calculul prin ierarhizarea indicatorilor studiați separat pentru fiecare dintre caracteristici.

Să analizăm un caz cu două semne măsurate în același grup de subiecți. În primul rând, valorile individuale obținute de diferiți subiecți sunt clasate în funcție de prima caracteristică, iar apoi valorile individuale sunt clasate în funcție de a doua caracteristică. Dacă rangurile inferioare ale unui indicator corespund rangurilor inferioare ale altui indicator, iar rangurile mai mari ale unui indicator corespund rangurilor mai mari ale altui indicator, atunci cele două caracteristici sunt legate pozitiv. Dacă rangurile superioare ale unui indicator corespund rangurilor inferioare ale altui indicator, atunci cele două caracteristici sunt legate negativ. Pentru a găsi rs, determinăm diferențele dintre rangurile (d) pentru fiecare subiect. Cu cât diferența dintre ranguri este mai mică, cu atât coeficientul de corelație rs va fi mai apropiat de „+1”. Dacă nu există nicio relație, atunci nu va exista nicio corespondență între ele, prin urmare rs va fi aproape de zero. Cu cât diferența dintre rândurile subiecților pe două variabile este mai mare, cu atât valoarea coeficientului rs va fi mai aproape de „-1”. Astfel, coeficientul de corelație a rangului Spearman este o măsură a oricărei relații monotone între cele două caracteristici studiate.

Să luăm în considerare cazul a două ierarhii individuale de trăsături identificate la doi subiecți folosind același set de trăsături. În această situație, valorile individuale obținute de fiecare dintre cei doi subiecți sunt clasificate în funcție de un anumit set de caracteristici. Caracteristicii cu cea mai mică valoare trebuie să i se atribuie primul rang; prezentate cu mai multe valoare ridicata- al doilea rang etc. Ar trebui plătit Atentie speciala pentru a se asigura că toate caracteristicile sunt măsurate în aceleași unități. De exemplu, este imposibil să clasați indicatorii dacă aceștia sunt exprimați în diferite puncte de „preț”, deoarece este imposibil să se determine care dintre factori va ocupa primul loc în ceea ce privește severitatea până când toate valorile sunt aduse la o singură scară. Dacă trăsăturile care au ranguri scăzute la unul dintre subiecte au ranguri scăzute și la altul și invers, atunci ierarhiile individuale sunt legate pozitiv.

În cazul a două ierarhii de grup de caracteristici, valorile medii de grup obținute în două grupe de subiecți sunt clasate în funcție de același set de caracteristici pentru loturile studiate. În continuare, urmăm algoritmul dat în cazurile anterioare.

Să analizăm un caz cu o ierarhie individuală și de grup de caracteristici. Ele încep prin clasarea separată a valorilor individuale ale subiectului și a valorilor medii de grup în funcție de același set de caracteristici care au fost obținute, excluzând subiectul care nu participă la ierarhia medie a grupului, deoarece ierarhia sa individuală va fi comparativ cu acesta. Corelarea rangurilor ne permite să evaluăm gradul de consistență al ierarhiei de trăsături individuale și de grup.

Să luăm în considerare modul în care se determină semnificația coeficientului de corelație în cazurile enumerate mai sus. În cazul a două caracteristici, acesta va fi determinat de mărimea eșantionului. În cazul a două ierarhii de caracteristici individuale, semnificația depinde de numărul de caracteristici incluse în ierarhie. În ultimele două cazuri, semnificația este determinată de numărul de caracteristici studiate și nu de numărul de grupuri. Astfel, semnificația lui rs în toate cazurile este determinată de numărul de valori clasate n.

La verificarea semnificației statistice a rs, se folosesc tabele de valori critice ale coeficientului de corelație de rang compilat pentru diverse cantitati valorile clasate și diferite niveluri semnificaţie. Dacă valoarea absolută a lui rs atinge sau depășește o valoare critică, atunci corelația este fiabilă.

Când se analizează prima opțiune (un caz cu două semne măsurate în același grup de subiecți), sunt posibile următoarele ipoteze.

H0: Corelația dintre variabilele x și y nu este diferită de zero.

H1: Corelația dintre variabilele x și y este semnificativ diferită de zero.

Dacă lucrăm cu oricare dintre cele trei cazuri rămase, atunci este necesar să propunem o altă pereche de ipoteze:

H0: Corelația dintre ierarhiile x și y nu este diferită de zero.

H1: Corelația dintre ierarhiile x și y este semnificativ diferită de zero.

Secvența de acțiuni la calcularea coeficientului de corelație a rangului Spearman rs este următoarea.

  • - Determinați care două caracteristici sau două ierarhii de caracteristici vor participa la comparație ca variabile x și y.
  • - Clasificați valorile variabilei x, atribuind un rang de 1 cea mai mică valoare, în conformitate cu regulile de clasare. Plasați rangurile în prima coloană a tabelului în ordinea subiecților de testare sau a caracteristicilor.
  • - Clasificați valorile variabilei y. Plasați rangurile în a doua coloană a tabelului în ordinea subiecților de testare sau a caracteristicilor.
  • - Calculați diferențele d dintre rangurile x și y pentru fiecare rând al tabelului. Puneți rezultatele în coloana următoare a tabelului.
  • - Calculați diferențele la pătrat (d2). Puneți valorile rezultate în a patra coloană a tabelului.
  • - Calculați suma diferențelor pătrate? d2.
  • - Dacă apar ranguri identice, calculați corecțiile:

unde tx este volumul fiecărui grup de ranguri identice din eșantionul x;

ty este volumul fiecărui grup de ranguri identice din eșantionul y.

Calculați coeficientul de corelare a rangului în funcție de prezența sau absența rangurilor identice. Dacă nu există ranguri identice, calculați coeficientul de corelare a rangului rs folosind formula:

Dacă există ranguri identice, calculați coeficientul de corelare a rangului rs folosind formula:

unde?d2 este suma diferențelor pătrate dintre rânduri;

Tx și Ty - corecții pentru ranguri egale;

n este numărul de subiecte sau caracteristici care participă la clasament.

Determinați valorile critice ale rs din tabelul apendice 3 pentru un număr dat de subiecți n. Se va observa o diferență semnificativă față de zero a coeficientului de corelație cu condiția ca rs să nu fie mai mic decât valoarea critică.

37. Coeficientul de corelare a rangului lui Spearman.

S. 56 (64) 063.JPG

http://psystat.at.ua/publ/1-1-0-33

Coeficientul de corelare a rangului lui Spearman este utilizat în cazurile în care:
- variabilele au scara de clasare măsurători;
- distribuția datelor este prea diferită de normal sau deloc cunoscut;
- probele au un volum mic (N< 30).

Interpretare coeficient de clasare Corelația Spearman nu este diferită de coeficientul Pearson, dar semnificația sa este oarecum diferită. Pentru a înțelege diferența dintre aceste metode și a justifica logic domeniile lor de aplicare, să comparăm formulele lor.

Coeficientul de corelație Pearson:

Coeficientul de corelație Spearman:

După cum puteți vedea, formulele diferă semnificativ. Să comparăm formulele

Formula de corelație Pearson utilizează media aritmetică și abaterea standard a seriei corelate, dar formula Spearman nu. Astfel, pentru a obține un rezultat adecvat folosind formula Pearson, este necesar ca seria corelată să fie apropiată de distribuția normală (media și abaterea standard sunt parametri normali de distribuție). Acest lucru nu este relevant pentru formula Spearman.

Un element al formulei Pearson este standardizarea fiecărei serii în scara z.

După cum puteți vedea, conversia variabilelor la scara Z este prezentă în formula pentru coeficientul de corelație Pearson. În consecință, pentru coeficientul Pearson, scara datelor nu contează deloc: de exemplu, putem corela două variabile, dintre care una are un min. = 0 și max. = 1, iar al doilea min. = 100 și max. = 1000. Indiferent cât de diferită este intervalul de valori, toate vor fi convertite în valori z standard care sunt aceleași ca scară.

Prin urmare, o astfel de normalizare nu are loc în coeficientul Spearman

O CONDIȚIE OBLIGATORIE PENTRU UTILIZAREA COEFICIENTULUI SPEARMAN ESTE EGALITATEA GAMULUI CELE DOUĂ VARIABILE.

Înainte de a utiliza coeficientul Spearman pentru serii de date cu intervale diferite, este necesar să rang. Clasamentul duce la faptul că valorile acestor serii capătă același minim = 1 (rang minim) și un maxim egal cu numărul de valori (maxim, ultimul rang = N, adică. număr maxim cazuri din eșantion).

În ce cazuri te poți descurca fără clasament?

Acestea sunt cazurile în care datele sunt inițial scara de clasare. De exemplu, testați orientări valorice Rokeach.

De asemenea, acestea sunt cazuri în care numărul de opțiuni de valoare este mic și eșantionul conține un minim și un maxim fix. De exemplu, în diferenţial semantic minim = 1, maxim = 7.

Exemplu de calcul al coeficientului de corelare a rangului lui Spearman

Testul lui Rokeach privind orientările valorii a fost efectuat pe două eșantioane X și Y. Obiectiv: a afla cât de apropiate sunt ierarhiile de valori ale acestor eșantioane (literalmente, cât de asemănătoare sunt acestea).

Valoarea rezultată r=0,747 este verificată de tabelul valorilor critice. Conform tabelului, cu N=18, valoarea obţinută este semnificativă la nivelul p<=0,005

Spearman și Kendal clasează coeficienții de corelație

Pentru variabilele aparținând unei scale ordinale sau pentru variabilele care nu sunt supuse unei distribuții normale, precum și pentru variabilele aparținând unei scale de interval, se calculează corelația rangului Spearman în locul coeficientului Pearson. Pentru a face acest lucru, valorilor individuale ale variabilelor li se atribuie ranguri, care sunt ulterior procesate folosind formule adecvate. Pentru a detecta corelația de rang, debifați caseta de selectare implicită corelație Pearson din caseta de dialog Bivariate Corelations.... În schimb, activați calculul corelației Spearman. Acest calcul va da următoarele rezultate. Coeficienții de corelație de rang sunt foarte aproape de valorile corespunzătoare ale coeficienților Pearson (variabilele originale au o distribuție normală).

titkova-matmetody.pdf p. 45

Metoda de corelare a rangului lui Spearman vă permite să determinați etanșeitatea (rezistența) și direcția

corelaţie între două semne sau două profiluri (ierarhii) semne.

Pentru a calcula corelația de rang, este necesar să existe două rânduri de valori,

care poate fi clasat. O astfel de serie de valori ar putea fi:

1) două semne măsurată în acelaşi grup subiecte;

2) două ierarhii individuale de caracteristici, identificate la doi subiecți folosind același

set de caracteristici;

3) doi ierarhii de grup de caracteristici,

4) individuale si de grup ierarhia caracteristicilor.

În primul rând, indicatorii sunt clasificați separat pentru fiecare dintre caracteristici.

De regulă, un rang inferior este atribuit unei valori de atribut mai mici.

În primul caz (două caracteristici), valorile individuale sunt clasate în funcție de primul

caracteristică obținută de diferiți subiecți, iar apoi valori individuale pentru al doilea

semn.

Dacă două caracteristici sunt legate pozitiv, atunci subiecții cu ranguri scăzute

unul dintre ei va avea ranguri scăzute în celălalt, iar subiecții care au ranguri înalte în

una dintre caracteristici va avea, de asemenea, ranguri înalte pentru cealaltă caracteristică. Pentru a calcula rs

trebuie determinate diferențele (d)între rangurile obţinute de un subiect dat în ambele

semne. Apoi acești indicatori d sunt transformați într-un anumit mod și scăzuți din 1. Decat

Cu cât diferența dintre ranguri este mai mică, cu atât rs-ul va fi mai mare, cu atât va fi mai aproape de +1.

Dacă nu există o corelație, atunci toate rangurile vor fi amestecate și nu va exista

nici o corespondență. Formula este concepută astfel încât în ​​acest caz rs să fie aproape de 0.

În caz de corelare negativă ranguri scăzute de subiecte pe o singură bază

ranguri înalte pe o altă bază vor corespunde și invers. Cu cât discrepanța este mai mare

între rândurile subiecților pe două variabile, cu cât rs este mai aproape de -1.

În al doilea caz (două profiluri individuale), sunt clasate cele individuale

valorile obținute de fiecare dintre cei 2 subiecți conform unui anumit (la fel pentru ei

ambele) set de caracteristici. Primul rang va fi acordat caracteristicii cu cea mai mică valoare; rangul doi -

un semn cu o valoare mai mare etc. Evident, toate caracteristicile trebuie măsurate în

aceleași unități, altfel clasarea este imposibilă. De exemplu, este imposibil

clasați indicatorii pe Cattell Personality Inventory (16PF), dacă aceștia sunt exprimați în

puncte „brute”, deoarece intervalele de valori sunt diferite pentru diferiți factori: de la 0 la 13, de la 0 la

20 și de la 0 la 26. Nu putem spune care factor va ocupa primul loc

expresie până când aducem toate valorile la o singură scară (cel mai adesea aceasta este scara de perete).

Dacă ierarhiile individuale ale două subiecți sunt legate pozitiv, atunci semnele

având ranguri mici într-una dintre ele va avea ranguri scăzute în cealaltă și invers.

De exemplu, dacă factorul E (dominanță) al unui subiect are cel mai mic rang, atunci

alt subiect de testare, ar trebui să aibă un rang scăzut dacă un subiect de testare are factorul C

(stabilitatea emoțională) are cel mai înalt rang, atunci trebuie să aibă și celălalt subiect

acest factor are un rang înalt etc.

În al treilea caz (două profiluri de grup), valorile medii ale grupului sunt clasate,

obţinute în 2 grupe de subiecţi conform unui set specific, identice pentru ambele grupe

semne. În cele ce urmează, linia de raționament este aceeași ca în cele două cazuri precedente.

În cazul 4 (profiluri individuale și de grup), acestea sunt clasate separat

valori individuale ale subiectului și valori medii de grup pentru același set

semne care se obțin, de regulă, prin excluderea acestui subiect individual - el

nu participă la profilul mediu de grup cu care individul său va fi comparat

profil. Corelarea rangului vă va permite să verificați cât de consistent individul și

profiluri de grup.

În toate cele patru cazuri, se determină semnificația coeficientului de corelație rezultat

după numărul de valori clasate N.În primul caz, această cantitate va coincide cu

dimensiunea eșantionului n. În al doilea caz, numărul de observații va fi numărul de caracteristici,

alcătuind ierarhia. În al treilea și al patrulea caz, N este, de asemenea, numărul de comparați

caracteristici, și nu numărul de subiecți din grupuri. Explicații detaliate sunt date în exemple. Dacă

valoarea absolută a lui rs atinge sau depășește o valoare critică, corelație

de încredere.

Ipoteze.

Există două ipoteze posibile. Primul se aplică pentru cazul 1, al doilea pentru celelalte trei

Prima versiune a ipotezelor

H0: Corelația dintre variabilele A și B nu este diferită de zero.

H2: Corelația dintre variabilele A și B este semnificativ diferită de zero.

A doua versiune a ipotezelor

H0: Corelația dintre ierarhiile A și B nu este diferită de zero.

H2: Corelația dintre ierarhiile A și B este semnificativ diferită de zero.

Limitări ale coeficientului de corelare a rangului

1. Pentru fiecare variabilă trebuie prezentate cel puțin 5 observații. Superior

limita de eșantionare este determinată de tabelele disponibile de valori critice .

2. Coeficientul de corelație a rangului lui Spearman rs pentru un număr mare de identice

rangurile pentru una sau ambele variabile comparate oferă valori aproximative. Ideal

ambele serii corelate trebuie să reprezinte două secvenţe de divergente

valorile. Dacă această condiție nu este îndeplinită, trebuie făcută o modificare

aceleasi ranguri.

Coeficientul de corelare a rangului lui Spearman este calculat folosind formula:

Dacă ambele serii de ranguri comparate conțin grupuri de aceleași ranguri,

înainte de a calcula coeficientul de corelare a rangului, este necesar să se facă corecții pentru acesta

Ta și clasamente TV:

Ta = Σ (a3 – a)/12,

Тв = Σ (в3 – в)/12,

Unde A - volumul fiecărui grup de ranguri identice din seria de rang A, în volumul fiecăruia

grupuri de ranguri identice din seria de rang B.

Pentru a calcula valoarea empirică a lui rs, utilizați formula:

38. Coeficient de corelație punct-biserial.

Despre corelație în general, vezi întrebarea nr. 36 Cu. 56 (64) 063.JPG

harchenko-korranaliz.pdf

Fie măsurată variabila X pe o scară puternică, iar variabila Y pe o scară dihotomică. Coeficientul de corelație biserială punctual rpb se calculează folosind formula:

Aici x 1 este valoarea medie peste X obiecte cu o valoare de „unu” peste Y;

x 0 – valoare medie peste X obiecte cu valoarea „zero” peste Y;

s x – abaterea standard a tuturor valorilor de-a lungul X;

n 1 – numărul de obiecte „unul” în Y, n 0 – numărul de obiecte „zero” în Y;

n = n 1 + n 0 – dimensiunea eșantionului.

Coeficientul de corelație biserială punctual poate fi calculat și folosind alte expresii echivalente:

Aici x– valoarea medie globală a variabilei X.

Coeficient de corelație biserială punctual rpb variază de la –1 la +1. Valoarea sa este zero dacă variabilele cu unu Y au o medie Y, egal cu media variabilelor cu zero peste Y.

Examinare ipoteze de semnificație coeficientul de corelație biserială punct este de verificat ipoteza nulăh 0 despre egalitatea coeficientului de corelație generală la zero: ρ = 0, care se realizează folosind testul t Student. Semnificație empirică

comparativ cu valorile critice t A (df) pentru numărul de grade de libertate df = n– 2

Dacă condiția | t| ≤ (df), ipoteza nulă ρ = 0 nu este respinsă. Coeficientul de corelație biserială punctuală diferă semnificativ de zero dacă valoarea empirică | t| se încadrează în regiunea critică, adică dacă condiția | t| > (n– 2). Fiabilitatea relației calculată folosind coeficientul de corelație biserială punctual rpb, poate fi determinată și cu ajutorul criteriului χ 2 pentru numărul de grade de libertate df= 2.

Corelație biserială punctuală

Modificarea ulterioară a coeficientului de corelație al produsului momentelor a fost reflectată în punctul biserial r. Această statistică. arată relația dintre două variabile, dintre care una se presupune a fi continuă și normal distribuită, iar cealaltă este discretă în în sensul exact cuvinte. Coeficientul de corelație biserială punctual este notat cu r pbis Din moment ce în r pbis dihotomia reflectă adevărata natură a variabilei discrete, și nefiind artificială, ca în cazul r bis, semnul acestuia este determinat arbitrar. Prin urmare, pentru toate scopurile practice. obiective r pbis considerată în intervalul de la 0,00 la +1,00.

Există și cazul în care se presupune că două variabile sunt continue și distribuite normal, dar ambele sunt dihotomizate artificial, ca în cazul corelației biseriale. Pentru a evalua relația dintre astfel de variabile, se utilizează coeficientul de corelație tetrachoric r tet, care a fost crescut și de Pearson. De bază formule (exacte) și proceduri de calcul r tet destul de complex. Prin urmare, cu practic Această metodă utilizează aproximări r tet,obținut pe baza de proceduri și tabele abreviate.

/on-line/dictionary/dictionary.php?term=511

COEFICIENT BISERIAL PUNCT este coeficientul de corelație dintre două variabile, una măsurată pe o scară dihotomică și cealaltă pe o scară de interval. Este folosit în testarea clasică și modernă ca un indicator al calității unei sarcini de testare - fiabilitate și consecvență cu scor general conform testului.

Pentru a corela variabilele măsurate în scară dihotomică și interval utilizare coeficientul de corelație punct-biserial.
Coeficientul de corelație punct-biserială este o metodă de analiză a corelației relației dintre variabile, dintre care una este măsurată pe o scară de nume și ia doar 2 valori (de exemplu, bărbați/femei, răspuns corect/răspuns fals, caracteristică prezent/nu este prezent), iar al doilea pe o scară de rapoarte sau scară de interval. Formula pentru calcularea coeficientului de corelație punct-biserială:

Unde:
m1 și m0 sunt valorile medii ale lui X cu o valoare de 1 sau 0 în Y.
σx – abaterea standard a tuturor valorilor de X
n1,n0 – numărul de valori X de la 1 sau 0 la Y.
n – numărul total de perechi de valori

Cel mai adesea, acest tip de coeficient de corelație este utilizat pentru a calcula relația dintre itemii de testare și scara totală. Acesta este un tip de verificare a validității.

39. Coeficient de corelație rang-biseriala.

Despre corelație în general, vezi întrebarea nr. 36 Cu. 56 (64) 063.JPG

harchenko-korranaliz.pdf p. 28

Coeficientul de corelație biserial, utilizat în cazurile în care una dintre variabile ( X) este prezentat într-o scară ordinală, iar celălalt ( Y) – dihotomic, calculat prin formula

.

Iată rangul mediu al obiectelor care au unul în Y; – rangul mediu al obiectelor cu zero la Y, n- marime de mostra.

Examinare ipoteze de semnificație Coeficientul de corelație rang-biserială se realizează în mod similar cu coeficientul de corelație biserial punct folosind testul Student cu înlocuire în formule rpb pe rrb.

În cazurile în care o variabilă este măsurată pe o scară dihotomică (variabilă X), iar celălalt în scala de rang (variabila Y), se utilizează coeficientul de corelație rang-biseriala. Ne amintim că variabila X, măsurat pe o scară dihotomică, ia doar două valori (coduri) 0 și 1. Subliniem în special: în ciuda faptului că acest coeficient variază în intervalul de la –1 la +1, semnul său nu contează pentru interpretarea rezultate. Aceasta este o altă excepție de la regula generală.

Acest coeficient se calculează folosind formula:

unde ` X 1 rang mediu pentru acele elemente ale variabilei Y, care corespunde codului (semnului) 1 din variabilă X;

`X 0 – rang mediu pentru acele elemente ale variabilei Y, care corespunde codului (semnului) 0 din variabilă X\

N – numărul total de elemente din variabilă X.

Pentru aplicarea coeficientului de corelație rang-biserială trebuie îndeplinite următoarele condiții:

1. Variabilele care se compară trebuie măsurate pe diferite scale: unu X - pe o scară dihotomică; alte Y– pe o scară de clasare.

2. Numărul de caracteristici variabile în variabilele comparate XȘi Y ar trebui să fie la fel.

3. Pentru a evalua nivelul de fiabilitate al coeficientului de corelație rang-biserială, ar trebui să utilizați formula (11.9) și tabelul de valori critice pentru testul Student k = n – 2.

http://psystat.at.ua/publ/drugie_vidy_koehfficienta_korreljacii/1-1-0-38

Cazurile în care una dintre variabile este reprezentată în scară dihotomică, iar celălalt în rang (ordinal), necesită aplicare coeficient de corelație rang-biseriala:

rpb=2 / n * (m1 - m0)

Unde:
n – numărul de obiecte de măsurat
m1 și m0 - rangul mediu al obiectelor cu 1 sau 0 pe a doua variabilă.
Acest coeficient este utilizat și la verificarea validității testelor.

40. Coeficient de corelație liniară.

Pentru corelație în general (și corelația liniară în special), vezi întrebarea nr. 36 Cu. 56 (64) 063.JPG

COEFICIENTUL DOMNULUI PEARSON

r-Pearson (Pearson r) este folosit pentru a studia relația dintre două metricivariabile diferite măsurate pe același eșantion. Există multe situații în care utilizarea sa este adecvată. Afectează inteligența performanța academică în anii de studii superioare? Mărimea salariului unui angajat este legată de amabilitatea acestuia față de colegi? Starea de spirit a elevului afectează succesul rezolvării unei probleme complexe de aritmetică? Pentru a răspunde la astfel de întrebări, cercetătorul trebuie să măsoare doi indicatori de interes pentru fiecare membru al eșantionului. Datele pentru a studia relația sunt apoi tabulate, ca în exemplul de mai jos.

EXEMPLU 6.1

Tabelul prezintă un exemplu de date inițiale pentru măsurarea a doi indicatori ai inteligenței (verbal și nonverbal) pentru 20 de elevi de clasa a VIII-a.

Relația dintre aceste variabile poate fi descrisă folosind un grafic de dispersie (vezi Figura 6.3). Diagrama arată că există o anumită relație între indicatorii măsurați: cu cât valoarea inteligenței verbale este mai mare, cu atât (în mare parte) este mai mare valoarea inteligenței non-verbale.

Înainte de a da formula pentru coeficientul de corelație, să încercăm să urmărim logica apariției acestuia folosind datele din exemplul 6.1. Poziția fiecărui punct / (subiect cu număr /) pe diagrama de împrăștiere în raport cu celelalte puncte (Fig. 6.3) poate fi specificată prin valorile și semnele de abateri ale valorilor variabile corespunzătoare de la valorile lor medii : (xj - MJ Și (minte la ). Dacă semnele acestor abateri coincid, atunci aceasta indică o relație pozitivă ( valori mari De X valori mari corespund la sau valori mai mici X valori mai mici corespund y).

Pentru subiectul nr. 1, abatere de la medie Xși prin la pozitiv, iar pentru subiectul nr. 3 ambele abateri sunt negative. În consecință, datele de la ambele indică o relație pozitivă între trăsăturile studiate. Dimpotrivă, dacă semnele abaterilor de la medie Xși prin la diferă, aceasta va indica o relație negativă între caracteristici. Astfel, pentru subiectul nr.4, abaterea de la medie X este negativ, prin y - pozitiv, iar pentru subiectul nr. 9 - invers.

Astfel, dacă produsul abaterilor (x,- M X ) X (minte la ) pozitiv, atunci datele subiectului / indică o relație directă (pozitivă), iar dacă este negativă, atunci o relație inversă (negativă). În consecință, dacă Xwy y sunt în general legate în proporție directă, atunci majoritatea produselor abaterilor vor fi pozitive, iar dacă sunt legate printr-o relație inversă, atunci majoritatea produselor vor fi negative. Prin urmare, un indicator general pentru puterea și direcția relației poate fi suma tuturor produselor abaterilor pentru un eșantion dat:

Cu o relație direct proporțională între variabile, această valoare este mare și pozitivă - pentru majoritatea subiecților, abaterile coincid în semn (valorile mari ale unei variabile corespund valorilor mari ale altei variabile și invers). Dacă XȘi la au feedback, atunci pentru majoritatea subiecților valorile mari ale unei variabile vor corespunde cu valori mai mici ale altei variabile, adică semnele produselor vor fi negative, iar suma produselor în ansamblu va fi, de asemenea, mare în valoare absolută, dar negativ în semn. Dacă nu există o legătură sistematică între variabile, atunci termenii pozitivi (produșii abaterilor) vor fi echilibrați de termeni negativi, iar suma tuturor produselor abaterilor va fi aproape de zero.

Pentru a vă asigura că suma produselor nu depinde de dimensiunea eșantionului, este suficient să o medieți. Dar ne interesează măsura interconectarii nu ca un parametru general, ci ca o estimare calculată a acesteia - statistici. Prin urmare, în ceea ce privește formula de dispersie, în acest caz vom face același lucru, împărțim suma produselor abaterilor nu la N, iar la televizor - 1. Rezultă astfel o măsură a conexiunii, utilizată pe scară largă în fizică și științe tehnice, care se numește covarianta (Covahance):


ÎN În psihologie, spre deosebire de fizică, majoritatea variabilelor sunt măsurate pe scale arbitrare, deoarece psihologii nu sunt interesați de valoarea absolută a unui semn, ci de poziția relativă a subiecților dintr-un grup. În plus, covarianța este foarte sensibilă la scara scalei (varianței) pe care sunt măsurate trăsăturile. Pentru a face măsura conexiunii independentă de unitățile de măsură ale ambelor caracteristici, este suficient să împărțiți covarianța în abaterile standard corespunzătoare. Astfel s-a obtinut pentru-Catâr al coeficientului de corelație K. Pearson:

sau, după înlocuirea expresiilor pentru o x și


Dacă valorile ambelor variabile au fost convertite în valori r folosind formula


atunci formula pentru coeficientul de corelație r-Pearson pare mai simplă (071.JPG):

/dict/sociology/article/soc/soc-0525.htm

CORELATIE LINEARA- relaţie liniară statistică de natură non-cauzoală între două variabile cantitative XȘi la. Măsurat folosind „coeficientul K.L”. Pearson, care este rezultatul împărțirii covarianței la abaterile standard ale ambelor variabile:

,

Unde s X y- covarianta intre variabile XȘi la;

s X , s y- abateri standard pentru variabile XȘi la;

X i , y i- valori variabile XȘi la pentru obiect cu număr i;

X, y- medii aritmetice pentru variabile XȘi la.

coeficientul Pearson r poate lua valori din intervalul [-1; +1]. Sens r = 0înseamnă că nu există o relație liniară între variabile XȘi la(dar nu exclude o relație statistică neliniară). Valori pozitive coeficient ( r> 0) indică o legătură liniară directă; cu cât valoarea sa este mai aproape de +1, cu atât relația este mai puternică linia statistică. Valori negative ale coeficientului ( r < 0) свидетельствуют об обратной линейной связи; чем ближе его значение к -1, тем сильнее обратная связь. Значения r= ±1 înseamnă prezența unei conexiuni liniare complete, directă sau inversă. În cazul conexiunii complete, toate punctele cu coordonate ( X i , y i) se întinde pe o linie dreaptă y = A + bx.

"Coeficientul K.L." Pearson este, de asemenea, folosit pentru a măsura puterea conexiunii într-un model de regresie liniară în perechi.

41. Matricea de corelație și graficul de corelație.

Despre corelație în general, vezi întrebarea nr. 36 Cu. 56 (64) 063.JPG

Matricea de corelație. De multe ori analiza corelației presupune studiul legăturilor dintre nu două, ci multe variabile măsurate la scară cantitativă într-un singur eșantion. În acest caz, corelațiile sunt calculate pentru fiecare pereche a acestui set de variabile. Calculele sunt de obicei efectuate pe un computer, iar rezultatul este o matrice de corelație.

Matricea de corelație(Corelație Matrice) este rezultatul calculării corelațiilor de un tip pentru fiecare pereche din mulțime R variabile măsurate la scară cantitativă într-un singur eșantion.

EXEMPLU

Să presupunem că studiem relațiile dintre 5 variabile (vl, v2,..., v5; P= 5), măsurată pe o probă de N=30 Uman. Mai jos este un tabel de date sursă și o matrice de corelație.

ȘI
date similare:

Matricea de corelație:

Este ușor de observat că matricea de corelație este pătrată, simetrică față de diagonala principală (takkak,y = /) y), cu unități pe diagonala principală (deoarece G Și = Gu = 1).

Matricea de corelație este pătrat: numărul de rânduri și coloane este egal cu numărul de variabile. Ea simetric relativ la diagonala principală, din moment ce corelația X Cu la egal cu corelaţia la Cu X. Unitățile sunt situate pe diagonala sa principală, deoarece corelația caracteristicii cu ea însăși este egală cu unu. În consecință, nu toate elementele matricei de corelație sunt supuse analizei, ci cele care sunt situate deasupra sau sub diagonala principală.

Numărul de coeficienți de corelație, Caracteristicile care trebuie analizate la studierea relațiilor sunt determinate de formula: P(P- 1)/2. În exemplul de mai sus, numărul acestor coeficienți de corelație este 5(5 - 1)/2 = 10.

Sarcina principală a analizei matricei de corelație este identificarea structurii relațiilor dintre multe trăsături. În acest caz, este posibilă analiza vizuală galaxii de corelație- imagine grafică structuri din punct de vedere statisticconexiuni semnificative, dacă nu sunt foarte multe astfel de conexiuni (până la 10-15). O altă modalitate este utilizarea metodelor multivariate: regresie multiplă, analiză factorială sau cluster (vezi secțiunea „Metode multivariate...”). Folosind analiza factorială sau cluster, este posibil să se identifice grupări de variabile care sunt mai strâns legate între ele decât cu alte variabile. O combinație a acestor metode este, de asemenea, foarte eficientă, de exemplu, dacă există multe semne și nu sunt omogene.

Comparația corelațiilor - o sarcină suplimentară de analiză a matricei de corelație, care are două opțiuni. Dacă este necesară compararea corelațiilor într-unul dintre rândurile matricei de corelație (pentru una dintre variabile), se folosește metoda comparației pentru mostre dependente(p. 148-149). La compararea corelațiilor cu același nume calculate pentru probe diferite, se folosește metoda de comparare pentru eșantioane independente (p. 147-148).

Metode de comparare corelații în diagonale matrice de corelație (pentru a evalua staționaritatea unui proces aleatoriu) și comparație mai multe Matricele de corelație obținute pentru diferite eșantioane (pentru omogenitatea lor) necesită forță de muncă intensă și dincolo de scopul acestei cărți. Puteți face cunoștință cu aceste metode din cartea lui G.V. Sukhodolsky 1.

Problema semnificației statistice a corelațiilor. Problema este că procedura de testare a ipotezelor statistice presupune unu-multiplu test efectuat pe o probă. Dacă se aplică aceeași metodă repetat, chiar dacă în raport cu diferite variabile, probabilitatea obținerii unui rezultat pur întâmplător crește. ÎN caz general, dacă repetăm ​​aceeași metodă de testare a ipotezelor o singura dataîn raport cu diferite variabile sau mostre, atunci cu valoarea stabilită a ni se garantează că vom primi confirmarea ipotezei în ahk număr de cazuri.

Să presupunem că se analizează o matrice de corelație pentru 15 variabile, adică se calculează 15(15-1)/2 = 105 coeficienți de corelație. Pentru a testa ipoteze, se stabilește nivelul a = 0,05. Prin verificarea ipotezei de 105 ori, vom primi confirmarea acesteia de cinci ori (!), indiferent dacă conexiunea există efectiv. Știind acest lucru și având, să zicem, 15 coeficienți de corelație „semnificativi statistic”, putem spune care dintre ei au fost obținuți întâmplător și care reflectă o relație reală?

Strict vorbind, pentru acceptare solutie statistica este necesar să se reducă nivelul a de câte ori numărul de ipoteze testate. Dar acest lucru nu este recomandabil, deoarece într-un mod imprevizibil probabilitatea de a ignora efectiv conexiunea existentă(faceți o eroare de tip II).

Numai matricea de corelație nu este o bază suficientăpentru concluzii statistice privind coeficienții individuali incluși în acestacorelatii!

Există o singură modalitate cu adevărat convingătoare de a rezolva această problemă: împărțiți eșantionul în mod aleatoriu în două părți și luați în considerare doar acele corelații care sunt semnificative statistic în ambele părți ale eșantionului. O alternativă poate fi utilizarea metodelor multivariate (analiza factorială, cluster sau regresie multiplă) pentru a identifica și ulterior interpreta grupuri de variabile statistic semnificativ legate.

Problemă cu valorile lipsă. Dacă în date lipsesc valori, atunci sunt posibile două opțiuni pentru calcularea matricei de corelație: a) eliminarea rând cu rând a valorilor (Excludecazurilistwise); b) ștergerea perechi a valorilor (Excludecazuriperechi). La ștergere rând cu linie observații cu valori lipsă, întregul rând pentru un obiect (subiect) care are cel puțin o valoare lipsă pentru una dintre variabile este șters. Această metodă conduce la o matrice de corelație „corectă”, în sensul că toți coeficienții sunt calculați din același set de obiecte. Cu toate acestea, dacă valorile lipsă sunt distribuite aleatoriu între variabile, atunci aceasta metoda poate duce la faptul că nu va mai rămâne un singur obiect în setul de date luat în considerare (fiecare rând va conține cel puțin o valoare lipsă). A evita situație similară, utilizați o altă metodă numită îndepărtarea în perechi. Această metodă ia în considerare doar golurile în fiecare pereche coloană-variabilă selectată și ignoră golurile în alte variabile. Corelația pentru o pereche de variabile este calculată pentru acele obiecte în care nu există goluri. În multe situații, mai ales când numărul de goluri este relativ mic, să zicem 10%, iar golurile sunt distribuite destul de aleatoriu, această metodă nu duce la erori grave. Cu toate acestea, uneori, acesta nu este cazul. De exemplu, o prejudecată sistematică (schimbare) în evaluare poate „ascunde” un aranjament sistematic de omisiuni, care este motivul diferenței de coeficienți de corelație construiți pentru diferite subseturi (de exemplu, pentru diferite subgrupuri de obiecte). O altă problemă asociată cu matricea de corelație calculată cu perechi eliminarea golurilor are loc atunci când se utilizează această matrice în alte tipuri de analiză (de exemplu, în regresia multiplă sau analiza factorilor). Ei presupun că matricea de corelație „corectă” este utilizată cu un anumit nivel de consistență și „conformitate” a diferiților coeficienți. Utilizarea unei matrice cu estimări „proaste” (părtinitoare) duce la faptul că programul fie nu poate analiza o astfel de matrice, fie rezultatele vor fi eronate. Prin urmare, dacă se utilizează metoda perechi de excludere a datelor lipsă, este necesar să se verifice dacă există modele sistematice în distribuția datelor lipsă.

Dacă ștergerea în perechi a datelor lipsă nu duce la nicio schimbare sistematică a mediilor și a variațiilor (abateri standard), atunci aceste statistici vor fi similare cu cele calculate folosind metoda rând cu rând de ștergere a datelor lipsă. Dacă se observă o diferență semnificativă, atunci există motive să presupunem că există o schimbare în estimări. De exemplu, dacă media (sau abaterea standard) a valorilor unei variabile A, care a fost folosit la calcularea corelaţiei sale cu variabila ÎN, mult mai puțin decât media (sau deviație standard) aceleași valori variabile A, care au fost utilizate în calcularea corelației sale cu variabila C, atunci există toate motivele să ne așteptăm ca aceste două corelații (A-BS.U.A) bazate pe diferite subseturi de date. Va exista o părtinire în corelații cauzată de plasarea non-aleatorie a golurilor în valorile variabilelor.

Analiza corelației galaxiilor. După rezolvarea problemei semnificației statistice a elementelor matricei de corelație, corelațiile semnificative statistic pot fi reprezentate grafic sub forma unei galaxii sau galaxii de corelație. Galaxia de corelație - Aceasta este o figură formată din vârfuri și linii care le conectează. Vârfurile corespund caracteristicilor și sunt de obicei desemnate prin numere - numere variabile. Liniile corespund conexiunilor semnificative statistic și exprimă grafic semnul și uneori nivelul j de semnificație al conexiunii.

Galaxia de corelație poate reflecta Toate conexiuni semnificative statistic ale matricei de corelație (uneori numite graficul de corelare ) sau numai partea lor selectată în mod semnificativ (de exemplu, corespunzătoare unui factor conform rezultatelor analizei factorilor).

EXEMPLU DE CONSTRUIRE A UNEI PLEIADE DE CORELATIE


Pregătirea pentru certificarea de stat (finală) a absolvenților: formarea bazei de examen de stat unificat ( lista comuna Participanții la examenul unificat de stat de toate categoriile, indicând subiectele) - luând în considerare zilele de rezervă în caz de coincidență a subiectelor;

  • Plan de lucru (27)

    Soluţie

    2. Activități ale instituției de învățământ pentru îmbunătățirea conținutului și evaluarea calității disciplinelor de educație științifică și matematică Instituție de învățământ municipală școala secundară nr. 4, Litvinovskaya, Chapaevskaya,

  • Metoda de corelare a rangului Spearman vă permite să determinați apropierea (tăria) și direcția corelației dintre două caracteristici sau două profiluri (ierarhii) de caracteristici.

    Pentru a calcula corelația de rang, este necesar să existe două rânduri de valori,

    care poate fi clasat. O astfel de serie de valori ar putea fi:

    1) două semne măsurate în același grup de subiecți;

    2) două ierarhii individuale de trăsături identificate la doi subiecți folosind același set de trăsături;

    3) două ierarhii de grup de caracteristici,

    4) ierarhii individuale și de grup de caracteristici.

    În primul rând, indicatorii sunt clasificați separat pentru fiecare dintre caracteristici.

    De regulă, un rang inferior este atribuit unei valori de atribut mai mici.

    În primul caz (două caracteristici), sunt clasate valorile individuale pentru prima caracteristică obținute de diferiți subiecți, iar apoi valorile individuale pentru a doua caracteristică.

    Dacă două caracteristici sunt legate pozitiv, atunci subiecții care au ranguri scăzute într-una dintre ele vor avea ranguri scăzute în celălalt, iar subiecții care au ranguri înalte în

    una dintre caracteristici va avea, de asemenea, ranguri înalte pentru cealaltă caracteristică. Pentru a calcula rs, este necesar să se determine diferențele (d) dintre rangurile obținute de un subiect dat pentru ambele caracteristici. Apoi acești indicatori d sunt transformați într-un anumit mod și scăzuți din 1. Decat

    Cu cât diferența dintre ranguri este mai mică, cu atât rs-ul va fi mai mare, cu atât va fi mai aproape de +1.

    Dacă nu există o corelație, atunci toate rangurile vor fi amestecate și nu va exista

    nici o corespondență. Formula este concepută astfel încât în ​​acest caz rs să fie aproape de 0.

    În cazul unei corelaţii negative între rangurile scăzute ale subiecţilor pe un singur atribut

    ranguri înalte pe o altă bază vor corespunde și invers. Cu cât discrepanța dintre rangurile subiecților pe două variabile este mai mare, cu atât rs este mai aproape de -1.

    În al doilea caz (două profiluri individuale), individual

    valorile obținute de fiecare dintre cei 2 subiecți pentru un anumit set (identic pentru ambii) de caracteristici. Primul rang va fi acordat caracteristicii cu cea mai mică valoare; al doilea rang este o caracteristică cu o valoare mai mare etc. Evident, toate caracteristicile trebuie măsurate în aceleași unități, altfel clasarea este imposibilă. De exemplu, este imposibil să clasați indicatorii în Cattell Personality Inventory (16PF) dacă aceștia sunt exprimați în puncte „brute”, deoarece intervalele de valori pentru diferiți factori sunt diferite: de la 0 la 13, de la 0 la

    20 și de la 0 la 26. Nu putem spune care factor va ocupa primul loc în ceea ce privește severitatea până când nu aducem toate valorile la o singură scară (cel mai adesea aceasta este scara de perete).

    Dacă ierarhiile individuale ale două subiecți sunt legate pozitiv, atunci trăsăturile care au ranguri scăzute într-unul dintre ele vor avea ranguri scăzute în celălalt și invers. De exemplu, dacă factorul E (dominanță) al unui subiect are cel mai scăzut rang, atunci factorul altui subiect ar trebui să aibă și un rang scăzut, dacă factorul C al unui subiect

    (stabilitatea emoțională) are cel mai înalt rang, atunci trebuie să aibă și celălalt subiect

    acest factor are un rang înalt etc.

    În al treilea caz (două profiluri de grup), valorile medii de grup obținute în 2 grupe de subiecți sunt clasate în funcție de un anumit set de caracteristici, identice pentru cele două grupuri. În cele ce urmează, linia de raționament este aceeași ca în cele două cazuri precedente.

    În cazul 4 (profiluri individuale și de grup), valorile individuale ale subiectului și valorile medii de grup sunt clasate separat în funcție de același set de caracteristici, care se obțin, de regulă, prin excluderea acestui subiect individual - nu participă la profilul mediu de grup cu care va fi comparat profilul individual. Corelarea rangului va testa cât de consistente sunt profilurile individuale și de grup.

    În toate cele patru cazuri, semnificația coeficientului de corelație rezultat este determinată de numărul de valori clasate N. În primul caz, acest număr va coincide cu dimensiunea eșantionului n. În al doilea caz, numărul de observații va fi numărul de caracteristici care alcătuiesc ierarhia. În al treilea și al patrulea caz, N este, de asemenea, numărul de caracteristici comparate, și nu numărul de subiecți din grupuri. Explicații detaliate sunt date în exemple. Dacă valoarea absolută a lui rs atinge sau depășește o valoare critică, corelația este fiabilă.

    Ipoteze.

    Există două ipoteze posibile. Primul se aplică pentru cazul 1, al doilea pentru celelalte trei cazuri.

    Prima versiune a ipotezelor

    H0: Corelația dintre variabilele A și B nu este diferită de zero.

    H1: Corelația dintre variabilele A și B este semnificativ diferită de zero.

    A doua versiune a ipotezelor

    H0: Corelația dintre ierarhiile A și B nu este diferită de zero.

    H1: Corelația dintre ierarhiile A și B este semnificativ diferită de zero.

    Limitări ale coeficientului de corelare a rangului

    1. Pentru fiecare variabilă trebuie prezentate cel puțin 5 observații. Limita superioară a probei este determinată de tabelele disponibile de valori critice.

    2. Coeficientul de corelație a rangului lui Spearman rs cu un număr mare de ranguri identice pentru una sau ambele variabile comparate oferă valori brute. În mod ideal, ambele serii corelate ar trebui să reprezinte două secvențe de valori divergente. Dacă această condiție nu este îndeplinită, este necesar să se facă o ajustare pentru ranguri egale.

    Coeficientul de corelare a rangului lui Spearman este calculat folosind formula:

    Dacă în ambele serii de ranguri comparate există grupuri de aceleași ranguri, înainte de a calcula coeficientul de corelare a rangului este necesar să se facă corecții pentru aceleași ranguri Ta și Tv:

    Ta = Σ (a3 – a)/12,

    Тв = Σ (в3 – в)/12,

    unde a este volumul fiecărui grup de ranguri identice din seria de ranguri A, b este volumul fiecăruia

    grupuri de ranguri identice din seria de rang B.

    Pentru a calcula valoarea empirică a lui rs, utilizați formula:

    Calculul coeficientului de corelație a rangului lui Spearman rs

    1. Stabiliți la ce două caracteristici sau două ierarhii de caracteristici vor participa

    comparație ca variabile A și B.

    2. Clasificați valorile variabilei A, atribuind rangul 1 celei mai mici valori, în conformitate cu regulile de clasare (vezi P.2.3). Introduceți rangurile în prima coloană a tabelului în ordinea numerelor sau a caracteristicilor subiecților de testare.

    3. Clasificați valorile variabilei B în conformitate cu aceleași reguli. Introduceți rangurile în a doua coloană a tabelului în ordinea numerelor subiectelor sau caracteristicilor.

    5. Patratează fiecare diferență: d2. Introduceți aceste valori în a patra coloană a tabelului.

    Ta = Σ (a3 – a)/12,

    Тв = Σ (в3 – в)/12,

    unde a este volumul fiecărui grup de ranguri identice din seria de rang A; c – volumul fiecărei grupe

    ranguri identice în seria de clasare B.

    a) în lipsa unor ranguri identice

    rs  1 − 6 ⋅

    b) în prezenţa unor ranguri identice

    Σd 2  T  T

    r  1 − 6 ⋅ a în,

    unde Σd2 este suma diferențelor pătrate dintre rânduri; Ta și TV - corecții pentru același

    N – numărul de subiecte sau caracteristici care participă la clasament.

    9. Determinați din Tabel (vezi Anexa 4.3) valorile critice ale rs pentru un N dat. Dacă rs depășește valoarea critică sau este cel puțin egală cu aceasta, corelația este semnificativ diferită de 0.

    Exemplul 4.1 La determinarea gradului de dependență a reacției consumului de alcool de reacția oculomotorie în lotul de testat, s-au obținut date înainte și după consumul de alcool. Reacția subiectului depinde de starea de ebrietate?

    Rezultatele experimentului:

    Înainte: 16, 13, 14, 9, 10, 13, 14, 14, 18, 20, 15, 10, 9, 10, 16, 17, 18. După: 24, 9, 10, 23, 20, 11, 12, 19, 18, 13, 14, 12, 14, 7, 9, 14. Să formulăm ipoteze:

    H0: corelația dintre gradul de dependență al reacției înainte și după consumul de alcool nu diferă de zero.

    H1: corelația dintre gradul de dependență al reacției înainte și după consumul de alcool este semnificativ diferită de zero.

    Tabelul 4.1. Calculul d2 pentru coeficientul de corelare a rangului lui Spearman rs atunci când se compară indicatorii de reacție oculomotorie înainte și după experiment (N=17)

    valorile

    valorile

    Deoarece avem ranguri care se repetă, în acest caz vom aplica formula ajustată pentru ranguri identice:

    Ta= ((23-2)+(33-3)+(23-2)+(33-3)+(23-2)+(23-2))/12=6

    Тb =((23-2)+(23-2)+(33-3))/12=3

    Să găsim valoarea empirică a coeficientului Spearman:

    rs = 1- 6*((767,75+6+3)/(17*(172-1)))=0,05

    Folosind tabelul (Anexa 4.3) găsim valorile critice ale coeficientului de corelație

    0,48 (p ≤ 0,05)

    0,62 (p ≤ 0,01)

    Primim

    rs=0,05∠rcr(0,05)=0,48

    Concluzie: ipoteza H1 este respinsă și H0 este acceptată. Acestea. corelație între grad

    dependența reacției înainte și după consumul de alcool nu diferă de zero.