Și altele, toate sunt estimări ale analogilor lor teoretici, care ar putea fi obținute dacă nu ar fi disponibil un eșantion, ci o populație generală. Dar, din păcate, populația generală este foarte scumpă și adesea inaccesibilă.

Conceptul de estimare a intervalului

Orice estimare a eșantionului are o oarecare răspândire, pentru că este o variabilă aleatorie în funcție de valorile dintr-un anumit eșantion. Prin urmare, pentru concluzii statistice mai fiabile, ar trebui să se cunoască nu numai estimarea punctuală, ci și intervalul, care cu o probabilitate mare γ (gama) acoperă indicatorul evaluat θ (theta).

Formal, acestea sunt două astfel de valori (statistici) T 1 (X)Și T 2 (X), Ce T 1< T 2 , pentru care la un nivel de probabilitate dat γ conditia este indeplinita:

Pe scurt, este probabil γ sau mai mult indicatorul adevărat este între puncte T 1 (X)Și T 2 (X), care sunt numite limite inferioare și superioare interval de încredere.

Una dintre condițiile pentru construcție intervale de încredere este îngustimea sa maximă, adică ar trebui să fie cât mai scurt posibil. Dorința este destul de firească, pentru că... cercetătorul încearcă să localizeze mai precis locația parametrului dorit.

Rezultă că intervalul de încredere trebuie să acopere probabilitățile maxime ale distribuției. iar evaluarea în sine ar trebui să fie în centru.

Adică, probabilitatea de abatere (a indicatorului adevărat de la estimare) în sus este egală cu probabilitatea de abatere în jos. De asemenea, trebuie menționat că pentru distribuțiile asimetrice intervalul din dreapta nu este egal cu intervalul stânga.

Figura de mai sus arată clar că, cu cât probabilitatea de încredere este mai mare, cu atât intervalul este mai larg - o relație directă.

Aceasta a fost o scurtă introducere în teoria estimării pe intervale a parametrilor necunoscuți. Să trecem la găsirea limitelor de încredere pentru așteptarea matematică.

Interval de încredere pentru așteptările matematice

Dacă datele originale sunt distribuite peste , atunci media va fi o valoare normală. Aceasta rezultă din regula că o combinație liniară de valori normale are și o distribuție normală. Prin urmare, pentru a calcula probabilitățile am putea folosi aparatul matematic al legii distribuției normale.

Cu toate acestea, acest lucru va necesita cunoașterea a doi parametri - așteptarea și variația, care sunt de obicei necunoscute. Puteți folosi, desigur, estimări în loc de parametri (media aritmetică și ), dar atunci distribuția mediei nu va fi complet normală, va fi ușor aplatizată în jos. Acest fapt a fost remarcat inteligent de cetățeanul irlandez William Gosset, publicându-și descoperirea în numărul din martie 1908 al revistei Biometrica. Din motive de secret, Gosset s-a semnat Student. Așa a apărut distribuția t Student.

Cu toate acestea, distribuția normală a datelor, folosită de K. Gauss în analiza erorilor în observațiile astronomice, este extrem de rară în viața pământească și este destul de greu de stabilit (pentru o precizie ridicată sunt necesare aproximativ 2 mii de observații). Prin urmare, cel mai bine este să renunțați la ipoteza de normalitate și să utilizați metode care nu depind de distribuția datelor originale.

Se pune întrebarea: care este distribuția mediei aritmetice dacă este calculată din datele unei distribuții necunoscute? Răspunsul este dat de binecunoscuta teoria probabilității Teorema limitei centrale(CPT). În matematică, există mai multe variante ale acesteia (formulările au fost rafinate de-a lungul anilor), dar toate, grosier vorbind, se rezumă la afirmația că suma cantitate mare variabile aleatoare independente se supune legea normală distribuţiile.

La calcularea mediei aritmetice se folosește suma variabilelor aleatoare. De aici rezultă că media aritmetică are o distribuție normală, în care așteptarea este așteptarea datelor originale, iar varianța este .

Oameni desteptiștii cum să dovedești CLT, dar vom verifica acest lucru cu ajutorul unui experiment realizat în Excel. Să simulăm un eșantion de 50 de variabile aleatoare distribuite uniform (folosind Funcții Excel CAZ ÎNTRE). Apoi vom face 1000 de astfel de mostre și vom calcula media aritmetică pentru fiecare. Să ne uităm la distribuția lor.

Se poate observa că distribuția mediei este apropiată de legea normală. Dacă dimensiunea și numărul eșantionului sunt și mai mari, asemănarea va fi și mai bună.

Acum că am văzut cu ochii noștri validitatea CLT, putem, folosind , calcula intervale de încredere pentru media aritmetică, care acoperă media adevărată sau așteptarea matematică cu o probabilitate dată.

Pentru a stabili limitele superioare și inferioare, trebuie să cunoașteți parametrii distribuției normale. De regulă, nu există, așa că sunt utilizate estimări: medie aritmeticăȘi varianța eșantionului. Repet, această metodă oferă o aproximare bună doar cu mostre mari. Când mostrele sunt mici, se recomandă adesea să folosiți distribuția Student. Nu crede! Distribuția Student pentru medie apare numai atunci când datele originale sunt distribuite în mod normal, adică aproape niciodată. Prin urmare, este mai bine să setați imediat o bară minimă pentru cantitatea de date necesare și să utilizați metode corecte asimptotic. Se spune că 30 de observații sunt suficiente. Luați 50 - nu veți greși.

T 1.2– limitele inferioare și superioare ale intervalului de încredere

– medie aritmetică eșantionului

s 0– abaterea standard a eșantionului (nepărtinitoare)

n - marime de mostra

γ – probabilitatea de încredere (de obicei egală cu 0,9, 0,95 sau 0,99)

c γ =Φ -1 ((1+γ)/2)– valoarea inversă a funcției de distribuție normală standard. Mai simplu spus, acesta este numărul de erori standard de la media aritmetică la limita inferioară sau superioară (aceste trei probabilități corespund valorilor de 1,64, 1,96 și 2,58).

Esența formulei este că se ia media aritmetică și apoi se pune deoparte o anumită sumă ( cu γ) erori standard ( s 0 /√n). Totul este cunoscut, luați-l și luați în considerare.

Înainte de utilizarea pe scară largă a computerelor personale, acestea obțineau valorile funcției de distribuție normală și inversul acesteia. Ele sunt încă folosite astăzi, dar este mai eficient să folosiți formule Excel gata făcute. Toate elementele din formula de mai sus ( , și ) pot fi calculate cu ușurință în Excel. Dar există o formulă gata făcută pentru calcularea intervalului de încredere - ÎNCREDERE.NORMĂ. Sintaxa sa este următoarea.

CONFIDENCE.NORM(alpha;standard_off;size)

alfa– nivelul de semnificație sau nivelul de încredere, care în notația adoptată mai sus este egal cu 1- γ, i.e. probabilitatea ca matematicaașteptarea va fi în afara intervalului de încredere. Cu un nivel de încredere de 0,95, alfa este 0,05 etc.

standard_off– abaterea standard a datelor eșantionului. Nu este nevoie să calculați eroarea standard; Excel însuși va împărți la rădăcina lui n.

mărimea– dimensiunea eșantionului (n).

Rezultatul functiei NORMA DE INCREDERE este al doilea termen din formula de calcul a intervalului de incredere, i.e. jumătate de interval În consecință, punctele inferior și superior sunt media ± valoarea obținută.

Astfel, este posibil să se construiască un algoritm universal pentru calcularea intervalelor de încredere pentru media aritmetică, care nu depinde de distribuția datelor originale. Prețul pentru universalitate este natura sa asimptotică, adică. necesitatea folosirii de mostre relativ mari. Cu toate acestea, în vârstă tehnologii moderne colectarea cantitatea necesară datele nu sunt de obicei dificile.

Testarea ipotezelor statistice folosind intervale de încredere

(modulul 111)

Una dintre principalele probleme rezolvate în statistică este. Esența sa este pe scurt după cum urmează. Se presupune, de exemplu, că așteptarea populatie egală cu o anumită valoare. Apoi se construiește distribuția mijloacelor eșantionului care pot fi observate pentru o așteptare dată. Apoi, ei analizează unde în această distribuție condiționată se află media reală. Dacă depășește limitele acceptabile, atunci apariția unei astfel de medii este foarte puțin probabilă, iar dacă experimentul se repetă o dată, este aproape imposibil, ceea ce contrazice ipoteza propusă, care este respinsă cu succes. Dacă media nu depășește nivelul critic, atunci ipoteza nu este respinsă (dar nici dovedită!).

Deci, cu ajutorul intervalelor de încredere, în cazul nostru pentru așteptare, puteți testa și unele ipoteze. Este foarte ușor de făcut. Să presupunem că media aritmetică pentru un anumit eșantion este egală cu 100. Se testează ipoteza că valoarea așteptată este, să zicem, 90. Adică, dacă punem întrebarea în mod primitiv, sună așa: poate fi oare asta cu adevăratul valoarea mediei egală cu 90, media observată sa dovedit a fi 100?

Pentru a răspunde la această întrebare, veți avea nevoie în plus de informații despre abaterea standard și dimensiunea eșantionului. Sa spunem deviație standard este 30, iar numărul de observații este 64 (astfel încât rădăcina să poată fi extrasă cu ușurință). Atunci eroarea standard a mediei este 30/8 sau 3,75. Pentru a calcula un interval de încredere de 95%, va trebui să adăugați două erori standard de fiecare parte a mediei (mai precis, 1,96). Intervalul de încredere va fi de aproximativ 100±7,5 sau de la 92,5 la 107,5.

Raționamentul suplimentar este următorul. Dacă valoarea testată se încadrează în intervalul de încredere, atunci nu contrazice ipoteza, deoarece se încadrează în limitele fluctuaţiilor aleatorii (cu o probabilitate de 95%). Dacă punctul verificat se încadrează în afara intervalului de încredere, atunci probabilitatea unui astfel de eveniment este foarte mică, în orice caz sub nivelul acceptabil. Aceasta înseamnă că ipoteza este respinsă ca fiind în contradicție cu datele observate. În cazul nostru, ipoteza despre valoarea așteptată este în afara intervalului de încredere (valoarea testată de 90 nu este inclusă în intervalul 100±7,5), deci ar trebui respinsă. Răspunzând la întrebarea primitivă de mai sus, ar trebui spus: nu, nu se poate, în niciun caz, acest lucru se întâmplă extrem de rar. Adesea, ele indică probabilitatea specifică de a respinge eronat ipoteza (nivelul p), și nu nivelul specificat pe care a fost construit intervalul de încredere, ci mai mult de altă dată.

După cum puteți vedea, construirea unui interval de încredere pentru medie (sau așteptarea matematică) nu este dificilă. Principalul lucru este să înțelegeți esența, iar apoi lucrurile vor merge mai departe. În practică, cele mai multe cazuri folosesc un interval de încredere de 95%, care este de aproximativ două erori standard de fiecare parte a mediei.

Asta este tot pentru acum. Toate cele bune!

Adesea, evaluatorul trebuie să analizeze piața imobiliară a segmentului în care se află proprietatea evaluată. Dacă piața este dezvoltată, poate fi dificil să se analizeze întregul set de obiecte prezentate, așa că pentru analiză se folosește un eșantion de obiecte. Acest eșantion nu se dovedește întotdeauna a fi omogen; uneori este necesar să îl curățați de punctele extreme - oferte de piață prea mari sau prea scăzute. În acest scop este folosit interval de încredere. Scopul acestui studiu este de a efectua o analiză comparativă a două metode de calculare a intervalului de încredere și de a alege cea mai buna varianta calcule atunci când lucrați cu diferite mostre în sistemul estimatica.pro.

Intervalul de încredere este un interval de valori ale atributelor calculate pe baza unui eșantion, care, cu o probabilitate cunoscută, conține parametrul estimat al populației generale.

Scopul calculării unui interval de încredere este de a construi un astfel de interval pe baza datelor eșantionului, astfel încât să se poată afirma cu o probabilitate dată că valoarea parametrului estimat se află în acest interval. Cu alte cuvinte, intervalul de încredere conține valoarea necunoscută a valorii estimate cu o anumită probabilitate. Cu cât intervalul este mai larg, cu atât este mai mare inexactitatea.

Există diferite metode pentru determinarea intervalului de încredere. În acest articol ne vom uita la 2 metode:

  • prin abaterea mediană și standard;
  • prin valoarea critică a t-statisticilor (coeficientul Student).

Etapele analizei comparative căi diferite calcul CI:

1. formați un eșantion de date;

2. procesează-l metode statistice: calculați media, mediana, varianța etc.;

3. calculați intervalul de încredere în două moduri;

4. analizați probele curățate și intervalele de încredere rezultate.

Etapa 1. Eșantionarea datelor

Eșantionul a fost format folosind sistemul estimatica.pro. Eșantionul a inclus 91 de oferte pentru vânzarea de apartamente cu 1 cameră în zona a 3-a de preț cu aspectul de tip „Hrușciov”.

Tabelul 1. Proba inițială

Pret 1 mp, unitate

Fig.1. Proba inițială



Etapa 2. Prelucrarea probei inițiale

Procesarea unui eșantion folosind metode statistice necesită calcularea următoarelor valori:

1. Media aritmetică

2. Mediana este un număr care caracterizează eșantionul: exact jumătate dintre elementele eșantionului sunt mai mari decât mediana, cealaltă jumătate sunt mai mici decât mediana

(pentru un eșantion cu un număr impar de valori)

3. Interval - diferența dintre valorile maxime și minime din eșantion

4. Varianta - folosită pentru a estima mai precis variația datelor

5. Abaterea standard eșantion (în continuare - SD) este cel mai frecvent indicator al dispersării valorilor de ajustare în jurul mediei aritmetice.

6. Coeficient de variație – reflectă gradul de împrăștiere a valorilor de ajustare

7. coeficient de oscilație - reflectă fluctuația relativă a valorilor extreme ale prețurilor din eșantion în jurul valorii medii

Tabelul 2. Indicatori statistici ai eșantionului inițial

Coeficientul de variație, care caracterizează omogenitatea datelor, este de 12,29%, dar coeficientul de oscilație este prea mare. Astfel, putem spune că eșantionul original nu este omogen, așa că să trecem la calcularea intervalului de încredere.

Etapa 3. Calculul intervalului de încredere

Metoda 1. Calcul folosind mediana și abaterea standard.

Intervalul de încredere se determină astfel: valoare minimă - abaterea standard se scade din mediană; valoarea maximă - abaterea standard se adaugă la mediană.

Astfel, intervalul de încredere (47179 CU; 60689 CU)

Orez. 2. Valori care se încadrează în intervalul de încredere 1.



Metoda 2. Construirea unui interval de încredere folosind valoarea critică a statisticilor t (coeficientul studentului)

S.V. Gribovsky în cartea „ Metode matematice Estimarea valorii proprietății” descrie o metodă pentru calcularea unui interval de încredere folosind coeficientul Student. Atunci când calculează folosind această metodă, estimatorul trebuie să stabilească el însuși nivelul de semnificație ∝, care determină probabilitatea cu care va fi construit intervalul de încredere. În mod obișnuit, sunt utilizate niveluri de semnificație de 0,1; 0,05 și 0,01. Ele corespund probabilităților de încredere de 0,9; 0,95 și 0,99. Cu această metodă, se presupune că adevăratele valori ale așteptării și varianței matematice sunt practic necunoscute (ceea ce este aproape întotdeauna adevărat atunci când se rezolvă probleme practice de estimare).

Formula intervalului de încredere:

n - dimensiunea eșantionului;

Valoarea critică a t-statisticilor (distribuția Student) cu un nivel de semnificație ∝, numărul de grade de libertate n-1, care se determină din tabele statistice speciale sau folosind MS Excel (→„Statistice”→ STUDIST);

∝ - nivelul de semnificație, luați ∝=0,01.

Orez. 2. Valori care se încadrează în intervalul de încredere 2.

Etapa 4. Analiza diferitelor metode de calcul a intervalului de încredere

Două metode de calcul a intervalului de încredere - prin mediană și coeficientul Student - au condus la sensuri diferite intervale. În consecință, am primit două mostre diferite curățate.

Tabelul 3. Statistici pentru trei eșantioane.

Index

Proba inițială

1 opțiune

Opțiunea 2

Valoarea medie

Dispersia

Coef. variatii

Coef. oscilații

Număr de obiecte retrase, buc.

Pe baza calculelor efectuate, putem spune că valorile intervalului de încredere obținute prin diferite metode se intersectează, astfel încât puteți utiliza oricare dintre metodele de calcul la discreția evaluatorului.

Considerăm însă că atunci când lucrăm în sistemul estimatica.pro, este indicat să alegeți o metodă de calcul a intervalului de încredere în funcție de gradul de dezvoltare a pieței:

  • dacă piața este nedezvoltată, utilizați metoda de calcul folosind mediana și abaterea standard, deoarece numărul de obiecte retrase în acest caz este mic;
  • dacă piața este dezvoltată, aplicați calculul prin valoarea critică a t-statisticilor (coeficientul Student), deoarece este posibil să se formeze un eșantion inițial mare.

La pregătirea articolului s-au folosit următoarele:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Metode matematice de evaluare a valorii proprietatii. Moscova, 2014

2. System data estimatica.pro

Interval de încredere pentru așteptările matematice - acesta este un interval calculat din date care, cu o probabilitate cunoscuta, contine asteptarea matematica a populatiei generale. O estimare naturală a așteptărilor matematice este media aritmetică a valorilor observate. Prin urmare, pe parcursul lecției vom folosi termenii „medie” și „valoare medie”. În problemele de calculare a unui interval de încredere, un răspuns cel mai adesea solicitat este „Intervalul de încredere al numărului mediu [valoarea în sarcina specifica] este de la [valoarea cea mai mică] la [ valoare mai mare]". Folosind un interval de încredere, puteți estima nu numai valori medii, ci și ponderea specifică a unei anumite caracteristici a populației. Valori medii, varianță, deviație standard iar erorile prin care vom ajunge la noi definiții și formule sunt discutate în lecție Caracteristicile eșantionului și populației .

Estimări punctuale și pe intervale ale mediei

Dacă valoarea medie a populației este estimată printr-un număr (punct), atunci o medie specifică, care este calculată dintr-un eșantion de observații, este luată ca o estimare a valorii medii necunoscute a populației. În acest caz, valoarea mediei eșantionului este variabilă aleatorie- nu coincide cu valoarea medie a populatiei. Prin urmare, atunci când indicați media eșantionului, trebuie să indicați simultan eroarea de eșantionare. Măsura erorii de eșantionare este eroarea standard, care este exprimată în aceleași unități ca și media. Prin urmare, se folosește adesea următoarea notație: .

Dacă estimarea mediei trebuie să fie asociată cu o anumită probabilitate, atunci parametrul de interes în populație trebuie evaluat nu printr-un număr, ci printr-un interval. Un interval de încredere este un interval în care, cu o anumită probabilitate P se constată valoarea indicatorului populaţiei estimate. Interval de încredere în care este probabil P = 1 - α se găsește variabila aleatoare, calculată după cum urmează:

,

α = 1 - P, care poate fi găsit în anexa la aproape orice carte de statistică.

În practică, media și varianța populației nu sunt cunoscute, astfel încât varianța populației este înlocuită cu varianța eșantionului, iar media populației cu media eșantionului. Astfel, intervalul de încredere în majoritatea cazurilor se calculează după cum urmează:

.

Formula intervalului de încredere poate fi utilizată pentru a estima media populației dacă

  • se cunoaște abaterea standard a populației;
  • sau abaterea standard a populației este necunoscută, dar dimensiunea eșantionului este mai mare de 30.

Media eșantionului este o estimare imparțială a mediei populației. La rândul său, varianța eșantionului nu este o estimare imparțială a varianței populației. Pentru a obține o estimare imparțială a varianței populației în formula variației eșantionului, dimensiunea eșantionului n ar trebui înlocuit cu n-1.

Exemplul 1. S-au colectat informații din 100 de cafenele selectate aleatoriu dintr-un anumit oraș că numărul mediu de angajați din acestea este de 10,5 cu o abatere standard de 4,6. Determinați intervalul de încredere de 95% pentru numărul de angajați ai cafenelei.

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,05 .

Astfel, intervalul de încredere de 95% pentru numărul mediu de angajați ai cafenelei a variat între 9,6 și 11,4.

Exemplul 2. Pentru un eșantion aleatoriu dintr-o populație de 64 de observații, au fost calculate următoarele valori totale:

suma valorilor din observații,

suma abaterilor pătrate ale valorilor de la medie .

Calculați intervalul de încredere de 95% pentru așteptările matematice.

Să calculăm abaterea standard:

,

Să calculăm valoarea medie:

.

Înlocuim valorile în expresia pentru intervalul de încredere:

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,05 .

Primim:

Astfel, intervalul de încredere de 95% pentru așteptarea matematică a acestui eșantion a variat între 7,484 și 11,266.

Exemplul 3. Pentru un eșantion de populație aleatoriu de 100 de observații, media calculată este 15,2 și abaterea standard este 3,2. Calculați intervalul de încredere de 95% pentru valoarea așteptată, apoi intervalul de încredere de 99%. Dacă puterea eșantionului și variația acesteia rămân neschimbate și coeficientul de încredere crește, intervalul de încredere se va îngusta sau se va lărgi?

Inlocuim aceste valori in expresia pentru intervalul de incredere:

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,05 .

Primim:

.

Astfel, intervalul de încredere de 95% pentru media acestui eșantion a variat între 14,57 și 15,82.

Substituim din nou aceste valori în expresia pentru intervalul de încredere:

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,01 .

Primim:

.

Astfel, intervalul de încredere de 99% pentru media acestui eșantion a variat între 14,37 și 16,02.

După cum vedem, pe măsură ce coeficientul de încredere crește, crește și valoarea critică a distribuției normale standard și, în consecință, punctele de început și de sfârșit ale intervalului sunt situate mai departe de medie și astfel intervalul de încredere pentru așteptarea matematică crește. .

Estimări punctiforme și pe intervale ale greutății specifice

Ponderea unui atribut al eșantionului poate fi interpretată ca o estimare punctuală a cotei p de aceeaşi caracteristică în populaţia generală. Dacă această valoare trebuie să fie asociată cu probabilitatea, atunci intervalul de încredere al greutății specifice trebuie calculat p caracteristică în populaţie cu probabilitate P = 1 - α :

.

Exemplul 4.Într-un oraș sunt doi candidați AȘi B candideaza la functia de primar. 200 de locuitori ai orașului au fost chestionați aleatoriu, dintre care 46% au răspuns că ar vota pentru candidat A, 26% - pentru candidat B iar 28% nu știu pe cine vor vota. Determinați intervalul de încredere de 95% pentru proporția de locuitori ai orașului care susțin candidatul A.

Orice eșantion oferă doar o idee aproximativă a populației generale, iar toate caracteristicile statistice ale eșantionului (medie, mod, varianță...) sunt o aproximare sau spunem o estimare a parametrilor generali, care în majoritatea cazurilor nu sunt posibile de calculat datorită la inaccesibilitatea populaţiei generale (Figura 20) .

Figura 20. Eroare de eșantionare

Dar se poate preciza intervalul în care se află, cu un anumit grad de probabilitate, valoarea adevărată (generală) a caracteristicii statistice. Acest interval se numește d interval de încredere (IC).

Deci, valoarea medie generală cu o probabilitate de 95% se află în interior

de la până la, (20)

Unde t – valoarea de tabel a testului Student pentru α =0,05 și f= n-1

Un CI de 99% poate fi găsit, de asemenea, în acest caz t selectat pentru α =0,01.

Care este semnificația practică a unui interval de încredere?

    Un interval larg de încredere indică faptul că media eșantionului nu reflectă cu acuratețe media populației. Acest lucru se datorează de obicei unei dimensiuni insuficiente a eșantionului sau eterogenității acestuia, de exemplu. dispersie mare. Ambele dau o eroare mai mare a mediei și, în consecință, un CI mai larg. Și aceasta este baza pentru revenirea la etapa de planificare a cercetării.

    Limitele superioare și inferioare ale CI oferă o estimare a faptului dacă rezultatele vor fi semnificative clinic

Să ne oprim în detaliu asupra chestiunii semnificației statistice și clinice a rezultatelor studiului proprietăților grupului. Să ne amintim că sarcina statisticilor este de a detecta cel puțin unele diferențe în populațiile generale pe baza datelor eșantionului. Provocarea pentru clinicieni este de a detecta diferențele (nu oricare) care vor ajuta la diagnostic sau tratament. Iar concluziile statistice nu sunt întotdeauna la baza concluziilor clinice. Astfel, o scădere semnificativă statistic a hemoglobinei cu 3 g/l nu este un motiv de îngrijorare. Și, invers, dacă vreo problemă din corpul uman nu este răspândită la nivelul întregii populații, acesta nu este un motiv pentru a nu face față acestei probleme.

Să ne uităm la această situație exemplu.

Cercetătorii s-au întrebat dacă băieții care au suferit de vreun fel de boală infecțioasă sunt în urmă față de semenii lor în creștere. În acest scop s-a realizat sondaj prin sondaj, la care au participat 10 băieți care suferiseră de această boală. Rezultatele sunt prezentate în Tabelul 23.

Tabelul 23. Rezultatele prelucrărilor statistice

limita inferioara

Limita superioară

Standarde (cm)

in medie

Din aceste calcule rezultă că înălțimea medie a eșantionului a băieților de 10 ani care au suferit unele infecţie, aproape de normal (132,5 cm). Cu toate acestea, limita inferioară a intervalului de încredere (126,6 cm) indică faptul că există o probabilitate de 95% ca înălțimea medie adevărată a acestor copii să corespundă conceptului de „înălțime mică”, adică. acești copii sunt pipernici.

În acest exemplu, rezultatele calculelor intervalului de încredere sunt semnificative clinic.

Intervale de încredere.

Calculul intervalului de încredere se bazează pe eroarea medie a parametrului corespunzător. Interval de încredere arată în ce limite cu probabilitate (1-a) se află adevărata valoare a parametrului estimat. Aici a este nivelul de semnificație, (1-a) se mai numește și probabilitate de încredere.

În primul capitol am arătat că, de exemplu, pentru media aritmetică, media reală a populației în aproximativ 95% din cazuri se află în 2 erori standard ale mediei. Astfel, limitele intervalului de încredere de 95% pentru medie vor fi separate de media eșantionului de două ori eroarea medie a mediei, i.e. înmulțim eroarea medie a mediei cu un anumit coeficient în funcție de nivelul de încredere. Pentru media și diferența de medii se ia coeficientul Student (valoarea critică a testului Student), pentru ponderea și diferența de cote, valoarea critică a criteriului z. Produsul dintre coeficient și eroarea medie poate fi numit eroarea maximă a unui parametru dat, adică maximul pe care îl putem obţine la evaluarea acestuia.

Interval de încredere pentru medie aritmetică : .

Iată media eșantionului;

Eroarea medie a mediei aritmetice;

s – abaterea standard a probei;

n

f = n-1 (Coeficientul elevului).

Interval de încredere pentru diferențe de medii aritmetice :

Iată diferența dintre mediile eșantionului;

- eroarea medie a diferenţei dintre mediile aritmetice;

s 1 , s 2 – abateri standard ale probei;

n1,n2

Valoarea critică a testului Student pentru un anumit nivel de semnificație a și numărul de grade de libertate f=n 1 + n 2-2 (Coeficientul elevului).

Interval de încredere pentru acțiuni :

.

Aici d este fracția eșantionului;

– eroare medie de fracție;

n– dimensiunea eșantionului (mărimea grupului);

Interval de încredere pentru diferenta de actiuni :

Iată diferența dintre cotele eșantionului;

– eroarea medie a diferenței dintre mediile aritmetice;

n1,n2– volume de probe (număr de grupuri);

Valoarea critică a criteriului z la un nivel de semnificație dat a ( , , ).

Calculând intervalele de încredere pentru diferența dintre indicatori, în primul rând, vedem direct valori posibile efect, și nu doar estimarea sa punctuală. În al doilea rând, putem trage o concluzie despre acceptarea sau respingerea ipotezei nule și, în al treilea rând, putem trage o concluzie despre puterea testului.

Când se testează ipoteze folosind intervale de încredere, trebuie să se respecte următoarea regulă:

Dacă intervalul de încredere de 100(1-a) procente al diferenței de medii nu conține zero, atunci diferențele sunt semnificative statistic la nivelul de semnificație a; dimpotrivă, dacă acest interval conține zero, atunci diferențele nu sunt semnificative statistic.

Într-adevăr, dacă acest interval conține zero, înseamnă că indicatorul comparat poate fi fie mai mare, fie mai mic într-unul dintre grupuri comparativ cu celălalt, adică. diferenţele observate se datorează întâmplării.

Puterea testului poate fi judecată după locația lui zero în intervalul de încredere. Dacă zero este aproape de limita inferioară sau superioară a intervalului, atunci este posibil ca, cu un număr mai mare de grupuri comparate, diferențele să ajungă la semnificație statistică. Dacă zero este aproape de mijlocul intervalului, înseamnă că atât o creștere, cât și o scădere a indicatorului în grupul experimental sunt la fel de probabile și, probabil, chiar nu există diferențe.

Exemple:

Pentru a compara mortalitatea chirurgicală la utilizarea a două tipuri diferite de anestezie: 61 de persoane au fost operate cu primul tip de anestezie, 8 au murit, cu al doilea tip – 67 de persoane, 10 au murit.

d 1 = 8/61 = 0,131; d2 = 10/67 = 0,149; d1-d2 = - 0,018.

Diferența de letalitate a metodelor comparate va fi în intervalul (-0,018 - 0,122; -0,018 + 0,122) sau (-0,14; 0,104) cu o probabilitate de 100(1-a) = 95%. Intervalul conține zero, adică. ipoteză despre aceeași letalitate în doi tipuri diferite Anestezia nu poate fi respinsă.

Astfel, rata mortalității poate și va scădea la 14% și crește la 10,4% cu o probabilitate de 95%, adică. zero este aproximativ la mijlocul intervalului, deci se poate argumenta că, cel mai probabil, aceste două metode nu diferă într-adevăr în ceea ce privește letalitatea.

În exemplul discutat mai devreme, timpul mediu de apăsare în timpul testului de atingere a fost comparat în patru grupuri de studenți care diferă în punctaje la examen. Să calculăm intervalele de încredere pentru timpul mediu de presare pentru elevii care au promovat examenul cu clasele 2 și 5 și intervalul de încredere pentru diferența dintre aceste medii.

Coeficienții lui Student se găsesc folosind tabelele de distribuție a lui Student (vezi anexa): pentru prima grupă: = t(0,05;48) = 2,011; pentru a doua grupă: = t(0,05;61) = 2,000. Astfel, intervale de încredere pentru primul grup: = (162,19-2,011*2,18; 162,19+2,011*2,18) = (157,8; 166,6), pentru al doilea grup (156,55- 2.000*1,88; 156,08)*5 (156,08)*5 (156,08) ; 160,3). Deci, pentru cei care au promovat examenul cu 2, timpul mediu de apăsare variază de la 157,8 ms la 166,6 ms cu o probabilitate de 95%, pentru cei care au promovat examenul cu 5 – de la 152,8 ms la 160,3 ms cu o probabilitate de 95% .

De asemenea, puteți testa ipoteza nulă folosind intervale de încredere pentru medii și nu doar pentru diferența de medii. De exemplu, ca și în cazul nostru, dacă intervalele de încredere pentru medii se suprapun, atunci ipoteza nulă nu poate fi respinsă. Pentru a respinge o ipoteză la un nivel de semnificație ales, intervalele de încredere corespunzătoare nu trebuie să se suprapună.

Să aflăm intervalul de încredere pentru diferența de timp mediu de presare la loturile care au promovat examenul cu clasele 2 și 5. Diferența de medii: 162,19 – 156,55 = 5,64. Coeficientul studentului: = t(0,05;49+62-2) = t(0,05;109) = 1,982. Abaterile standard de grup vor fi egale cu: ; . Calculăm eroarea medie a diferenței dintre medii: . Interval de încredere: =(5,64-1,982*2,87; 5,64+1,982*2,87) = (-0,044; 11,33).

Așadar, diferența de timp mediu de presare în grupele care au promovat examenul cu 2 și 5 va fi în intervalul de la -0,044 ms la 11,33 ms. Acest interval include zero, adică Timpul mediu de presare pentru cei care au promovat bine examenul poate fie să crească, fie să scadă în comparație cu cei care au promovat examenul nesatisfăcător, adică. ipoteza nulă nu poate fi respinsă. Dar zero este foarte aproape de limita inferioară, iar timpul de presare este mult mai probabil să scadă pentru cei care au trecut bine. Astfel, putem concluziona că există încă diferențe în timpul mediu de presare între cei care au trecut de 2 și 5, pur și simplu nu le-am putut detecta având în vedere modificarea timpului mediu, răspândirea timpului mediu și dimensiunile eșantionului.



Puterea unui test este probabilitatea de a respinge o ipoteză nulă incorectă, i.e. găsiți diferențele acolo unde acestea există de fapt.

Puterea testului este determinată pe baza nivelului de semnificație, a mărimii diferențelor dintre grupuri, a răspândirii valorilor în grupuri și a mărimii eșantioanelor.

Pentru testul t Student și analiza varianței, pot fi utilizate diagrame de sensibilitate.

Puterea criteriului poate fi utilizată pentru a determina preliminar numărul necesar de grupuri.

Intervalul de încredere arată în ce limite se află valoarea adevărată a parametrului estimat cu o probabilitate dată.

Folosind intervale de încredere, puteți testa ipoteze statistice și puteți trage concluzii despre sensibilitatea criteriilor.

LITERATURĂ.

Glanz S. – Capitolul 6,7.

Rebrova O.Yu. – p.112-114, p.171-173, p.234-238.

Sidorenko E.V. – p.32-33.

Întrebări pentru autotestarea elevilor.

1. Care este puterea criteriului?

2. În ce cazuri este necesară evaluarea puterii criteriilor?

3. Metode de calcul al puterii.

6. Cum se testează o ipoteză statistică folosind un interval de încredere?

7. Ce se poate spune despre puterea criteriului la calcularea intervalului de încredere?

Sarcini.