Orice eșantion oferă doar o idee aproximativă a populației generale, iar toate caracteristicile statistice ale eșantionului (medie, mod, varianță...) sunt o aproximare sau spunem o estimare a parametrilor generali, care în majoritatea cazurilor nu sunt posibile de calculat datorită la inaccesibilitatea populaţiei generale (Figura 20) .

Figura 20. Eroare de eșantionare

Dar se poate preciza intervalul în care se află, cu un anumit grad de probabilitate, valoarea adevărată (generală) a caracteristicii statistice. Acest interval se numește d interval de încredere (IC).

Deci, valoarea medie generală cu o probabilitate de 95% se află în interior

de la până la, (20)

Unde t – valoarea de tabel a testului Student pentru α =0,05 și f= n-1

Un CI de 99% poate fi găsit, de asemenea, în acest caz t selectat pentru α =0,01.

Care este semnificația practică a unui interval de încredere?

    Un interval larg de încredere indică faptul că media eșantionului nu reflectă cu acuratețe media populației. Acest lucru se datorează de obicei unei dimensiuni insuficiente a eșantionului sau eterogenității acestuia, de exemplu. dispersie mare. Ambele dau o eroare mai mare a mediei și, în consecință, un CI mai larg. Și aceasta este baza pentru revenirea la etapa de planificare a cercetării.

    Limitele superioare și inferioare ale CI oferă o estimare a faptului dacă rezultatele vor fi semnificative clinic

Să ne oprim în detaliu asupra chestiunii semnificației statistice și clinice a rezultatelor studiului proprietăților grupului. Să ne amintim că sarcina statisticilor este de a detecta cel puțin unele diferențe în populațiile generale pe baza datelor eșantionului. Provocarea pentru clinicieni este de a detecta diferențele (nu oricare) care vor ajuta la diagnostic sau tratament. Iar concluziile statistice nu sunt întotdeauna la baza concluziilor clinice. Astfel, o scădere semnificativă statistic a hemoglobinei cu 3 g/l nu este un motiv de îngrijorare. Și, invers, dacă vreo problemă din corpul uman nu este răspândită la nivelul întregii populații, acesta nu este un motiv pentru a nu face față acestei probleme.

Să ne uităm la această situație exemplu.

Cercetătorii s-au întrebat dacă băieții care au suferit de vreun fel de boală infecțioasă sunt în urmă față de semenii lor în creștere. În acest scop s-a realizat sondaj prin sondaj, la care au participat 10 băieți care suferiseră de această boală. Rezultatele sunt prezentate în Tabelul 23.

Tabelul 23. Rezultatele prelucrărilor statistice

limita inferioara

Limita superioară

Standarde (cm)

in medie

Din aceste calcule rezultă că înălțimea medie a eșantionului a băieților de 10 ani care au suferit unele infecţie, aproape de normal (132,5 cm). Cu toate acestea, limita inferioară interval de încredere(126,6 cm) indică faptul că există o probabilitate de 95% ca înălțimea medie adevărată a acestor copii să corespundă conceptului de „înălțime mică”, adică. acești copii sunt pipernici.

În acest exemplu, rezultatele calculelor intervalului de încredere sunt semnificative clinic.

Interval de încredere(CI; în engleză, interval de încredere - CI) obținut într-un studiu cu un eșantion oferă o măsură a acurateței (sau incertitudinii) rezultatelor studiului pentru a trage concluzii despre populația tuturor acestor pacienți ( populatie). Definiția corectă a unui CI de 95% poate fi formulată astfel: 95% dintre astfel de intervale vor conține valoarea adevărată în populație. Această interpretare este oarecum mai puțin precisă: CI este intervalul de valori în care puteți fi 95% sigur că conține valoarea adevărată. Când se utilizează un CI, se pune accent pe determinarea unui efect cantitativ, spre deosebire de valoarea P care rezultă din testarea semnificației statistice. Valoarea P nu estimează nicio cantitate, ci servește mai degrabă ca o măsură a puterii dovezilor față de ipoteza nulă a „fără efect”. Valoarea lui P în sine nu ne spune nimic despre mărimea diferenței sau chiar despre direcția acesteia. Prin urmare, valorile P independente sunt absolut neinformative în articole sau rezumate. În schimb, IC indică atât dimensiunea efectului de interes imediat, cum ar fi beneficiul unui tratament, cât și puterea dovezilor. Prin urmare, DI este direct legată de practica EBM.

Abordarea de evaluare a analize statistice, ilustrat printr-un CI, urmărește măsurarea cantității unui efect de interes (sensibilitatea unui test de diagnostic, rata cazurilor prezise, ​​reducerea riscului relativ cu tratament etc.) și, de asemenea, măsurarea incertitudinii în acest efect. Cel mai adesea, CI este intervalul de valori de ambele părți ale estimării în care se află probabil valoarea adevărată și puteți fi 95% sigur de aceasta. Acordul de utilizare a probabilității de 95% este arbitrar, la fel ca și valoarea P.<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

CI se bazează pe ideea că același studiu efectuat pe eșantioane diferite de pacienți nu ar produce rezultate identice, ci că rezultatele acestora ar fi distribuite în jurul unei valori adevărate, dar necunoscute. Cu alte cuvinte, CI îl descrie drept „variabilitate dependentă de eșantion”. CI nu reflectă incertitudine suplimentară din alte motive; în special, nu include impactul pierderii selective în urmărire, conformarea slabă sau măsurarea inexactă a rezultatului, lipsa orbirii etc. Prin urmare, IC subestimează întotdeauna cantitatea totală de incertitudine.

Calcul intervalului de încredere

Tabelul A1.1. Erori standard și intervale de încredere pentru măsurătorile clinice selectate

De obicei, un CI este calculat dintr-o estimare observată a unei cantități, cum ar fi diferența (d) dintre două proporții și eroarea standard (SE) în estimarea acelei diferențe. CI de aproximativ 95% obținut în acest mod este d ± 1,96 SE. Formula se modifică în funcție de natura măsurării rezultatului și de domeniul de aplicare al CI. De exemplu, într-un studiu randomizat, controlat cu placebo, al unui vaccin acelular împotriva pertussis, 72 din 1670 (4,3%) sugari care au primit vaccinul au dezvoltat pertussis și 240 din 1665 (14,4%) în grupul de control. Diferența procentuală, cunoscută sub numele de reducerea absolută a riscului, este de 10,1%. SE a acestei diferențe este de 0,99%. În consecință, IC de 95% este 10,1% + 1,96 x 0,99%, i.e. de la 8.2 la 12.0.

În ciuda abordărilor lor filozofice diferite, CI și testele de semnificație statistică sunt strâns legate din punct de vedere matematic.

Astfel, valoarea P este „semnificativă”, adică. R<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

Incertitudinea (inecizia) estimării, exprimată în CI, este în mare măsură legată de rădăcina pătrată a dimensiunii eșantionului. Eșantioanele mici oferă mai puține informații decât cele mari, iar CI este în mod corespunzător mai larg într-un eșantion mai mic. De exemplu, un articol care compară performanța a trei teste utilizate pentru a diagnostica infecția cu Helicobacter pylori a raportat o sensibilitate a testului respirator cu uree de 95,8% (95% CI 75-100). În timp ce cifra de 95,8% este impresionantă, eșantionul mic de 24 de pacienți adulți cu J. pylori înseamnă că există o incertitudine semnificativă în această estimare, așa cum arată IC larg. Într-adevăr, limita inferioară de 75% este mult mai mică decât estimarea de 95,8%. Dacă s-ar observa aceeași sensibilitate la un eșantion de 240 de persoane, IC de 95% ar fi 92,5-98,0, oferind mai multă siguranță că testul este foarte sensibil.

În studiile randomizate controlate (RCT), rezultatele nesemnificative (adică cele cu P > 0,05) sunt deosebit de susceptibile de interpretare greșită. CI este deosebit de util aici, deoarece arată cât de consistente sunt rezultatele cu efectul real util din punct de vedere clinic. De exemplu, într-un RCT care compară sutura colonică și anastomoza cu capse, infecția plăgii s-a dezvoltat la 10,9% și, respectiv, 13,5% dintre pacienți (P = 0,30). CI de 95% pentru această diferență este de 2,6% (de la -2 la +8). Chiar și în acest studiu pe 652 de pacienți, rămâne posibil să existe o diferență modestă în incidența infecțiilor rezultate din cele două proceduri. Cu cât mai puține cercetări, cu atât este mai mare incertitudinea. Sung și colab. a efectuat un RCT pentru a compara perfuzia de octreotidă cu scleroterapia acută pentru sângerare variceală acută la 100 de pacienți. În grupul cu octreotidă, rata de control a sângerării a fost de 84%; în grupul de scleroterapie - 90%, ceea ce dă P = 0,56. Rețineți că ratele de sângerare în curs sunt similare cu cele pentru infecția rănilor din studiul menționat. În acest caz, totuși, IC de 95% pentru diferența dintre intervenții este de 6% (-7 până la +19). Acest interval este destul de larg în comparație cu diferența de 5% care ar fi de interes clinic. În mod clar, studiul nu exclude o diferență semnificativă de eficacitate. Prin urmare, concluzia autorilor „infuzia de octreotidă și scleroterapia sunt la fel de eficiente în tratamentul sângerării din vene varicoase” este cu siguranță invalidă. În astfel de cazuri, în care, ca și aici, IC de 95% pentru reducerea riscului absolut (ARR) include zero, IC pentru NNT (număr necesar pentru tratare) este destul de dificil de interpretat. NPL și CI se obțin din reciprocele ACP (înmulțind cu 100 dacă aceste valori sunt date ca procente). Aici obținem NPL = 100: 6 = 16,6 cu un CI de 95% de la -14,3 la 5,3. După cum se poate vedea din nota de subsol „d” din tabel. A1.1, acest CI include valorile NPL de la 5,3 la infinit și NPL de la 14,3 la infinit.

CI pot fi construite pentru cele mai utilizate estimări sau comparații statistice. Pentru RCT, include diferența dintre proporțiile medii, riscurile relative, cotele de cote și NLR. În mod similar, CI pot fi obținute pentru toate estimările majore făcute în studiile de acuratețe a testelor de diagnosticare - sensibilitate, specificitate, valoare predictivă pozitivă (toate fiind proporții simple) și rapoarte de probabilitate - estimări obținute în meta-analize și în comparație cu controlul studii. Un program de calculator personal care acoperă multe dintre aceste utilizări ale MDI-urilor este disponibil cu a doua ediție a Statistics with Confidence. Macro-urile pentru calcularea CI pentru proporții sunt disponibile gratuit pentru Excel și programele statistice SPSS și Minitab la http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/proportions, htm.

Estimări multiple ale efectului tratamentului

Deși CI sunt de dorit pentru rezultatele studiului primar, ele nu sunt necesare pentru toate rezultatele. CI se referă la comparații importante din punct de vedere clinic. De exemplu, când se compară două grupuri, CI corect este cel construit pentru diferența dintre grupuri, așa cum se arată în exemplele de mai sus, și nu CI care poate fi construit pentru estimarea în fiecare grup. Nu numai că nu este util să furnizați CI separate pentru estimări în fiecare grup, dar această prezentare poate induce în eroare. În mod similar, abordarea corectă atunci când se compară eficacitatea tratamentelor în diferite subgrupuri este de a compara direct două (sau mai multe) subgrupuri. Este incorect să presupunem că un tratament este eficient într-un singur subgrup dacă CI exclude valoarea corespunzătoare fără efect, iar celelalte nu. CI sunt utile și atunci când se compară rezultatele din mai multe subgrupuri. În fig. A 1.1 arată riscul relativ de eclampsie la femeile cu preeclampsie în subgrupuri de femei dintr-un RCT controlat cu placebo de sulfat de magneziu.

Orez. A1.2. Graficul forestier arată rezultatele a 11 studii clinice randomizate ale vaccinului cu rotavirus bovin pentru prevenirea diareei în comparație cu placebo. Un interval de încredere de 95% a fost utilizat pentru a estima riscul relativ de diaree. Dimensiunea pătratului negru este proporțională cu cantitatea de informații. În plus, sunt prezentate estimarea sumar a eficacității tratamentului și intervalul de încredere de 95% (indicat cu un romb). Meta-analiza a folosit un model de efecte aleatoare mai mare decât unele prespecificate; de exemplu, aceasta ar putea fi dimensiunea utilizată la calcularea mărimii eșantionului. Un criteriu mai strict necesită ca întregul interval CI să prezinte beneficii mai mari decât un minim prespecificat.

Am discutat deja eroarea de a lua o lipsă de semnificație statistică ca un indiciu că două tratamente sunt la fel de eficiente. Este la fel de important să nu echivalăm semnificația statistică cu importanța clinică. Importanța clinică poate fi asumată atunci când rezultatul este semnificativ statistic și amploarea estimării eficacității tratamentului

Studiile pot arăta dacă rezultatele sunt semnificative din punct de vedere statistic și care sunt importante din punct de vedere clinic și care nu. În fig. A1.2 arată rezultatele a patru teste, pentru care întregul CI<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

Există două tipuri de estimări în statistică: punct și interval. Estimare punctuală este un singur eșantion statistic care este utilizat pentru a estima un parametru de populație. De exemplu, media eșantionului este o estimare punctuală a așteptărilor matematice a populației și a varianței eșantionului S 2- estimarea punctuală a varianței populației σ 2. s-a demonstrat că media eșantionului este o estimare imparțială a așteptărilor matematice a populației. O medie a eșantionului se numește imparțial deoarece media tuturor mediilor eșantionului (cu aceeași dimensiune a eșantionului) n) este egală cu așteptarea matematică a populației generale.

Pentru variația eșantionului S 2 a devenit o estimare imparțială a varianței populației σ 2, numitorul varianței eșantionului trebuie setat egal cu n – 1 , dar nu n. Cu alte cuvinte, varianța populației este media tuturor variațiilor posibile ale eșantionului.

La estimarea parametrilor populației, ar trebui să se țină cont de faptul că statisticile eșantionului precum , depind de mostre specifice. A ține cont de acest fapt, a obține estimarea intervalului așteptarea matematică a populației generale, analizați distribuția mediilor eșantionului (pentru mai multe detalii, vezi). Intervalul construit este caracterizat de un anumit nivel de încredere, care reprezintă probabilitatea ca parametrul adevărat al populației să fie estimat corect. Intervale similare de încredere pot fi utilizate pentru a estima proporția unei caracteristici Rși principala masă distribuită a populației.

Descărcați nota în sau format, exemple în format

Construirea unui interval de încredere pentru așteptarea matematică a populației cu o abatere standard cunoscută

Construirea unui interval de încredere pentru ponderea unei caracteristici în populație

Această secțiune extinde conceptul de interval de încredere la date categorice. Acest lucru ne permite să estimăm ponderea caracteristicii în populație R folosind partajarea eșantionului RS= X/n. După cum este indicat, dacă cantitățile nRȘi n(1 – p) depășește numărul 5, distribuția binomială poate fi aproximată ca normal. Prin urmare, pentru a estima ponderea unei caracteristici în populație R se poate construi un interval al cărui nivel de încredere este egal cu (1 – α)х100%.


Unde pS- proporția de eșantion a caracteristicii egală cu X/n, adică numărul de succese împărțit la dimensiunea eșantionului, R- ponderea caracteristicii în populația generală, Z- valoarea critică a distribuției normale standardizate, n- marime de mostra.

Exemplul 3. Sa presupunem ca din sistemul informatic este extras un esantion format din 100 de facturi completate in ultima luna. Să presupunem că 10 dintre aceste facturi au fost întocmite cu erori. Prin urmare, R= 10/100 = 0,1. Nivelul de încredere de 95% corespunde valorii critice Z = 1,96.

Astfel, probabilitatea ca între 4,12% și 15,88% din facturi să conțină erori este de 95%.

Pentru o anumită dimensiune a eșantionului, intervalul de încredere care conține proporția caracteristicii în populație pare mai larg decât pentru o variabilă aleatoare continuă. Acest lucru se datorează faptului că măsurătorile unei variabile aleatoare continue conțin mai multe informații decât măsurătorile datelor categorice. Cu alte cuvinte, datele categorice care iau doar două valori conțin informații insuficiente pentru a estima parametrii distribuției lor.

ÎNcalcularea estimărilor extrase dintr-o populație finită

Estimarea așteptărilor matematice. Factorul de corecție pentru populația finală ( fpc) a fost folosit pentru a reduce eroarea standard cu un factor. La calcularea intervalelor de încredere pentru estimările parametrilor populației, se aplică un factor de corecție în situațiile în care probele sunt extrase fără a fi returnate. Astfel, un interval de încredere pentru așteptarea matematică având un nivel de încredere egal cu (1 – α)х100%, se calculează prin formula:

Exemplul 4. Pentru a ilustra utilizarea factorului de corecție pentru o populație finită, să revenim la problema calculării intervalului de încredere pentru suma medie a facturilor, discutată mai sus în Exemplul 3. Să presupunem că o companie emite 5.000 de facturi pe lună și X= 110,27 dolari, S= 28,95 USD, N = 5000, n = 100, α = 0,05, t 99 = 1,9842. Folosind formula (6) obtinem:

Estimarea cotei unei caracteristici. Atunci când alegeți fără returnare, intervalul de încredere pentru proporția atributului având un nivel de încredere egal cu (1 – α)х100%, se calculează prin formula:

Intervale de încredere și probleme etice

Atunci când se eșantionează o populație și se trag concluzii statistice, apar adesea probleme etice. Principalul este modul în care intervalele de încredere și estimările punctuale ale statisticilor eșantionului sunt de acord. Publicarea estimărilor punctuale fără a specifica intervalele de încredere asociate (de obicei la nivelul de încredere de 95%) și dimensiunea eșantionului din care sunt derivate pot crea confuzie. Acest lucru poate da utilizatorului impresia că estimarea punctuală este exact ceea ce are nevoie pentru a prezice proprietățile întregii populații. Astfel, este necesar să înțelegem că în orice cercetare accentul ar trebui să nu fie pe estimările punctuale, ci pe estimările pe intervale. În plus, o atenție deosebită trebuie acordată selecției corecte a dimensiunilor eșantionului.

Cel mai adesea, obiectele manipulării statistice sunt rezultatele anchetelor sociologice ale populației pe anumite probleme politice. În același timp, rezultatele sondajului sunt publicate pe primele pagini ale ziarelor, iar eroarea de eșantionare și metodologia de analiză statistică sunt publicate undeva la mijloc. Pentru a demonstra validitatea estimărilor punctuale obţinute este necesar să se indice mărimea eşantionului pe baza căruia au fost obţinute, limitele intervalului de încredere şi nivelul său de semnificaţie.

Următoarea notă

Sunt folosite materiale din cartea Levin et al. Statistics for Managers. – M.: Williams, 2004. – p. 448–462

Teorema limitei centrale afirmă că, cu o dimensiune a eșantionului suficient de mare, distribuția eșantionului de medii poate fi aproximată printr-o distribuție normală. Această proprietate nu depinde de tipul de distribuție a populației.

Și altele, toate sunt estimări ale analogilor lor teoretici, care ar putea fi obținute dacă nu ar fi disponibil un eșantion, ci o populație generală. Dar, din păcate, populația generală este foarte scumpă și adesea inaccesibilă.

Conceptul de estimare a intervalului

Orice estimare a eșantionului are o oarecare răspândire, pentru că este o variabilă aleatorie în funcție de valorile dintr-un anumit eșantion. Prin urmare, pentru concluzii statistice mai fiabile, ar trebui să se cunoască nu numai estimarea punctuală, ci și intervalul, care cu o probabilitate mare γ (gama) acoperă indicatorul evaluat θ (theta).

Formal, acestea sunt două astfel de valori (statistici) T 1 (X)Și T 2 (X), Ce T 1< T 2 , pentru care la un nivel de probabilitate dat γ conditia este indeplinita:

Pe scurt, este probabil γ sau mai mult indicatorul adevărat este între puncte T 1 (X)Și T 2 (X), care sunt numite limite inferioare și superioare interval de încredere.

Una dintre condițiile pentru construirea intervalelor de încredere este îngustimea maximă a acestuia, adică. ar trebui să fie cât mai scurt posibil. Dorința este destul de firească, pentru că... cercetătorul încearcă să localizeze mai precis locația parametrului dorit.

Rezultă că intervalul de încredere trebuie să acopere probabilitățile maxime ale distribuției. iar evaluarea în sine ar trebui să fie în centru.

Adică, probabilitatea de abatere (a indicatorului adevărat de la estimare) în sus este egală cu probabilitatea de abatere în jos. De asemenea, trebuie remarcat faptul că pentru distribuțiile asimetrice, intervalul din dreapta nu este egal cu intervalul din stânga.

Figura de mai sus arată clar că, cu cât probabilitatea de încredere este mai mare, cu atât intervalul este mai larg - o relație directă.

Aceasta a fost o scurtă introducere în teoria estimării pe intervale a parametrilor necunoscuți. Să trecem la găsirea limitelor de încredere pentru așteptarea matematică.

Interval de încredere pentru așteptările matematice

Dacă datele originale sunt distribuite peste , atunci media va fi o valoare normală. Aceasta rezultă din regula că o combinație liniară de valori normale are și o distribuție normală. Prin urmare, pentru a calcula probabilitățile am putea folosi aparatul matematic al legii distribuției normale.

Cu toate acestea, acest lucru va necesita cunoașterea a doi parametri - așteptarea și variația, care sunt de obicei necunoscute. Puteți folosi, desigur, estimări în loc de parametri (media aritmetică și ), dar atunci distribuția mediei nu va fi complet normală, va fi ușor aplatizată în jos. Acest fapt a fost remarcat inteligent de cetățeanul irlandez William Gosset, publicându-și descoperirea în numărul din martie 1908 al revistei Biometrica. Din motive de secret, Gosset s-a semnat Student. Așa a apărut distribuția t Student.

Cu toate acestea, distribuția normală a datelor, folosită de K. Gauss în analiza erorilor în observațiile astronomice, este extrem de rară în viața pământească și este destul de greu de stabilit (pentru o precizie ridicată sunt necesare aproximativ 2 mii de observații). Prin urmare, cel mai bine este să renunțați la ipoteza de normalitate și să utilizați metode care nu depind de distribuția datelor originale.

Se pune întrebarea: care este distribuția mediei aritmetice dacă este calculată din datele unei distribuții necunoscute? Răspunsul este dat de binecunoscuta teoria probabilității Teorema limitei centrale(CPT). În matematică, există mai multe variante ale acesteia (formulările s-au rafinat de-a lungul anilor), dar toate, în linii mari, se rezumă la afirmația că suma unui număr mare de variabile aleatoare independente se supune legii distribuției normale.

La calcularea mediei aritmetice se folosește suma variabilelor aleatoare. De aici rezultă că media aritmetică are o distribuție normală, în care așteptarea este așteptarea datelor originale, iar varianța este .

Oamenii inteligenți știu să demonstreze CLT, dar vom verifica acest lucru cu ajutorul unui experiment realizat în Excel. Să simulăm un eșantion de 50 de variabile aleatoare distribuite uniform (folosind funcția Excel RANDBETWEEN). Apoi vom face 1000 de astfel de mostre și vom calcula media aritmetică pentru fiecare. Să ne uităm la distribuția lor.

Se poate observa că distribuția mediei este apropiată de legea normală. Dacă dimensiunea și numărul eșantionului sunt și mai mari, asemănarea va fi și mai bună.

Acum că am văzut cu ochii noștri validitatea CLT, putem, folosind , calcula intervale de încredere pentru media aritmetică, care acoperă media adevărată sau așteptarea matematică cu o probabilitate dată.

Pentru a stabili limitele superioare și inferioare, trebuie să cunoașteți parametrii distribuției normale. De regulă, nu există, așa că sunt utilizate estimări: medie aritmeticăȘi varianța eșantionului. Repet, această metodă oferă o aproximare bună doar cu mostre mari. Când mostrele sunt mici, se recomandă adesea să folosiți distribuția Student. Nu crede! Distribuția Student pentru medie apare numai atunci când datele originale sunt distribuite în mod normal, adică aproape niciodată. Prin urmare, este mai bine să setați imediat o bară minimă pentru cantitatea de date necesare și să utilizați metode corecte asimptotic. Se spune că 30 de observații sunt suficiente. Luați 50 - nu veți greși.

T 1.2– limitele inferioare și superioare ale intervalului de încredere

– medie aritmetică eșantionului

s 0– abaterea standard a eșantionului (nepărtinitoare)

n - marime de mostra

γ – probabilitatea de încredere (de obicei egală cu 0,9, 0,95 sau 0,99)

c γ =Φ -1 ((1+γ)/2)– valoarea inversă a funcției de distribuție normală standard. Mai simplu spus, acesta este numărul de erori standard de la media aritmetică la limita inferioară sau superioară (aceste trei probabilități corespund valorilor de 1,64, 1,96 și 2,58).

Esența formulei este că se ia media aritmetică și apoi se pune deoparte o anumită sumă ( cu γ) erori standard ( s 0 /√n). Totul este cunoscut, luați-l și luați în considerare.

Înainte de utilizarea pe scară largă a computerelor personale, acestea obțineau valorile funcției de distribuție normală și inversul acesteia. Ele sunt încă folosite astăzi, dar este mai eficient să folosiți formule Excel gata făcute. Toate elementele din formula de mai sus ( , și ) pot fi calculate cu ușurință în Excel. Dar există o formulă gata făcută pentru calcularea intervalului de încredere - ÎNCREDERE.NORMĂ. Sintaxa sa este următoarea.

CONFIDENCE.NORM(alpha;standard_off;size)

alfa– nivelul de semnificație sau nivelul de încredere, care în notația adoptată mai sus este egal cu 1- γ, i.e. probabilitatea ca matematicaașteptarea va fi în afara intervalului de încredere. Cu un nivel de încredere de 0,95, alfa este 0,05 etc.

standard_off– abaterea standard a datelor eșantionului. Nu este nevoie să calculați eroarea standard; Excel însuși va împărți la rădăcina lui n.

mărimea– dimensiunea eșantionului (n).

Rezultatul functiei NORMA DE INCREDERE este al doilea termen din formula de calcul a intervalului de incredere, i.e. jumătate de interval În consecință, punctele inferior și superior sunt media ± valoarea obținută.

Astfel, este posibil să se construiască un algoritm universal pentru calcularea intervalelor de încredere pentru media aritmetică, care nu depinde de distribuția datelor originale. Prețul pentru universalitate este natura sa asimptotică, adică. necesitatea de a folosi mostre relativ mari. Cu toate acestea, în era tehnologiei moderne, colectarea cantității necesare de date nu este de obicei dificilă.

Testarea ipotezelor statistice folosind intervale de încredere

(modulul 111)

Una dintre principalele probleme rezolvate în statistică este. Esența sa este pe scurt după cum urmează. Se presupune, de exemplu, că așteptările populației generale sunt egale cu o anumită valoare. Apoi se construiește distribuția mijloacelor eșantionului care pot fi observate pentru o așteptare dată. Apoi, ei analizează unde în această distribuție condiționată se află media reală. Dacă depășește limitele acceptabile, atunci apariția unei astfel de medii este foarte puțin probabilă, iar dacă experimentul se repetă o dată, este aproape imposibil, ceea ce contrazice ipoteza propusă, care este respinsă cu succes. Dacă media nu depășește nivelul critic, atunci ipoteza nu este respinsă (dar nici dovedită!).

Deci, cu ajutorul intervalelor de încredere, în cazul nostru pentru așteptare, puteți testa și unele ipoteze. Este foarte ușor de făcut. Să presupunem că media aritmetică pentru un anumit eșantion este egală cu 100. Se testează ipoteza că valoarea așteptată este, să zicem, 90. Adică, dacă punem întrebarea în mod primitiv, sună așa: poate fi oare asta cu adevăratul valoarea mediei egală cu 90, media observată sa dovedit a fi 100?

Pentru a răspunde la această întrebare, veți avea nevoie în plus de informații despre abaterea standard și dimensiunea eșantionului. Să presupunem că abaterea standard este 30 și numărul de observații este 64 (pentru a extrage cu ușurință rădăcina). Atunci eroarea standard a mediei este 30/8 sau 3,75. Pentru a calcula un interval de încredere de 95%, va trebui să adăugați două erori standard de fiecare parte a mediei (mai precis, 1,96). Intervalul de încredere va fi de aproximativ 100±7,5 sau de la 92,5 la 107,5.

Raționamentul suplimentar este următorul. Dacă valoarea testată se încadrează în intervalul de încredere, atunci nu contrazice ipoteza, deoarece se încadrează în limitele fluctuaţiilor aleatorii (cu o probabilitate de 95%). Dacă punctul verificat se încadrează în afara intervalului de încredere, atunci probabilitatea unui astfel de eveniment este foarte mică, în orice caz sub nivelul acceptabil. Aceasta înseamnă că ipoteza este respinsă ca fiind în contradicție cu datele observate. În cazul nostru, ipoteza despre valoarea așteptată este în afara intervalului de încredere (valoarea testată de 90 nu este inclusă în intervalul 100±7,5), deci ar trebui respinsă. Răspunzând la întrebarea primitivă de mai sus, ar trebui spus: nu, nu se poate, în niciun caz, acest lucru se întâmplă extrem de rar. Adesea, ele indică probabilitatea specifică de a respinge eronat ipoteza (nivelul p), și nu nivelul specificat pe care a fost construit intervalul de încredere, ci mai mult de altă dată.

După cum puteți vedea, construirea unui interval de încredere pentru medie (sau așteptarea matematică) nu este dificilă. Principalul lucru este să înțelegeți esența, iar apoi lucrurile vor merge mai departe. În practică, cele mai multe cazuri folosesc un interval de încredere de 95%, care este de aproximativ două erori standard de fiecare parte a mediei.

Asta este tot pentru acum. Toate cele bune!

Intervalul de încredere ne vine din domeniul statisticii. Acesta este un anumit interval care servește la estimarea unui parametru necunoscut cu un grad ridicat de fiabilitate. Cel mai simplu mod de a explica acest lucru este cu un exemplu.

Să presupunem că trebuie să studiați o variabilă aleatoare, de exemplu, viteza de răspuns a serverului la o solicitare a clientului. De fiecare dată când un utilizator introduce adresa unui anumit site, serverul răspunde cu viteze diferite. Astfel, timpul de răspuns studiat este aleatoriu. Deci, intervalul de încredere ne permite să determinăm limitele acestui parametru și apoi putem spune că cu o probabilitate de 95% serverul va fi în intervalul pe care l-am calculat.

Sau trebuie să aflați câți oameni știu despre marca comercială a companiei. Când se calculează intervalul de încredere, se va putea spune, de exemplu, că, cu o probabilitate de 95%, ponderea consumatorilor conștienți de acest lucru este în intervalul de la 27% la 34%.

Strâns legată de acest termen este valoarea probabilității de încredere. Reprezintă probabilitatea ca parametrul dorit să fie inclus în intervalul de încredere. Cât de mare va fi intervalul nostru dorit depinde de această valoare. Cu cât este mai mare valoarea pe care o ia, cu atât intervalul de încredere devine mai îngust și invers. De obicei, este setat la 90%, 95% sau 99%. Valoarea 95% este cea mai populară.

Acest indicator este influențat și de dispersia observațiilor și definirea lui se bazează pe presupunerea că caracteristica studiată se supune.Această afirmație este cunoscută și sub numele de Legea lui Gauss. Potrivit lui, normala este o distribuție a tuturor probabilităților unei variabile aleatoare continue care poate fi descrisă printr-o densitate de probabilitate. Dacă ipoteza unei distribuții normale este incorectă, atunci estimarea poate fi incorectă.

Mai întâi, să ne dăm seama cum să calculăm intervalul de încredere pentru Există două cazuri posibile aici. Dispersia (gradul de răspândire a unei variabile aleatoare) poate fi cunoscută sau nu. Dacă este cunoscut, atunci intervalul nostru de încredere este calculat folosind următoarea formulă:

xsr - t*σ / (sqrt(n))<= α <= хср + t*σ / (sqrt(n)), где

α - semn,

t - parametru din tabelul de distribuție Laplace,

σ este rădăcina pătrată a varianței.

Dacă varianța este necunoscută, atunci poate fi calculată dacă cunoaștem toate valorile caracteristicii dorite. Pentru aceasta se folosește următoarea formulă:

σ2 = х2ср - (хср)2, unde

х2ср - valoarea medie a pătratelor caracteristicii studiate,

(хср)2 este pătratul acestei caracteristici.

Formula prin care se calculează intervalul de încredere în acest caz se modifică ușor:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n)), где

xsr - medie eșantion,

α - semn,

t este un parametru care se găsește folosind tabelul de distribuție Student t = t(ɣ;n-1),

sqrt(n) - rădăcina pătrată a dimensiunii totale a eșantionului,

s este rădăcina pătrată a varianței.

Luați în considerare acest exemplu. Să presupunem că pe baza rezultatelor a 7 măsurători, caracteristica studiată a fost determinată a fi egală cu 30, iar varianța eșantionului să fie egală cu 36. Este necesar să se găsească, cu o probabilitate de 99%, un interval de încredere care să conțină adevăratul valoarea parametrului măsurat.

Mai întâi, să determinăm cu ce t este egal: t = t (0,99; 7-1) = 3,71. Folosind formula de mai sus, obținem:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n))

30 - 3,71*36 / (sqrt(7))<= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

Intervalul de încredere pentru varianță se calculează atât în ​​cazul unei medii cunoscute, cât și atunci când nu există date despre așteptarea matematică și se cunoaște doar valoarea estimării punctuale a varianței. Nu vom da aici formule de calcul, deoarece acestea sunt destul de complexe și, dacă se dorește, pot fi întotdeauna găsite pe Internet.

Să remarcăm doar că este convenabil să determinați intervalul de încredere folosind Excel sau un serviciu de rețea, care se numește astfel.