Există două tipuri de estimări în statistică: punct și interval. Estimare punctuală este un singur eșantion statistic care este utilizat pentru a estima un parametru de populație. De exemplu, media eșantionului este o estimare punctuala așteptări matematice populația și varianța eșantionului S 2- estimarea punctuală a varianței populației σ 2. s-a demonstrat că media eșantionului este o estimare imparțială a așteptărilor matematice a populației. O medie a eșantionului se numește imparțial deoarece media tuturor mediilor eșantionului (cu aceeași dimensiune a eșantionului) n) este egală cu așteptarea matematică a populației generale.

Pentru variația eșantionului S 2 a devenit o estimare imparțială a varianței populației σ 2, numitorul varianței eșantionului trebuie setat egal cu n – 1 , dar nu n. Cu alte cuvinte, varianța populației este media tuturor variațiilor posibile ale eșantionului.

La estimarea parametrilor populației, ar trebui să se țină cont de faptul că statisticile eșantionului precum , depind de mostre specifice. A ține cont de acest fapt, a obține estimarea intervalului așteptarea matematică a populației generale, analizați distribuția mediilor eșantionului (pentru mai multe detalii, vezi). Intervalul construit este caracterizat de un anumit nivel de încredere, care reprezintă probabilitatea ca parametrul adevărat al populației să fie estimat corect. Intervale similare de încredere pot fi utilizate pentru a estima proporția unei caracteristici Rși principala masă distribuită a populației.

Descărcați nota în sau format, exemple în format

Construirea unui interval de încredere pentru așteptarea matematică a populației cu o abatere standard cunoscută

Construirea unui interval de încredere pentru ponderea unei caracteristici în populație

Această secțiune extinde conceptul de interval de încredere la date categorice. Acest lucru ne permite să estimăm ponderea caracteristicii în populație R folosind partajarea eșantionului RS= X/n. După cum este indicat, dacă cantitățile nRȘi n(1 – p) depășește numărul 5, distribuția binomială poate fi aproximată ca normal. Prin urmare, pentru a estima ponderea unei caracteristici în populație R se poate construi un interval al cărui nivel de încredere este egal cu (1 – α)х100%.


Unde pS- proporția de eșantion a caracteristicii egală cu X/n, adică numărul de succese împărțit la dimensiunea eșantionului, R- ponderea caracteristicii în populația generală, Z- valoarea critică a distribuției normale standardizate, n- marime de mostra.

Exemplul 3. Sa presupunem ca din sistemul informatic este extras un esantion format din 100 de facturi completate in ultima luna. Să presupunem că 10 dintre aceste facturi au fost întocmite cu erori. Prin urmare, R= 10/100 = 0,1. Nivelul de încredere de 95% corespunde valorii critice Z = 1,96.

Astfel, probabilitatea ca între 4,12% și 15,88% din facturi să conțină erori este de 95%.

Pentru o anumită mărime a eșantionului, intervalul de încredere care conține proporția caracteristicii în populație pare mai larg decât pentru un continuu. variabilă aleatorie. Acest lucru se datorează faptului că măsurătorile unei variabile aleatoare continue conțin mai multe informații decât măsurătorile datelor categorice. Cu alte cuvinte, datele categorice care iau doar două valori conțin informații insuficiente pentru a estima parametrii distribuției lor.

ÎNcalcularea estimărilor extrase dintr-o populație finită

Estimarea așteptărilor matematice. Factorul de corecție pentru populația finală ( fpc) a fost folosit pentru a reduce eroarea standard cu un factor. La calcularea intervalelor de încredere pentru estimările parametrilor populației, se aplică un factor de corecție în situațiile în care probele sunt extrase fără a fi returnate. Astfel, un interval de încredere pentru așteptarea matematică având un nivel de încredere egal cu (1 – α)х100%, se calculează prin formula:

Exemplul 4. Pentru a ilustra utilizarea factorului de corecție pentru o populație finită, să revenim la problema calculării intervalului de încredere pentru suma medie a facturilor, discutată mai sus în Exemplul 3. Să presupunem că o companie emite 5.000 de facturi pe lună și X= 110,27 dolari, S= 28,95 USD, N = 5000, n = 100, α = 0,05, t 99 = 1,9842. Folosind formula (6) obtinem:

Estimarea cotei unei caracteristici. Atunci când alegeți fără returnare, intervalul de încredere pentru proporția atributului având un nivel de încredere egal cu (1 – α)х100%, se calculează prin formula:

Intervalele de încredere și probleme etice

Atunci când se eșantionează o populație și se trag concluzii statistice, apar adesea probleme etice. Principalul este modul în care intervalele de încredere și estimările punctuale ale statisticilor eșantionului sunt de acord. Publicarea estimărilor punctuale fără a specifica intervalele de încredere asociate (de obicei la nivelul de încredere de 95%) și dimensiunea eșantionului din care sunt derivate pot crea confuzie. Acest lucru poate da utilizatorului impresia că estimarea punctuală este exact ceea ce are nevoie pentru a prezice proprietățile întregii populații. Astfel, este necesar să înțelegem că în orice cercetare accentul ar trebui să nu fie pe estimările punctuale, ci pe estimările pe intervale. In afara de asta, Atentie speciala ar trebui dat alegerea corecta dimensiunile probei.

Cel mai adesea, obiectele manipulării statistice sunt rezultatele anchetelor sociologice ale populației pe anumite probleme politice. În acest caz, rezultatele sondajului sunt publicate pe primele pagini ale ziarelor, iar eroarea sondaj prin sondajși metodologie analize statistice tipărit undeva la mijloc. Pentru a demonstra validitatea estimărilor punctuale obţinute este necesar să se indice mărimea eşantionului pe baza căruia au fost obţinute, limitele intervalului de încredere şi nivelul său de semnificaţie.

Următoarea notă

Sunt folosite materiale din cartea Levin et al. Statistics for Managers. – M.: Williams, 2004. – p. 448–462

Teorema limitei centrale afirmă că, cu o dimensiune a eșantionului suficient de mare, distribuția eșantionului de medii poate fi aproximată printr-o distribuție normală. Această proprietate nu depinde de tipul de distribuție a populației.

Inteligența constă nu numai în cunoaștere, ci și în capacitatea de a aplica cunoștințele în practică. (Aristotel)

Intervale de încredere

revizuire generală

Luând un eșantion din populație, obținem o estimare punctuală a parametrului de interes și calculăm eroarea standard pentru a indica precizia estimării.

Cu toate acestea, pentru majoritatea cazurilor, eroarea standard ca atare nu este acceptabilă. Este mult mai util să combinați această măsură de precizie cu o estimare de interval pentru parametrul populației.

Acest lucru se poate realiza prin utilizarea cunoștințelor distribuției teoretice de probabilitate a statisticii (parametrului) eșantionului pentru a calcula intervalul de încredere (CI - Confidence Interval, DI - Interval de încredere) pentru parametru.

În general, un interval de încredere extinde estimările în ambele direcții cu un anumit multiplu al erorii standard (a unui parametru dat); cele două valori (limitele de încredere) care definesc intervalul sunt de obicei separate prin virgulă și cuprinse între paranteze.

Interval de încredere pentru medie

Folosind distribuția normală

Media eșantionului este distribuită în mod normal dacă dimensiunea eșantionului este mare, astfel încât să puteți aplica cunoștințele despre distribuția normală atunci când luați în considerare media eșantionului.

Mai exact, 95% din distribuția mediilor eșantionului se află în 1,96 deviații standard (SD) față de media populației.

Când avem doar un eșantion, îl numim eroarea standard a mediei (SEM) și calculăm intervalul de încredere de 95% pentru medie după cum urmează:

Dacă repetăm ​​acest experiment de mai multe ori, intervalul va conține media reală a populației în 95% din timp.

De obicei, acesta este un interval de încredere, cum ar fi intervalul de valori în care se află media reală a populației (media generală) cu o probabilitate de încredere de 95%.

Deși nu este în întregime riguros (media populației este o valoare fixă ​​și, prin urmare, nu poate avea o probabilitate atașată) să interpretăm un interval de încredere în acest fel, este conceptual mai ușor de înțeles.

Utilizare t- distributie

Puteți folosi distribuția normală dacă cunoașteți valoarea varianței în populație. De asemenea, atunci când dimensiunea eșantionului este mică, media eșantionului urmează o distribuție normală dacă datele populației subiacente sunt distribuite normal.

Dacă datele care stau la baza populației nu sunt distribuite în mod normal și/sau varianța populației este necunoscută, media eșantionului se supune Distribuția t a studentului.

Calculăm intervalul de încredere de 95% pentru media populației generale după cum urmează:

Unde este punctul procentual (percentila) t- Distribuția t a lui Student cu (n-1) grade de libertate, care dă o probabilitate cu două fețe de 0,05.

În general, oferă o gamă mai largă decât utilizarea distribuției normale deoarece ia în considerare incertitudinea suplimentară introdusă prin estimarea abaterii standard a populației și/sau datorită dimensiunii reduse a eșantionului.

Când dimensiunea eșantionului este mare (de ordinul a 100 sau mai mult), diferența dintre cele două distribuții ( t-Studentși normal) este nesemnificativă. Cu toate acestea, ele folosesc întotdeauna t- distribuția la calcularea intervalelor de încredere, chiar dacă dimensiunea eșantionului este mare.

De obicei este raportat IC de 95%. Alte intervale de încredere pot fi calculate, cum ar fi IC 99% pentru medie.

În loc de produsul erorii standard și valoarea tabelului t- distribuția, care corespunde unei probabilități cu două fețe de 0,05, înmulțiți-o (eroarea standard) cu valoarea care corespunde unei probabilități cu două fețe de 0,01. Acesta este un interval de încredere mai larg decât intervalul de încredere de 95%, deoarece reflectă o încredere crescută că intervalul include de fapt media populației.

Interval de încredere pentru proporție

Distribuția de eșantionare a proporțiilor are o distribuție binomială. Cu toate acestea, dacă dimensiunea eșantionului n este rezonabil de mare, atunci distribuția de eșantionare a proporției este aproximativ normală cu media .

Evaluăm prin raport selectiv p=r/n(Unde r- numărul de indivizi din eșantion cu cei care ne interesează trasaturi caracteristice), iar eroarea standard este estimată:

Intervalul de încredere de 95% pentru proporție este estimat:

Dacă dimensiunea eșantionului este mică (de obicei când n.p. sau n(1-p) Mai puțin 5 ), atunci este necesar să se utilizeze distribuția binomială pentru a calcula intervalele de încredere precise.

Rețineți că dacă p exprimat ca procent, atunci (1-p) inlocuit de (100-p).

Interpretarea intervalelor de încredere

Când interpretăm un interval de încredere, ne interesează următoarele întrebări:

Cât de larg este intervalul de încredere?

Un interval larg de încredere indică faptul că estimarea este imprecisă; îngust indică o estimare precisă.

Lățimea intervalului de încredere depinde de mărimea erorii standard, care, la rândul său, depinde de dimensiunea eșantionului și, atunci când se ia în considerare o variabilă numerică, variabilitatea datelor produce intervale de încredere mai largi decât studiile unui set mare de date cu puține variabile. .

CI include valori de interes deosebit?

Puteți verifica dacă valoarea probabilă pentru un parametru de populație se încadrează în intervalul de încredere. Dacă da, rezultatele sunt în concordanță cu această valoare probabilă. Dacă nu, atunci este puțin probabil (pentru un interval de încredere de 95% șansa este de aproape 5%) ca parametrul să aibă acea valoare.

Să avem un numar mare de obiecte cu o distribuție normală a anumitor caracteristici (de exemplu, un depozit complet de legume de același tip, a căror dimensiune și greutate variază). Vrei să știi caracteristicile medii ale întregului lot de mărfuri, dar nu ai nici timp, nici dorința de a măsura și cântări fiecare legumă. Înțelegi că acest lucru nu este necesar. Dar câte piese ar trebui luate pentru o verificare la fața locului?

Înainte de a oferi mai multe formule utile pentru această situație, să ne amintim câteva notații.

În primul rând, dacă am măsura întregul depozit de legume (acest set de elemente se numește populația generală), atunci am ști cu toată exactitatea disponibilă greutatea medie a întregului lot. Să numim această medie medie X .g en . - media generală. Știm deja ce este complet determinat dacă valoarea medie și abaterea s sunt cunoscute . Adevărat, deși nu suntem nici genul mediu X, nici s Nu cunoaștem populația generală. Putem lua doar o anumită probă, să măsurăm valorile de care avem nevoie și să calculăm pentru această probă atât valoarea medie X, cât și abaterea standard S selectată.

Se știe că dacă verificarea noastră eșantion conține un număr mare de elemente (de obicei n este mai mare de 30), și acestea sunt luate într-adevăr aleatoriu, apoi s populația generală nu va diferi cu greu de selecția S ..

În plus, pentru cazul distribuției normale putem folosi următoarele formule:

Cu o probabilitate de 95%


Cu o probabilitate de 99%



ÎN vedere generala cu probabilitatea P (t)


Relația dintre valoarea t și valoarea probabilității P (t), cu care dorim să cunoaștem intervalul de încredere, poate fi luată din următorul tabel:


Astfel, am determinat în ce interval se află valoarea medie a populației (cu o probabilitate dată).

Dacă nu avem un eșantion suficient de mare, nu putem spune că populația are s = S selectează În plus, în acest caz, apropierea eșantionului de distribuția normală este problematică. În acest caz, folosim și S select în schimb s în formula:




dar valoarea lui t pentru o probabilitate fixă ​​P(t) va depinde de numărul de elemente din eșantionul n. Cu cât n este mai mare, cu atât intervalul de încredere rezultat va fi mai apropiat de valoarea dată de formula (1). Valorile t în acest caz sunt luate dintr-un alt tabel ( Testul t al elevului), pe care le prezentăm mai jos:

Valorile testului t al lui Student pentru probabilitatea 0,95 și 0,99


Exemplul 3. 30 de persoane au fost alese aleatoriu dintre angajații companiei. Potrivit eșantionului, s-a dovedit că salariul mediu (pe lună) este de 30 de mii de ruble, cu o abatere standard de 5 mii de ruble. Determinați salariul mediu în companie cu o probabilitate de 0,99.

Soluţie: Prin condiție avem n = 30, X avg. =30000, S=5000, P = 0,99. Pentru a găsi intervalul de încredere, vom folosi formula corespunzătoare testului t Student. Din tabelul pentru n = 30 și P = 0,99 găsim t = 2,756, prin urmare,


acestea. mandatar căutat interval 27484< Х ср.ген < 32516.

Deci, cu o probabilitate de 0,99 putem spune că intervalul (27484; 32516) conține în sine salariul mediu în firmă.

Sperăm că veți folosi această metodă și nu este necesar să aveți o masă cu dvs. de fiecare dată. Calculele pot fi efectuate automat în Excel. În timp ce vă aflați în fișierul Excel, faceți clic pe butonul fx din meniul de sus. Apoi, selectați tipul „statistic” dintre funcții, iar din lista propusă în fereastra - STUDAR DISCOVER. Apoi, la prompt, plasând cursorul în câmpul „probabilitate”, introduceți valoarea probabilității inverse (adică, în cazul nostru, în loc de probabilitatea de 0,95, trebuie să introduceți probabilitatea de 0,05). Aparent, foaia de calcul este concepută în așa fel încât rezultatul să răspundă la întrebarea cât de probabil avem să greșim. În mod similar, în câmpul Grad de libertate, introduceți o valoare (n-1) pentru eșantionul dvs.

Ţintă– predarea elevilor algoritmi pentru calcularea intervalelor de încredere ale parametrilor statistici.

La prelucrarea statistică a datelor, media aritmetică calculată, coeficientul de variație, coeficientul de corelație, criteriile de diferență și alte statistici punctuale ar trebui să primească limite cantitative de încredere, care indică posibile fluctuații ale indicatorului în direcții din ce în ce mai mari în intervalul de încredere.

Exemplul 3.1 . Distribuția calciului în serul sanguin al maimuțelor, așa cum a fost stabilită anterior, se caracterizează prin următorii indicatori de probă: = 11,94 mg%; = 0,127 mg%; n= 100. Este necesar să se determine intervalul de încredere pentru media generală ( ) cu probabilitate de încredere P = 0,95.

Media generală este situată cu o anumită probabilitate în intervalul:

, Unde – medie aritmetică eșantionului; t– testul elevului; – eroarea mediei aritmetice.

Folosind tabelul „Valorile testului t ale elevului” găsim valoarea cu o probabilitate de încredere de 0,95 și numărul de grade de libertate k= 100-1 = 99. Este egal cu 1,982. Împreună cu valorile mediei aritmetice și ale erorii statistice, o înlocuim în formula:

sau 11,69
12,19

Astfel, cu o probabilitate de 95%, se poate afirma că media generală a acestei distribuții normale este cuprinsă între 11,69 și 12,19 mg%.

Exemplul 3.2 . Determinați limitele intervalului de încredere de 95% pentru varianța generală ( ) distribuția calciului în sângele maimuțelor, dacă se știe că
= 1,60, at n = 100.

Pentru a rezolva problema puteți folosi următoarea formulă:

Unde – eroarea statistică de dispersie.

Găsim eroarea varianței de eșantionare folosind formula:
. Este egal cu 0,11. Sens t- criteriu cu o probabilitate de încredere de 0,95 și numărul de grade de libertate k= 100–1 = 99 este cunoscut din exemplul anterior.

Să folosim formula și să obținem:

sau 1,38
1,82

Mai precis, intervalul de încredere al varianței generale poate fi construit folosind (chi-pătrat) - testul Pearson. Punctele critice pentru acest criteriu sunt date într-un tabel special. La folosirea criteriului Pentru a construi un interval de încredere, se utilizează un nivel de semnificație cu două fețe. Pentru limita inferioară, nivelul de semnificație este calculat folosind formula
, pentru partea de sus -
. De exemplu, pentru nivelul de încredere = 0,99= 0,010,= 0,990. În consecință, conform tabelului de distribuție a valorilor critice , cu niveluri de încredere calculate și numărul de grade de libertate k= 100 – 1= 99, găsiți valorile
Și
. Primim
este egal cu 135,80 și
este egal cu 70,06.

Pentru a găsi limitele de încredere pentru varianța generală folosind Să folosim formulele: pentru limita inferioară
, pentru limita superioară
. Să înlocuim valorile găsite cu datele problemei în formule:
= 1,17;
= 2,26. Astfel, cu o probabilitate de încredere P= 0,99 sau 99% varianță generală va fi în intervalul de la 1,17 la 2,26 mg% inclusiv.

Exemplul 3.3 . Dintre 1000 de semințe de grâu din lotul primit la lift, 120 de semințe au fost găsite infectate cu ergot. Este necesar să se determine limitele probabile ale proporției generale de semințe infectate într-un anumit lot de grâu.

Este recomandabil să se determine limitele de încredere pentru cota generală pentru toate valorile sale posibile folosind formula:

,

Unde n – numărul de observații; m– dimensiunea absolută a unuia dintre grupuri; t– abatere normalizată.

Proporția eșantionului de semințe infectate este
sau 12%. Cu probabilitate de încredere R= abatere normalizată de 95% ( t-Testul elevului la k =
)t = 1,960.

Înlocuim datele disponibile în formula:

Prin urmare, limitele intervalului de încredere sunt egale cu = 0,122–0,041 = 0,081 sau 8,1%; = 0,122 + 0,041 = 0,163 sau 16,3%.

Astfel, cu o probabilitate de încredere de 95% se poate afirma că proporția generală a semințelor infectate este între 8,1 și 16,3%.

Exemplul 3.4 . Coeficientul de variație care caracterizează variația calciului (mg%) în serul sanguin al maimuțelor a fost egal cu 10,6%. Marime de mostra n= 100. Este necesar să se determine limitele intervalului de încredere de 95% pentru parametrul general CV.

Limitele intervalului de încredere pentru coeficientul general de variație CV sunt determinate de următoarele formule:

Și
, Unde K valoare intermediară calculată prin formula
.

Știind asta cu probabilitate de încredere R= 95% abatere normalizată (testul studentului la k =
)t = 1,960, să calculăm mai întâi valoarea LA:

.

sau 9,3%

sau 12,3%

Astfel, coeficientul general de variație cu un nivel de încredere de 95% se află în intervalul de la 9,3 la 12,3%. La probe repetate, coeficientul de variație nu va depăși 12,3% și nu va fi sub 9,3% în 95 de cazuri din 100.

Întrebări pentru autocontrol:

Probleme pentru rezolvare independentă.

1. Procentul mediu de grăsime din lapte în timpul lactației vacilor încrucișate Kholmogory a fost următorul: 3,4; 3,6; 3,2; 3.1; 2,9; 3,7; 3,2; 3,6; 4,0; 3,4; 4.1; 3,8; 3,4; 4,0; 3,3; 3,7; 3,5; 3,6; 3,4; 3.8. Stabiliți intervale de încredere pentru media generală la un nivel de încredere de 95% (20 de puncte).

2. La 400 de plante hibride de secară, primele flori au apărut în medie la 70,5 zile de la semănat. Abaterea standard a fost de 6,9 ​​zile. Determinați eroarea mediei și a intervalelor de încredere pentru media generală și varianța la nivelul de semnificație W= 0,05 și W= 0,01 (25 puncte).

3. La studierea lungimii frunzelor a 502 exemplare de căpșuni de grădină s-au obținut următoarele date: = 7,86 cm; σ = 1,32 cm, =± 0,06 cm.Să se determine intervalele de încredere pentru media aritmetică a populației cu niveluri de semnificație de 0,01; 0,02; 0,05. (25 de puncte).

4. Într-un studiu pe 150 de bărbați adulți, înălțimea medie a fost de 167 cm și σ = 6 cm.Care sunt limitele mediei generale și ale varianței generale cu o probabilitate de încredere de 0,99 și 0,95? (25 de puncte).

5. Distribuția calciului în serul sanguin al maimuțelor este caracterizată de următorii indicatori selectivi: = 11,94 mg%, σ = 1,27, n = 100. Construiți un interval de încredere de 95% pentru media generală a acestei distribuții. Calculați coeficientul de variație (25 de puncte).

6. A fost studiat conținutul total de azot din plasma sanguină a șobolanilor albinoși la vârsta de 37 și 180 de zile. Rezultatele sunt exprimate în grame la 100 cm3 de plasmă. La vârsta de 37 de zile, 9 șobolani aveau: 0,98; 0,83; 0,99; 0,86; 0,90; 0,81; 0,94; 0,92; 0,87. La vârsta de 180 de zile, 8 șobolani aveau: 1,20; 1,18; 1,33; 1,21; 1,20; 1,07; 1,13; 1.12. Setați intervale de încredere pentru diferență la un nivel de încredere de 0,95 (50 de puncte).

7. Determinați limitele intervalului de încredere de 95% pentru variația generală a distribuției calciului (mg%) în serul sanguin al maimuțelor, dacă pentru această distribuție dimensiunea eșantionului este n = 100, eroarea statistică a varianței eșantionului s σ 2 = 1,60 (40 de puncte).

8. Determinați limitele intervalului de încredere de 95% pentru varianța generală a distribuției a 40 de spiculeți de grâu de-a lungul lungimii (σ 2 = 40,87 mm 2). (25 de puncte).

9. Fumatul este considerat principalul factor predispozitiv la bolile pulmonare obstructive. Fumatul pasiv nu este considerat un astfel de factor. Oamenii de știință s-au îndoit de inofensivitatea fumatului pasiv și au examinat permeabilitatea căilor respiratorii a nefumătorilor, fumătorilor pasivi și activi. Pentru a caracteriza starea tractului respirator, am luat unul dintre indicatorii funcției de respirație externă - debitul volumetric maxim de la mijlocul expirării. O scădere a acestui indicator este un semn de obstrucție a căilor respiratorii. Datele sondajului sunt prezentate în tabel.

Numărul de persoane examinate

Debitul maxim mediu expirator, l/s

Deviație standard

nefumători

lucrează într-o zonă de nefumători

lucrând într-o cameră plină de fum

Fumat

fumătorii nu număr marețigări

numărul mediu de fumători de țigări

fumează un număr mare de țigări

Folosind datele din tabel, găsiți intervale de încredere de 95% pentru media generală și varianța generală pentru fiecare grup. Care sunt diferențele dintre grupuri? Prezentați rezultatele grafic (25 de puncte).

10. Determinați limitele intervalelor de încredere de 95% și 99% pentru variația generală a numărului de purcei din 64 de fătări, dacă eroarea statistică a varianței eșantionului s σ 2 = 8,25 (30 puncte).

11. Se știe că greutatea medie a iepurilor este de 2,1 kg. Determinați limitele intervalelor de încredere de 95% și 99% pentru media generală și varianța la n= 30, σ = 0,56 kg (25 puncte).

12. Conținutul de boabe al spicului a fost măsurat pentru 100 de spice ( X), lungimea urechii ( Y) și masa de cereale în spic ( Z). Găsiți intervalele de încredere pentru media generală și varianța la P 1 = 0,95, P 2 = 0,99, P 3 = 0,999 dacă = 19, = 6,766 cm, = 0,554 g; σ x 2 = 29.153, σ y 2 = 2. 111, σ z 2 = 0. 064. (25 puncte).

13. În 100 de spice alese aleatoriu de grâu de iarnă a fost numărat numărul de spiculete. Populația eșantionului a fost caracterizată de următorii indicatori: = 15 spiculete și σ = 2,28 buc. Determinați cu ce precizie a fost obținut rezultatul mediu ( ) și construiți un interval de încredere pentru media generală și varianța la niveluri de semnificație de 95% și 99% (30 de puncte).

14. Numărul de coaste pe cochilii de moluște fosile Orthambonites calligramma:

Se știe că n = 19, σ = 4,25. Determinați limitele intervalului de încredere pentru media generală și varianța generală la nivelul semnificației W = 0,01 (25 puncte).

15. Pentru determinarea randamentului de lapte într-o fermă comercială de lapte, s-a determinat zilnic productivitatea a 15 vaci. Conform datelor pe an, fiecare vacă a dat în medie următoarea cantitate de lapte pe zi (l): 22; 19; 25; 20; 27; 17; treizeci; 21; 18; 24; 26; 23; 25; 20; 24. Construiți intervale de încredere pentru varianța generală și media aritmetică. Ne putem aștepta ca producția medie anuală de lapte per vaca să fie de 10.000 de litri? (50 de puncte).

16. Pentru determinarea randamentului mediu de grâu pentru întreprinderea agricolă s-a efectuat cosit pe loturi de probă de 1, 3, 2, 5, 2, 6, 1, 3, 2, 11 și 2 hectare. Productivitatea (c/ha) de pe parcele a fost de 39,4; 38; 35,8; 40; 35; 42,7; 39,3; 41,6; 33; 42; 29 respectiv. Construiți intervale de încredere pentru varianța generală și media aritmetică. Ne putem aștepta ca randamentul mediu agricol să fie de 42 c/ha? (50 de puncte).

Una dintre metodele de rezolvare a problemelor statistice este calcularea intervalului de încredere. Este utilizat ca alternativă preferabilă la estimarea punctuală atunci când dimensiunea eșantionului este mică. Trebuie remarcat faptul că procesul de calcul al intervalului de încredere în sine este destul de complex. Dar instrumentele Excel fac oarecum mai ușor. Să aflăm cum se face acest lucru în practică.

Această metodă este utilizată pentru estimarea pe intervale a diferitelor mărimi statistice. Sarcina principală a acestui calcul este de a scăpa de incertitudinile estimării punctuale.

În Excel, există două opțiuni principale pentru efectuarea calculelor folosind aceasta metoda: când varianța este cunoscută și când este necunoscută. În primul caz, funcția este utilizată pentru calcule ÎNCREDERE.NORMĂ, iar în al doilea - ADMINISTRATOR.STUDENT.

Metoda 1: Funcția NORM DE ÎNCREDERE

Operator ÎNCREDERE.NORMĂ, care aparține grupului statistic de funcții, a apărut pentru prima dată în Excel 2010. Versiunile anterioare ale acestui program folosesc analogul său ÎNCREDERE. Scopul acestui operator este de a calcula un interval de încredere distribuit normal pentru media populației.

Sintaxa sa este următoarea:

CONFIDENCE.NORM(alpha;standard_off;size)

"Alfa"— un argument care indică nivelul de semnificație care este utilizat pentru a calcula nivelul de încredere. Nivelul de încredere este egal cu următoarea expresie:

(1-"Alfa")*100

"Deviație standard"- Acesta este un argument, a cărui esență este clară din nume. Aceasta este abaterea standard a eșantionului propus.

"Mărimea"— argument care definește dimensiunea eșantionului.

Toate argumentele al acestui operator sunt obligatorii.

Funcţie ÎNCREDERE are exact aceleași argumente și posibilități ca și precedentul. Sintaxa sa este:

TRUST(alpha, standard_off, dimensiune)

După cum puteți vedea, diferențele sunt doar în numele operatorului. Funcția specificată din motive de compatibilitate, lăsat în Excel 2010 și versiuni mai noi într-o categorie specială "Compatibilitate". În versiunile Excel 2007 și anterioare, acesta este prezent în grupul principal de operatori statistici.

Limita intervalului de încredere este determinată folosind următoarea formulă:

X+(-)INCREDEREA NORMA

Unde X este valoarea medie a eșantionului, care se află la mijlocul intervalului selectat.

Acum să vedem cum să calculăm un interval de încredere exemplu concret. Au fost efectuate 12 teste, rezultând rezultate diferite, enumerate în tabel. Aceasta este totalitatea noastră. Abaterea standard este 8. Trebuie să calculăm intervalul de încredere la nivelul de încredere de 97%.

  1. Selectați celula în care va fi afișat rezultatul prelucrării datelor. Faceți clic pe butonul „Inserare funcție”.
  2. Apare Expertul de funcții. Mergi la categorie "Statistic"și evidențiați numele „TRUST.NORM”. După aceea, faceți clic pe butonul "BINE".
  3. Se deschide fereastra de argumente. Câmpurile sale corespund în mod firesc cu numele argumentelor.
    Plasați cursorul în primul câmp - "Alfa". Aici ar trebui să indicăm nivelul de semnificație. După cum ne amintim, nivelul nostru de încredere este de 97%. În același timp, am spus că se calculează astfel:

    (1-nivel de încredere)/100

    Adică, înlocuind valoarea, obținem:

    Prin calcule simple aflăm că argumentul "Alfa" egală 0,03 . introduce valoare datăîn câmp.

    După cum se știe, prin condiție abaterea standard este egală cu 8 . Prin urmare, pe teren "Deviație standard" doar notează acest număr.

    În câmp "Mărimea" trebuie să introduceți numărul de elemente de testare efectuate. După cum ne amintim, lor 12 . Dar pentru a automatiza formula și a nu o edita de fiecare dată când efectuăm un nou test, să setăm această valoare nu cu un număr obișnuit, ci folosind operatorul VERIFICA. Deci, să plasăm cursorul în câmp "Mărimea", apoi faceți clic pe triunghi, care se află în stânga barei de formule.

    Apare o listă cu funcțiile utilizate recent. Dacă operatorul VERIFICA a fost folosit recent de dvs., ar trebui să fie pe această listă. În acest caz, trebuie doar să faceți clic pe numele acestuia. În caz contrar, dacă nu îl găsești, mergi la subiect „Alte funcții...”.

  4. Apare unul deja familiar Expertul de funcții. Să ne întoarcem din nou la grup "Statistic". Evidențiem numele acolo "VERIFICA". Faceți clic pe butonul "BINE".
  5. Apare fereastra de argument pentru afirmația de mai sus. Această funcție este concepută pentru a calcula numărul de celule dintr-un interval specificat care conțin valori numerice. Sintaxa sa este următoarea:

    COUNT(valoare1,valoare2,...)

    Grupul de argumentare "Valori" este o referință la intervalul în care doriți să calculați numărul de celule umplute cu date numerice. Pot exista până la 255 de astfel de argumente în total, dar în cazul nostru avem nevoie doar de unul.

    Plasați cursorul în câmp „Valoare 1”și, ținând apăsat butonul stâng al mouse-ului, selectați pe foaie gama care conține colecția noastră. Apoi adresa lui va fi afișată în câmp. Faceți clic pe butonul "BINE".

  6. După aceasta, aplicația va efectua calculul și va afișa rezultatul în celula în care se află. În cazul nostru particular, formula arăta astfel:

    NORMĂ DE ÎNCREDERE(0,03,8,NUMĂRĂ(B2:B13))

    Rezultatul general al calculelor a fost 5,011609 .

  7. Dar asta nu este tot. După cum ne amintim, limita intervalului de încredere este calculată prin adăugarea și scăderea rezultatului calculului din media eșantionului ÎNCREDERE.NORMĂ. În acest fel, se calculează limitele din dreapta și respectiv din stânga intervalului de încredere. Media eșantionului în sine poate fi calculată folosind operatorul IN MEDIE.

    Acest operator este conceput pentru a calcula media aritmetică a unui interval selectat de numere. Are următoarea sintaxă destul de simplă:

    MEDIE(numărul1,numărul2,...)

    Argument "Număr" pot fi fie separate valoare numerică, și un link către celule sau chiar intervale întregi care le conțin.

    Deci, selectați celula în care va fi afișat calculul valorii medii și faceți clic pe butonul „Inserare funcție”.

  8. Se deschide Expertul de funcții. Revenind la categorie "Statistic"și selectați un nume din listă "IN MEDIE". Ca întotdeauna, faceți clic pe butonul "BINE".
  9. Se deschide fereastra de argumente. Plasați cursorul în câmp "Numărul 1"și ținând apăsat butonul stâng al mouse-ului, selectați întregul interval de valori. După ce coordonatele sunt afișate în câmp, faceți clic pe butonul "BINE".
  10. După care IN MEDIE afișează rezultatul calculului într-un element de foaie.
  11. Calculăm limita dreaptă a intervalului de încredere. Pentru a face acest lucru, selectați o celulă separată și puneți semnul «=» și se adună conținutul elementelor foii în care se află rezultatele calculelor de funcție IN MEDIEȘi ÎNCREDERE.NORMĂ. Pentru a efectua calculul, apăsați butonul introduce. În cazul nostru, avem următoarea formulă:

    Rezultatul calculului: 6,953276

  12. La fel se calculează limita din stânga a intervalului de încredere, doar de data aceasta din rezultatul calculului IN MEDIE scade rezultatul calculului operatorului ÎNCREDERE.NORMĂ. Formula rezultată pentru exemplul nostru este de următorul tip:

    Rezultatul calculului: -3,06994

  13. Am încercat să descriem în detaliu toți pașii pentru calcularea intervalului de încredere, așa că am descris în detaliu fiecare formulă. Dar puteți combina toate acțiunile într-o singură formulă. Calculul limitei drepte a intervalului de încredere poate fi scris după cum urmează:

    MEDIE(B2:B13)+ÎNCREDERE.NORMĂ(0,03,8,NUMĂRĂ(B2:B13))

  14. Un calcul similar pentru marginea din stânga ar arăta astfel:

    MEDIE(B2:B13)-CONFIDENCE.NORM(0,03,8,NUMĂR (B2:B13))

Metoda 2: Funcția TRUST.STUDENT

În plus, Excel are o altă funcție care este asociată cu calcularea intervalului de încredere - ADMINISTRATOR.STUDENT. A apărut doar în Excel 2010. Acest operator calculează intervalul de încredere al populației folosind distribuția Student. Este foarte convenabil de utilizat atunci când varianța și, în consecință, abaterea standard sunt necunoscute. Sintaxa operatorului este:

CONFIDENCE.STUDENT(alpha,standard_off,size)

După cum puteți vedea, numele operatorilor au rămas neschimbate în acest caz.

Să vedem cum se calculează limitele unui interval de încredere cu o abatere standard necunoscută folosind exemplul aceleiași populații pe care am considerat-o în metoda anterioară. Să luăm nivelul de încredere ca ultima dată la 97%.

  1. Selectați celula în care va fi efectuat calculul. Faceți clic pe butonul „Inserare funcție”.
  2. În deschis Expertul de funcții mergi la categorie "Statistic". Selectați un nume „ELEV DE ÎNCREDERE”. Faceți clic pe butonul "BINE".
  3. Se lansează fereastra de argumente pentru operatorul specificat.

    În câmp "Alfa", având în vedere că nivelul de încredere este de 97%, notăm numărul 0,03 . Pentru a doua oară nu ne vom opri asupra principiilor calculării acestui parametru.

    După aceasta, plasați cursorul în câmp "Deviație standard". De data aceasta, acest indicator ne este necunoscut și trebuie calculat. Acest lucru se face folosind o funcție specială - STDEV.V. Pentru a deschide fereastra acestui operator, faceți clic pe triunghiul din stânga barei de formule. Dacă nu găsim numele dorit în lista care se deschide, atunci mergeți la articol „Alte funcții...”.

  4. Începe Expertul de funcții. Trecerea la categorie "Statistic"și marcați numele în el „STDEV.B”. Apoi faceți clic pe butonul "BINE".
  5. Se deschide fereastra de argumente. Sarcina operatorului STDEV.V este definitia deviație standard la prelevare de probe. Sintaxa sa arată astfel:

    DEVIARE STANDARD.B(număr1;număr2;…)

    Nu este greu de ghicit că argumentul "Număr" este adresa elementului de selecție. Dacă selecția este plasată într-o singură matrice, atunci puteți folosi un singur argument pentru a furniza o legătură către acest interval.

    Plasați cursorul în câmp "Numărul 1"și, ca întotdeauna, ținând apăsat butonul stâng al mouse-ului, selectați colecția. După ce coordonatele sunt în câmp, nu vă grăbiți să apăsați butonul "BINE", deoarece rezultatul va fi incorect. Mai întâi trebuie să ne întoarcem la fereastra de argumente operator ADMINISTRATOR.STUDENT pentru a adăuga argumentul final. Pentru a face acest lucru, faceți clic pe numele corespunzător din bara de formule.

  6. Fereastra de argumente pentru funcția deja familiară se deschide din nou. Plasați cursorul în câmp "Mărimea". Din nou, faceți clic pe triunghiul cu care suntem deja familiarizați pentru a merge la selecția operatorilor. După cum înțelegeți, avem nevoie de un nume "VERIFICA". Deoarece am folosit această funcție în calculele din metoda anterioară, este prezentă în această listă, așa că faceți clic pe ea. Dacă nu îl găsiți, atunci urmați algoritmul descris în prima metodă.
  7. Odată în fereastra de argumente VERIFICA, plasați cursorul în câmp "Numărul 1"și cu butonul mouse-ului ținut apăsat, selectați colecția. Apoi faceți clic pe butonul "BINE".
  8. După aceasta, programul efectuează un calcul și afișează valoarea intervalului de încredere.
  9. Pentru a determina limitele, va trebui din nou să calculăm media eșantionului. Dar, având în vedere că algoritmul de calcul folosind formula IN MEDIE la fel ca în metoda anterioară și chiar și rezultatul nu s-a schimbat, nu ne vom opri asupra acestui lucru în detaliu a doua oară.
  10. Însumarea rezultatelor calculului IN MEDIEȘi ADMINISTRATOR.STUDENT, obținem limita dreaptă a intervalului de încredere.
  11. Scăzând din rezultatele de calcul ale operatorului IN MEDIE rezultatul calculului ADMINISTRATOR.STUDENT, avem limita din stânga a intervalului de încredere.
  12. Dacă calculul este scris într-o singură formulă, atunci calculul limitei drepte în cazul nostru va arăta astfel:

    MEDIE(B2:B13)+ÎNCREDERE.STUDENT(0,03,STDEV.B(B2:B13),NUMĂR(B2:B13))

  13. În consecință, formula pentru calcularea marginii din stânga va arăta astfel:

    MEDIE(B2:B13)-INCREDERE.STUDENT(0,03,STDEV.B(B2:B13),NUMĂR(B2:B13))

După cum puteți vedea, instrumentele programe Excel fac posibilă simplificarea semnificativă a calculului intervalului de încredere și a limitelor acestuia. În aceste scopuri, se folosesc operatori separați pentru eșantioanele a căror varianță este cunoscută și necunoscută.