Varianta unei variabile aleatoare este o măsură a răspândirii valorilor acestei variabile. Varianta scăzută înseamnă că valorile sunt grupate strâns. Dispersia mare indică o răspândire puternică a valorilor. Conceptul de varianță a unei variabile aleatoare este utilizat în statistică. De exemplu, dacă comparați varianța a două valori (cum ar fi între pacienții de sex masculin și de sex feminin), puteți testa semnificația unei variabile. Varianta este, de asemenea, utilizată la construirea modelelor statistice, deoarece variația scăzută poate fi un semn că supraajustați valorile.

Pași

Calcularea varianței eșantionului

  1. Înregistrați valorile eșantionului.În cele mai multe cazuri, statisticienii au acces doar la mostre de populații specifice. De exemplu, de regulă, statisticienii nu analizează costul întreținerii totalității tuturor mașinilor din Rusia - ei analizează un eșantion aleatoriu de câteva mii de mașini. Un astfel de eșantion va ajuta la determinarea costului mediu al unei mașini, dar, cel mai probabil, valoarea rezultată va fi departe de cea reală.

    • De exemplu, să analizăm numărul de chifle vândute într-o cafenea pe parcursul a 6 zile, luate în ordine aleatorie. Eșantionul arată astfel: 17, 15, 23, 7, 9, 13. Acesta este un eșantion, nu o populație, deoarece nu avem date despre chiflele vândute pentru fiecare zi în care cafeneaua este deschisă.
    • Dacă vi se oferă o populație mai degrabă decât un eșantion de valori, continuați la secțiunea următoare.
  2. Scrieți o formulă pentru a calcula varianța eșantionului. Dispersia este o măsură a răspândirii valorilor unei anumite cantități. Cu cât valoarea varianței este mai aproape de zero, cu atât valorile sunt grupate mai aproape. Când lucrați cu un eșantion de valori, utilizați următoarea formulă pentru a calcula varianța:

    • s 2 (\displaystyle s^(2)) = ∑[(x i (\displaystyle x_(i))- X) 2 (\displaystyle ^(2))] / (n - 1)
    • s 2 (\displaystyle s^(2))– aceasta este dispersia. Dispersia se măsoară în unități pătrate.
    • x i (\displaystyle x_(i))– fiecare valoare din eșantion.
    • x i (\displaystyle x_(i)) trebuie să scădeți x̅, să-l pătrați și apoi să adăugați rezultatele.
    • x̅ – medie eșantion (medie eșantion).
    • n – numărul de valori din eșantion.
  3. Calculați media eșantionului. Este notat cu x̅. Media eșantionului este calculată ca medie aritmetică simplă: se adună toate valorile din eșantion, apoi se împarte rezultatul la numărul de valori din eșantion.

    • În exemplul nostru, adăugați valorile din eșantion: 15 + 17 + 23 + 7 + 9 + 13 = 84
      Acum împărțiți rezultatul la numărul de valori din eșantion (în exemplul nostru sunt 6): 84 ÷ 6 = 14.
      Media eșantionului x̅ = 14.
    • Media eșantionului este valoarea centrală în jurul căreia sunt distribuite valorile din eșantion. Dacă valorile din grupul de eșantion din jurul eșantionului sunt medii, atunci varianța este mică; în caz contrar, varianța este mare.
  4. Scădeți media eșantionului din fiecare valoare din eșantion. Acum calculează diferența x i (\displaystyle x_(i))- x̅, unde x i (\displaystyle x_(i))– fiecare valoare din eșantion. Fiecare rezultat obținut indică gradul de abatere al unei anumite valori de la media eșantionului, adică cât de departe este această valoare de media eșantionului.

    • În exemplul nostru:
      x 1 (\displaystyle x_(1))- x = 17 - 14 = 3
      x 2 (\displaystyle x_(2))- x̅ = 15 - 14 = 1
      x 3 (\displaystyle x_(3))- x = 23 - 14 = 9
      x 4 (\displaystyle x_(4))- x̅ = 7 - 14 = -7
      x 5 (\displaystyle x_(5))- x̅ = 9 - 14 = -5
      x 6 (\displaystyle x_(6))- x̅ = 13 - 14 = -1
    • Corectitudinea rezultatelor obținute este ușor de verificat, deoarece suma lor ar trebui să fie egală cu zero. Acest lucru este legat de determinarea valorii medii, deoarece valorile negative (distanțele de la valoarea medie la valori mai mici) sunt complet compensate valori pozitive(distanțele de la valori medii la mari).
  5. După cum sa menționat mai sus, suma diferențelor x i (\displaystyle x_(i))- x̅ trebuie să fie egal cu zero. Înseamnă că varianta medie este întotdeauna egal cu zero, ceea ce nu dă nicio idee despre răspândirea valorilor unei anumite cantități. Pentru a rezolva această problemă, pătrați fiecare diferență x i (\displaystyle x_(i))- X. Acest lucru va duce la obținerea doar a unor numere pozitive, care nu vor aduna niciodată până la 0.

    • În exemplul nostru:
      (x 1 (\displaystyle x_(1))- X) 2 = 3 2 = 9 (\displaystyle ^(2)=3^(2)=9)
      (x 2 (\displaystyle (x_(2)))- X) 2 = 1 2 = 1 (\displaystyle ^(2)=1^(2)=1)
      9 2 = 81
      (-7) 2 = 49
      (-5) 2 = 25
      (-1) 2 = 1
    • Ai găsit pătratul diferenței - x̅) 2 (\displaystyle ^(2)) pentru fiecare valoare din eșantion.
  6. Calculați suma pătratelor diferențelor. Adică, găsiți acea parte a formulei care este scrisă astfel: ∑[( x i (\displaystyle x_(i))- X) 2 (\displaystyle ^(2))]. Aici semnul Σ înseamnă suma diferențelor pătrate pentru fiecare valoare x i (\displaystyle x_(i))în probă. Ați găsit deja diferențele la pătrat (x i (\displaystyle (x_(i)))- X) 2 (\displaystyle ^(2)) pentru fiecare valoare x i (\displaystyle x_(i))în probă; acum doar adăugați aceste pătrate.

    • În exemplul nostru: 9 + 1 + 81 + 49 + 25 + 1 = 166 .
  7. Împărțiți rezultatul la n - 1, unde n este numărul de valori din eșantion. Cu ceva timp în urmă, pentru a calcula varianța eșantionului, statisticienii au împărțit pur și simplu rezultatul la n; în acest caz, veți obține media varianței pătrate, care este ideală pentru a descrie varianța unui eșantion dat. Dar amintiți-vă că orice probă este doar o mică parte populatie valorile. Dacă luați o altă probă și efectuați aceleași calcule, veți obține un rezultat diferit. După cum se dovedește, împărțirea la n - 1 (mai degrabă decât doar n) oferă o estimare mai precisă a varianței populației, care este ceea ce vă interesează. Împărțirea cu n – 1 a devenit obișnuită, deci este inclusă în formula pentru calcularea varianței eșantionului.

    • În exemplul nostru, eșantionul include 6 valori, adică n = 6.
      Varianta eșantionului = s 2 = 166 6 − 1 = (\displaystyle s^(2)=(\frac (166)(6-1))=) 33,2
  8. Diferența dintre varianță și abaterea standard. Rețineți că formula conține un exponent, astfel încât dispersia este măsurată în unități pătrate ale valorii analizate. Uneori, o astfel de mărime este destul de dificil de operat; în astfel de cazuri, utilizați abaterea standard, care este egală cu rădăcină pătrată din dispersie. De aceea, varianța eșantionului se notează ca s 2 (\displaystyle s^(2)), A deviație standard mostre - cum s (\displaystyle s).

    • În exemplul nostru, abaterea standard a eșantionului este: s = √33,2 = 5,76.

    Calcularea variației populației

    1. Analizați un set de valori. Setul include toate valorile cantității luate în considerare. De exemplu, dacă studiezi vârsta rezidenților Regiunea Leningrad, atunci populația include vârstele tuturor locuitorilor acestei zone. Când lucrați cu o populație, se recomandă să creați un tabel și să introduceți valorile populației în el. Luați în considerare următorul exemplu:

      • Într-o anumită cameră sunt 6 acvarii. Fiecare acvariu conține următorul număr de pești:
        x 1 = 5 (\displaystyle x_(1)=5)
        x 2 = 5 (\displaystyle x_(2)=5)
        x 3 = 8 (\displaystyle x_(3)=8)
        x 4 = 12 (\displaystyle x_(4)=12)
        x 5 = 15 (\displaystyle x_(5)=15)
        x 6 = 18 (\displaystyle x_(6)=18)
    2. Scrieți o formulă pentru a calcula varianța populației.Întrucât totalitatea include toate valorile unei anumite cantități, formula de mai jos ne permite să obținem valoare exacta variaţiile populaţiei. Pentru a distinge varianța populației de varianța eșantionului (care este doar o estimare), statisticienii folosesc diverse variabile:

      • σ 2 (\displaystyle ^(2)) = (∑(x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2)))/n
      • σ 2 (\displaystyle ^(2))– dispersia populației (a se citi „sigma pătrat”). Dispersia se măsoară în unități pătrate.
      • x i (\displaystyle x_(i))– fiecare valoare în întregime.
      • Σ – semnul sumei. Adică din fiecare valoare x i (\displaystyle x_(i)) trebuie să scădeți μ, să-l pătrați și apoi să adăugați rezultatele.
      • μ – media populației.
      • n – numărul de valori din populație.
    3. Calculați media populației. Când se lucrează cu o populație, media ei este notată ca μ (mu). Media populației este calculată ca medie aritmetică simplă: se adună toate valorile din populație și apoi se împarte rezultatul la numărul de valori din populație.

      • Rețineți că mediile nu sunt întotdeauna calculate ca medie aritmetică.
      • În exemplul nostru, media populației: μ = 5 + 5 + 8 + 12 + 15 + 18 6 (\displaystyle (\frac (5+5+8+12+15+18)(6))) = 10,5
    4. Scădeți media populației din fiecare valoare din populație. Cu cât diferența este mai aproape de zero, cu atât mai aproape sens specific la media populaţiei. Găsiți diferența dintre fiecare valoare din populație și media acesteia și vă veți face o primă idee despre distribuția valorilor.

      • În exemplul nostru:
        x 1 (\displaystyle x_(1))- μ = 5 - 10,5 = -5,5
        x 2 (\displaystyle x_(2))- μ = 5 - 10,5 = -5,5
        x 3 (\displaystyle x_(3))- μ = 8 - 10,5 = -2,5
        x 4 (\displaystyle x_(4))- μ = 12 - 10,5 = 1,5
        x 5 (\displaystyle x_(5))- μ = 15 - 10,5 = 4,5
        x 6 (\displaystyle x_(6))- μ = 18 - 10,5 = 7,5
    5. Patratează fiecare rezultat obținut. Valorile diferențelor vor fi atât pozitive, cât și negative; Dacă aceste valori sunt reprezentate pe o dreaptă numerică, ele se vor afla la dreapta și la stânga mediei populației. Acest lucru nu este bun pentru calcularea varianței, deoarece numerele pozitive și negative se anulează reciproc. Deci pătrați fiecare diferență pentru a obține numere exclusiv pozitive.

      • În exemplul nostru:
        (x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2)) pentru fiecare valoare a populației (de la i = 1 la i = 6):
        (-5,5)2 (\displaystyle ^(2)) = 30,25
        (-5,5)2 (\displaystyle ^(2)), Unde x n (\displaystyle x_(n))– ultima valoare din populatie.
      • Pentru a calcula valoarea medie a rezultatelor obținute, trebuie să găsiți suma lor și să o împărțiți la n:(( x 1 (\displaystyle x_(1)) - μ) 2 (\displaystyle ^(2)) + (x 2 (\displaystyle x_(2)) - μ) 2 (\displaystyle ^(2)) + ... + (x n (\displaystyle x_(n)) - μ) 2 (\displaystyle ^(2)))/n
      • Acum să scriem explicația de mai sus folosind variabile: (∑( x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2))) / n și obțineți o formulă pentru calcularea varianței populației.

Principalii indicatori generalizatori ai variației statisticilor sunt dispersiile și abaterile standard.

Dispersia aceasta medie aritmetică abaterile pătrate ale fiecărei valori caracteristice de la media generală. Varianta se numește de obicei pătratul mediu al abaterilor și se notează cu  2. În funcție de datele sursă, varianța poate fi calculată folosind media aritmetică simplă sau ponderată:

 varianță neponderată (simple);

 varianță ponderată.

Deviație standard aceasta este o caracteristică generalizantă a dimensiunilor absolute variatii semne în ansamblu. Se exprimă în aceleași unități de măsură ca și atributul (în metri, tone, procente, hectare etc.).

Abaterea standard este rădăcina pătrată a varianței și se notează cu :

 abaterea standard neponderată;

 abaterea standard ponderată.

Abaterea standard este o măsură a fiabilității mediei. Cu cât abaterea standard este mai mică, cu atât media aritmetică reflectă mai bine întreaga populație reprezentată.

Calculul abaterii standard este precedat de calculul varianței.

Procedura de calcul a variației ponderate este următoarea:

1) determinați media aritmetică ponderată:

2) calculați abaterile opțiunilor de la medie:

3) la pătrat abaterea fiecărei opțiuni de la medie:

4) înmulțiți pătratele abaterilor cu greutăți (frecvențe):

5) rezumați produsele rezultate:

6) suma rezultată se împarte la suma greutăților:

Exemplul 2.1

Să calculăm media aritmetică ponderată:

Valorile abaterilor de la medie și pătratele lor sunt prezentate în tabel. Să definim varianța:

Abaterea standard va fi egală cu:

Dacă datele sursă sunt prezentate sub formă de interval serie de distribuție , atunci trebuie mai întâi să determinați valoarea discretă a atributului și apoi să aplicați metoda descrisă.

Exemplul 2.2

Să arătăm calculul varianței pentru o serie de intervale folosind date despre distribuția suprafeței însămânțate a unei ferme colective în funcție de randamentul grâului.

Media aritmetica este:

Să calculăm varianța:

6.3. Calculul varianței folosind o formulă bazată pe date individuale

Tehnica de calcul variaţiile complicat, dar valori mari opțiunile și frecvențele pot fi copleșitoare. Calculele pot fi simplificate folosind proprietățile dispersiei.

Dispersia are următoarele proprietăți.

1. Reducerea sau creșterea greutăților (frecvențelor) unei caracteristici variabile de un anumit număr de ori nu modifică dispersia.

2. Scădeți sau creșteți fiecare valoare a unei caracteristici cu aceeași cantitate constantă A nu modifică dispersia.

3. Scădeți sau creșteți fiecare valoare a unei caracteristici de un anumit număr de ori k respectiv reduce sau mărește varianța în k de 2 ori deviație standard  în k o singura data.

4. Dispersia unei caracteristici în raport cu o valoare arbitrară este întotdeauna mai mare decât dispersia în raport cu media aritmetică pe pătrat a diferenței dintre valorile medii și arbitrare:

Dacă A 0, atunci ajungem la următoarea egalitate:

adică varianța caracteristicii este egală cu diferența dintre pătratul mediu al valorilor caracteristice și pătratul mediei.

Fiecare proprietate poate fi utilizată independent sau în combinație cu altele atunci când se calculează varianța.

Procedura de calcul a varianței este simplă:

1) determina medie aritmetică :

2) la pătrat media aritmetică:

3) la pătrat abaterea fiecărei variante a seriei:

X i 2 .

4) găsiți suma pătratelor opțiunilor:

5) împărțiți suma pătratelor opțiunilor la numărul lor, adică determinați pătratul mediu:

6) determinați diferența dintre pătratul mediu al caracteristicii și pătratul mediei:

Exemplul 3.1 Următoarele date sunt disponibile despre productivitatea lucrătorilor:

Să facem următoarele calcule:

Pe lângă studierea variației unei caracteristici în întreaga populație în ansamblu, este adesea necesară urmărirea modificărilor cantitative ale caracteristicii în grupurile în care este împărțită populația, precum și între grupuri. Acest studiu al variației se realizează prin calcul și analiză tipuri variate variaţiile.
Există variații totale, intergrup și intragrup.
Varianta totala σ 2 măsoară variația unei trăsături în întreaga populație sub influența tuturor factorilor care au determinat această variație.

Varianta intergrup (δ) caracterizează variația sistematică, adică. diferenţe de valoare a trăsăturii studiate care apar sub influenţa trăsăturii factoriale care formează baza grupului. Se calculează folosind formula:
.

Varianta în cadrul grupului (σ) reflectă variația aleatorie, adică parte a variației care apare sub influența factorilor necontabiliați și nu depinde de atributul-factorial care formează baza grupului. Se calculează prin formula:
.

Media variațiilor în cadrul grupului: .

Există o lege care leagă 3 tipuri de dispersie. Varianța totală este egală cu suma mediei variației în interiorul grupului și între grupuri: .
Acest raport se numește regula pentru adăugarea variațiilor.

Analiza utilizează pe scară largă un indicator care reprezintă ponderea variației intergrupuri în varianta totala. Se numeste coeficient empiric de determinare (η 2): .
Se numește rădăcina pătrată a coeficientului empiric de determinare raportul de corelație empirică (η):
.
Caracterizează influența caracteristicii care formează baza grupului asupra variației caracteristicii rezultate. Raportul de corelație empirică variază de la 0 la 1.
Să o arătăm uz practic folosind următorul exemplu (Tabelul 1).

Exemplul nr. 1. Tabelul 1 - Productivitatea muncii a două grupuri de lucrători într-unul din atelierele ONG „Ciclon”

Să calculăm mediile și variațiile globale și de grup:




Datele inițiale pentru calcularea mediei variației intragrup și intergrup sunt prezentate în tabel. 2.
masa 2
Calcul și δ 2 pentru două grupuri de lucrători.


Grupuri de muncitori
Număr de muncitori, oameni Mediu, copii/schimb Dispersia

Pregătire tehnică finalizată

5 95 42,0

Cei care nu au absolvit pregătirea tehnică

5 81 231,2

Toți muncitorii

10 88 185,6
Să calculăm indicatorii. Media variațiilor în cadrul grupului:
.
Varianta intergrup

Varianta totala:
Astfel, raportul de corelație empirică: .

Odată cu variația caracteristicilor cantitative, pot fi observate și variații în caracteristicile calitative. Acest studiu al variației se realizează prin calcul următoarele tipuri dispersii:

Dispersia în interiorul grupului a cotei este determinată de formulă

Unde n i– numărul de unități în grupuri separate.
Ponderea caracteristicii studiate în întreaga populație, care este determinată de formula:
Cele trei tipuri de varianță sunt legate între ele, după cum urmează:
.

Această relație de varianțe se numește teorema de adunare a varianțelor cotei de trăsătură.

Varianta este o măsură a dispersiei care descrie abaterea comparativă între valorile datelor și medie. Este cea mai utilizată măsură a dispersiei în statistică, calculată prin însumarea și pătrarea abaterii fiecărei valori de date de la medie. Formula de calcul a varianței este prezentată mai jos:

s 2 – varianța eșantionului;

x av — medie eșantionului;

n dimensiunea eșantionului (număr de valori ale datelor),

(x i – x avg) este abaterea de la valoarea medie pentru fiecare valoare a setului de date.

Pentru a înțelege mai bine formula, să ne uităm la un exemplu. Nu prea îmi place să gătesc, așa că o fac rar. Totuși, pentru a nu muri de foame, din când în când trebuie să merg la aragaz să pun în aplicare planul de a-mi satura corpul cu proteine, grăsimi și carbohidrați. Setul de date de mai jos arată de câte ori gătește Renat în fiecare lună:

Primul pas în calcularea varianței este determinarea mediei eșantionului, care în exemplul nostru este de 7,8 ori pe lună. Restul calculelor pot fi simplificate folosind următorul tabel.

Faza finală de calcul a varianței arată astfel:

Pentru cei cărora le place să facă toate calculele dintr-o singură mișcare, ecuația ar arăta astfel:

Folosind metoda numărării crude (exemplu de gătit)

Mai sunt metoda eficienta calculul varianței, cunoscut sub numele de metoda „numărării brute”. Deși ecuația poate părea destul de greoaie la prima vedere, de fapt nu este chiar atât de înfricoșătoare. Puteți să vă asigurați de acest lucru și apoi să decideți ce metodă vă place cel mai mult.

este suma fiecărei valori de date după pătrat,

este pătratul sumei tuturor valorilor datelor.

Nu-ți pierde mințile chiar acum. Să punem toate acestea într-un tabel și veți vedea că aici sunt mai puține calcule decât în ​​exemplul anterior.

După cum puteți vedea, rezultatul a fost același ca atunci când ați folosit metoda anterioară. Avantaje aceasta metoda devin evidente pe măsură ce dimensiunea eșantionului (n) crește.

Calculul variației în Excel

După cum probabil ați ghicit deja, Excel are o formulă care vă permite să calculați varianța. Mai mult, începând cu Excel 2010, puteți găsi 4 tipuri de formule de variație:

1) VARIANCE.V – Returnează varianța eșantionului. Valorile booleene și textul sunt ignorate.

2) DISP.G - Returnează varianța populației. Valorile booleene și textul sunt ignorate.

3) VARIANCE - Returnează varianța eșantionului, luând în considerare valorile booleene și text.

4) VARIANCE - Returnează varianța populației, ținând cont de valorile logice și de text.

În primul rând, să înțelegem diferența dintre un eșantion și o populație. Scopul statisticilor descriptive este de a rezuma sau de a afișa date astfel încât să obțineți rapid imaginea de ansamblu, o privire de ansamblu, ca să spunem așa. Inferența statistică vă permite să faceți inferențe despre o populație pe baza unui eșantion de date din acea populație. Populația reprezintă toate rezultatele sau măsurătorile posibile care ne interesează. Un eșantion este un subset al unei populații.

De exemplu, ne interesează totalitatea unui grup de studenți dintr-unul dintre universități ruseștiși trebuie să determinăm scorul mediu al grupului. Putem calcula performanța medie a elevilor, iar apoi cifra rezultată va fi un parametru, deoarece întreaga populație va fi implicată în calculele noastre. Totuși, dacă dorim să calculăm GPA-ul tuturor studenților din țara noastră, atunci acest grup va fi eșantionul nostru.

Diferența în formula de calcul a varianței dintre un eșantion și o populație este numitorul. Unde pentru eșantion va fi egal cu (n-1), iar pentru populația generală doar n.

Acum să ne uităm la funcțiile pentru calcularea varianței cu terminații A, a cărui descriere afirmă că textul și valorile logice sunt luate în considerare în calcul. În acest caz, atunci când se calculează varianța unei anumite matrice de date, acolo unde nu există valori numerice Excel va interpreta textul și valorile booleene false ca fiind egale cu 0, iar valorile booleene adevărate ca fiind egale cu 1.

Deci, dacă aveți o matrice de date, calcularea varianței acesteia nu va fi dificilă folosind una dintre funcțiile Excel enumerate mai sus.

Varianta (difuzarea) unei variabile aleatoare este așteptarea matematică a abaterii pătrate a unei variabile aleatoare de la așteptarea ei matematică:

Pentru a calcula varianța, puteți utiliza o formulă ușor modificată

deoarece M(X), 2 și
– valori constante. Prin urmare,

4.2.2. Proprietăți de dispersie

Proprietatea 1. Varianta unei valori constante este zero. Într-adevăr, prin definiție

Proprietatea 2. Factorul constant poate fi scos din semnul de dispersie prin pătratul acestuia.

Dovada

Centrat o variabilă aleatoare este abaterea unei variabile aleatoare de la așteptările ei matematice:

O mărime centrată are două proprietăți convenabile pentru transformare:

Proprietatea 3. Dacă variabilele aleatoare X și Y sunt independente, atunci

Dovada. Să notăm
. Apoi.

În al doilea termen, datorită independenței variabilelor aleatoare și proprietăților variabilelor aleatoare centrate

Exemplul 4.5. Dacă AȘi b– constante, apoi D (AX+b)= D(AX)+D(b)=
.

4.2.3. Deviație standard

Dispersia, ca caracteristică a răspândirii unei variabile aleatoare, are un dezavantaj. Dacă, de exemplu, X– eroarea de măsurare are o dimensiune MM, atunci dispersia are dimensiunea
. Prin urmare, ei preferă adesea să folosească o altă caracteristică de împrăștiere - deviație standard , care este egală cu rădăcina pătrată a varianței

Abaterea standard are aceeași dimensiune ca ea însăși valoare aleatorie.

Exemplul 4.6. Variația numărului de apariții ale unui eveniment într-un proiect de studiu independent

Produs nîncercări independente și probabilitatea ca un eveniment să apară în fiecare proces este R. Să exprimăm, ca mai înainte, numărul de apariții ale evenimentului X prin numărul de apariții ale evenimentului în experimente individuale:

Deoarece experimentele sunt independente, variabilele aleatoare sunt asociate cu experimentele independent. Și datorită independenței avem

Dar fiecare dintre variabilele aleatoare are o lege de distribuție (exemplul 3.2)

Și
(exemplul 4.4). Prin urmare, prin definiția varianței:

Unde q=1- p.

Ca rezultat avem
,

Abaterea standard a numărului de apariții ale unui eveniment în n experimente independente egale
.

4.3. Momente de variabile aleatorii

Pe lângă cele deja luate în considerare, variabilele aleatoare au multe alte caracteristici numerice.

Momentul de pornire k X (
) se numește așteptarea matematică k-a putere a acestei variabile aleatoare.

Moment central k variabilă aleatoare de ordinul al-lea X numita asteptare matematica k-a putere a mărimii centrate corespunzătoare.

Este ușor de observat că momentul central de ordinul întâi este întotdeauna egal cu zero, momentul central de ordinul doi este egal cu dispersia, deoarece .

Momentul central de ordinul trei oferă o idee despre asimetria distribuției unei variabile aleatoare. Momentele de ordine mai mari decât secunda sunt folosite relativ rar, așa că ne vom limita doar la conceptele în sine.

4.4. Exemple de găsire a legilor de distribuție

Să luăm în considerare exemple de găsire a legilor de distribuție a variabilelor aleatoare și a caracteristicilor lor numerice.

Exemplul 4.7.

Întocmește o lege pentru distribuirea numărului de lovituri pe o țintă cu trei lovituri la o țintă, dacă probabilitatea unei lovituri la fiecare lovitură este 0,4. Găsiți funcția integrală F(X) pentru distribuția rezultată a unei variabile aleatoare discrete Xși desenați un grafic al acestuia. Găsiți valoarea așteptată M(X) , varianță D(X) și abaterea standard
(X) variabilă aleatorie X.

Soluţie

1) Variabilă aleatorie discretă X– numărul de lovituri pe țintă cu trei lovituri – poate lua patru valori: 0, 1, 2, 3 . Probabilitatea ca ea să accepte fiecare dintre ele se găsește folosind formula lui Bernoulli cu: n=3,p=0,4,q=1- p=0,6 și m=0, 1, 2, 3:

Să obținem probabilitățile de valori posibile X:;

Să compunem legea de distribuție dorită a unei variabile aleatoare X:

Control: 0,216+0,432+0,288+0,064=1.

Să construim un poligon de distribuție al variabilei aleatoare rezultate X. Pentru a face acest lucru, în sistemul de coordonate dreptunghiular se marchează punctele (0; 0,216), (1; 0,432), (2; 0,288), (3; 0,064). Să conectăm aceste puncte cu segmente de linie dreaptă, linia întreruptă rezultată este poligonul de distribuție dorit (Fig. 4.1).

2) Dacă x 0, atunci F(X)=0. Într-adevăr, pentru valori mai mici decât zero, valoarea X nu acceptă. Prin urmare, pentru toți X0, folosind definiția F(X), primim F(X)=P(X< X) =0 (ca probabilitate a unui eveniment imposibil).

Daca 0 , Acea F(X) =0,216. Într-adevăr, în acest caz F(X)=P(X< X) = =P(- < X 0)+ P(0< X< X) =0,216+0=0,216.

Dacă luăm, de exemplu, X=0,2, atunci F(0,2)=P(X<0,2) . Dar probabilitatea unui eveniment X<0,2 равна 0,216, так как случайная величинаX doar într-un caz ia o valoare mai mică de 0,2 și anume 0 cu probabilitate 0,216.

Daca 1 , Acea

Într-adevăr, X poate lua valoarea 0 cu probabilitate 0,216 și valoarea 1 cu probabilitate 0,432; prin urmare, unul dintre aceste semnificații, indiferent care, X poate accepta (conform teoremei de adunare a probabilităților de evenimente incompatibile) cu o probabilitate de 0,648.

Daca 2 , apoi, argumentând în mod similar, obținem F(X)=0,216+0,432 + + 0,288=0,936. Într-adevăr, să lăsăm, de exemplu, X=3. Apoi F(3)=P(X<3) exprimă probabilitatea unui eveniment X<3 – стрелок сделает меньше трех попаданий, т.е. ноль, один или два. Применяя теорему сложения вероятностей, получим указанное значение функцииF(X).

Dacă X>3, atunci F(X)=0,216+0,432+0,288+0,064=1. Într-adevăr, evenimentul X
este de încredere și probabilitatea sa este egală cu unu și X>3 – imposibil. Având în vedere că

F(X)=P(X< X) =P(X 3) + P(3< X< X) , obținem rezultatul indicat.

Deci, se obține funcția de distribuție integrală necesară a variabilei aleatoare X:

F(X) =

al cărui grafic este prezentat în fig. 4.2.

3) Așteptările matematice ale unei variabile aleatoare discrete sunt egale cu suma produselor tuturor valorilor posibile X pe probabilitățile lor:

M(X)=0=1,2.

Adică, în medie, există o lovitură la țintă cu trei lovituri.

Varianta poate fi calculată din definiția varianței D(X)= M(X- M(X)) sau folosiți formula D(X)= M(X
, ceea ce duce mai repede la obiectiv.

Să scriem legea distribuției unei variabile aleatoare X :

Să găsim așteptarea matematică pentru X:

M(X ) = 04
= 2,16.

Să calculăm varianța necesară:

D(X) = M(X ) – (M(X)) = 2,16 – (1,2)= 0,72.

Găsim abaterea standard folosind formula

(X) =
= 0,848.

Interval ( M- ; M+ ) = (1,2-0,85; 1,2+0,85) = (0,35; 2,05) – intervalul celor mai probabile valori ale variabilei aleatoare X, conține valorile 1 și 2.

Exemplul 4.8.

Având în vedere o funcție de distribuție diferențială (funcția de densitate) a unei variabile aleatoare continue X:

f(X) =

1) Determinați parametrul constant A.

2) Găsiți funcția integrală F(X) .

3) Construiți grafice de funcții f(X) Și F(X) .

4) Găsiți probabilitatea în două moduri P(0,5< X 1,5) Și P(1,5< X<3,5) .

5). Găsiți valoarea așteptată M(X), varianță D(X)și abaterea standard
variabilă aleatorie X.

Soluţie

1) Funcție diferențială după proprietate f(X) trebuie să îndeplinească condiția
.

Să calculăm această integrală improprie pentru această funcție f(X) :

Înlocuind acest rezultat în partea stângă a egalității, obținem asta A=1. In conditia pentru f(X) înlocuiți parametrul A la 1:

2) A găsi F(X) hai sa folosim formula

.

Dacă x
, Acea
, prin urmare,

Daca 1
Acea

Dacă x>2, atunci

Deci, funcția integrală necesară F(X) are forma:

3) Să construim grafice ale funcțiilor f(X) Și F(X) (Fig. 4.3 și 4.4).

4) Probabilitatea ca o variabilă aleatoare să se încadreze într-un interval dat (A,b) calculat prin formula
, dacă funcția este cunoscută f(X), iar conform formulei P(A < X < b) = F(b) – F(A), dacă funcția este cunoscută F(X).

Vom găsi
folosind două formule și comparați rezultatele. După condiție a=0,5;b=1,5; funcţie f(X) specificate la punctul 1). Prin urmare, probabilitatea necesară conform formulei este egală cu:

Aceeași probabilitate poate fi calculată folosind formula b) prin incrementul obținut la pasul 2). funcţie integrală F(X) pe acest interval:

Deoarece F(0,5)=0.

În mod similar găsim

deoarece F(3,5)=1.

5) Pentru a afla așteptările matematice M(X) hai sa folosim formula
Funcţie f(X) dat în soluția de la punctul 1), este egal cu zero în afara intervalului (1,2]:

Varianta unei variabile aleatoare continue D(X) este determinat de egalitate

, sau egalitatea echivalentă


.

Pentru găsirea D(X) Să folosim ultima formulă și să luăm în considerare toate valorile posibile f(X) aparțin intervalului (1,2]:

Deviație standard
=
=0,276.

Intervalul celor mai probabile valori ale unei variabile aleatorii X egală

(M-
,M+
) = (1,58-0,28; 1,58+0,28) = (1,3; 1,86).