Dispersia variabilă aleatorie este o măsură a răspândirii valorilor acestei cantități. Varianta scăzută înseamnă că valorile sunt grupate strâns. Dispersia mare indică o răspândire puternică a valorilor. Conceptul de varianță a unei variabile aleatoare este utilizat în statistică. De exemplu, dacă comparați varianța a două valori (cum ar fi între pacienții de sex masculin și de sex feminin), puteți testa semnificația unei variabile. Varianta este, de asemenea, utilizată la construirea modelelor statistice, deoarece variația scăzută poate fi un semn că supraajustați valorile.

Pași

Calcularea varianței eșantionului

  1. Înregistrați valorile eșantionului.În cele mai multe cazuri, statisticienii au acces doar la mostre de populații specifice. De exemplu, de regulă, statisticienii nu analizează costul întreținerii totalității tuturor mașinilor din Rusia - ei analizează un eșantion aleatoriu de câteva mii de mașini. Un astfel de eșantion va ajuta la determinarea costului mediu al unei mașini, dar, cel mai probabil, valoarea rezultată va fi departe de cea reală.

    • De exemplu, să analizăm numărul de chifle vândute într-o cafenea pe parcursul a 6 zile, luate în ordine aleatorie. Proba are următoarea vedere: 17, 15, 23, 7, 9, 13. Acesta este un eșantion, nu o populație, pentru că nu avem date despre chiflele vândute pentru fiecare zi în care cafeneaua este deschisă.
    • Dacă vi se oferă o populație mai degrabă decât un eșantion de valori, continuați la secțiunea următoare.
  2. Scrieți o formulă pentru a calcula varianța eșantionului. Dispersia este o măsură a răspândirii valorilor unei anumite cantități. Cu cât valoarea varianței este mai aproape de zero, cu atât valorile sunt grupate mai aproape. Când lucrați cu un eșantion de valori, utilizați următoarea formulă pentru a calcula varianța:

    • s 2 (\displaystyle s^(2)) = ∑[(x i (\displaystyle x_(i))- X) 2 (\displaystyle ^(2))] / (n - 1)
    • s 2 (\displaystyle s^(2))– aceasta este dispersia. Dispersia se măsoară în unități pătrate.
    • x i (\displaystyle x_(i))– fiecare valoare din eșantion.
    • x i (\displaystyle x_(i)) trebuie să scădeți x̅, să-l pătrați și apoi să adăugați rezultatele.
    • x̅ – medie eșantion (medie eșantion).
    • n – numărul de valori din eșantion.
  3. Calculați media eșantionului. Este notat cu x̅. Media eșantionului este calculată ca medie aritmetică simplă: se adună toate valorile din eșantion, apoi se împarte rezultatul la numărul de valori din eșantion.

    • În exemplul nostru, adăugați valorile din eșantion: 15 + 17 + 23 + 7 + 9 + 13 = 84
      Acum împărțiți rezultatul la numărul de valori din eșantion (în exemplul nostru sunt 6): 84 ÷ 6 = 14.
      Media eșantionului x̅ = 14.
    • Media eșantionului este valoarea centrală în jurul căreia sunt distribuite valorile din eșantion. Dacă valorile din grupul de eșantion din jurul eșantionului sunt medii, atunci varianța este mică; în caz contrar, varianța este mare.
  4. Scădeți media eșantionului din fiecare valoare din eșantion. Acum calculează diferența x i (\displaystyle x_(i))- x̅, unde x i (\displaystyle x_(i))– fiecare valoare din eșantion. Fiecare rezultat obținut indică gradul de abatere al unei anumite valori de la media eșantionului, adică cât de departe este această valoare de media eșantionului.

    • În exemplul nostru:
      x 1 (\displaystyle x_(1))- x = 17 - 14 = 3
      x 2 (\displaystyle x_(2))- x̅ = 15 - 14 = 1
      x 3 (\displaystyle x_(3))- x = 23 - 14 = 9
      x 4 (\displaystyle x_(4))- x̅ = 7 - 14 = -7
      x 5 (\displaystyle x_(5))- x̅ = 9 - 14 = -5
      x 6 (\displaystyle x_(6))- x̅ = 13 - 14 = -1
    • Corectitudinea rezultatelor obținute este ușor de verificat, deoarece suma lor ar trebui să fie egală cu zero. Acest lucru este legat de determinarea valorii medii, deoarece valorile negative (distanțele de la valoarea medie la valori mai mici) sunt complet compensate valori pozitive(distanțele de la valori medii la mari).
  5. După cum sa menționat mai sus, suma diferențelor x i (\displaystyle x_(i))- x̅ trebuie să fie egal cu zero. Înseamnă că varianta medie este întotdeauna egal cu zero, ceea ce nu dă nicio idee despre răspândirea valorilor unei anumite cantități. Pentru a rezolva această problemă, pătrați fiecare diferență x i (\displaystyle x_(i))- X. Acest lucru va duce la obținerea doar a unor numere pozitive, care nu vor aduna niciodată până la 0.

    • În exemplul nostru:
      (x 1 (\displaystyle x_(1))- X) 2 = 3 2 = 9 (\displaystyle ^(2)=3^(2)=9)
      (x 2 (\displaystyle (x_(2)))- X) 2 = 1 2 = 1 (\displaystyle ^(2)=1^(2)=1)
      9 2 = 81
      (-7) 2 = 49
      (-5) 2 = 25
      (-1) 2 = 1
    • Ai găsit pătratul diferenței - x̅) 2 (\displaystyle ^(2)) pentru fiecare valoare din eșantion.
  6. Calculați suma pătratelor diferențelor. Adică, găsiți acea parte a formulei care este scrisă astfel: ∑[( x i (\displaystyle x_(i))- X) 2 (\displaystyle ^(2))]. Aici semnul Σ înseamnă suma diferențelor pătrate pentru fiecare valoare x i (\displaystyle x_(i))în probă. Ați găsit deja diferențele la pătrat (x i (\displaystyle (x_(i)))- X) 2 (\displaystyle ^(2)) pentru fiecare valoare x i (\displaystyle x_(i))în probă; acum doar adăugați aceste pătrate.

    • În exemplul nostru: 9 + 1 + 81 + 49 + 25 + 1 = 166 .
  7. Împărțiți rezultatul la n - 1, unde n este numărul de valori din eșantion. Cu ceva timp în urmă, pentru a calcula varianța eșantionului, statisticienii au împărțit pur și simplu rezultatul la n; în acest caz, veți obține media varianței pătrate, care este ideală pentru a descrie varianța unui eșantion dat. Dar amintiți-vă că orice eșantion este doar o mică parte din populația de valori. Dacă luați o altă probă și efectuați aceleași calcule, veți obține un rezultat diferit. După cum se dovedește, împărțirea la n - 1 (mai degrabă decât doar n) oferă o estimare mai precisă a varianței populației, care este ceea ce vă interesează. Împărțirea cu n – 1 a devenit obișnuită, deci este inclusă în formula pentru calcularea varianței eșantionului.

    • În exemplul nostru, eșantionul include 6 valori, adică n = 6.
      Varianta eșantionului = s 2 = 166 6 − 1 = (\displaystyle s^(2)=(\frac (166)(6-1))=) 33,2
  8. Diferența dintre varianță și abaterea standard. Rețineți că formula conține un exponent, astfel încât dispersia este măsurată în unități pătrate ale valorii analizate. Uneori, o astfel de mărime este destul de dificil de operat; în astfel de cazuri, utilizați abaterea standard, care este egală cu rădăcina pătrată a varianței. De aceea, varianța eșantionului se notează ca s 2 (\displaystyle s^(2)), A deviație standard mostre - cum s (\displaystyle s).

    • În exemplul nostru, abaterea standard a eșantionului este: s = √33,2 = 5,76.

    Calcularea variației populației

    1. Analizați un set de valori. Setul include toate valorile cantității luate în considerare. De exemplu, dacă studiezi vârsta rezidenților Regiunea Leningrad, atunci populația include vârstele tuturor locuitorilor acestei zone. Când lucrați cu o populație, se recomandă să creați un tabel și să introduceți valorile populației în el. Luați în considerare următorul exemplu:

      • Într-o anumită cameră sunt 6 acvarii. Fiecare acvariu conține următorul număr de pești:
        x 1 = 5 (\displaystyle x_(1)=5)
        x 2 = 5 (\displaystyle x_(2)=5)
        x 3 = 8 (\displaystyle x_(3)=8)
        x 4 = 12 (\displaystyle x_(4)=12)
        x 5 = 15 (\displaystyle x_(5)=15)
        x 6 = 18 (\displaystyle x_(6)=18)
    2. Scrieți o formulă pentru a calcula varianța populației.Întrucât totalitatea include toate valorile unei anumite cantități, formula de mai jos ne permite să obținem valoare exacta variaţiile populaţiei. Pentru a distinge varianța populației de varianța eșantionului (care este doar o estimare), statisticienii folosesc diverse variabile:

      • σ 2 (\displaystyle ^(2)) = (∑(x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2)))/n
      • σ 2 (\displaystyle ^(2))– dispersia populației (a se citi „sigma pătrat”). Dispersia se măsoară în unități pătrate.
      • x i (\displaystyle x_(i))– fiecare valoare în întregime.
      • Σ – semnul sumei. Adică din fiecare valoare x i (\displaystyle x_(i)) trebuie să scădeți μ, să-l pătrați și apoi să adăugați rezultatele.
      • μ – media populației.
      • n – numărul de valori din populație.
    3. Calculați media populației. Când se lucrează cu o populație, media ei este notată ca μ (mu). Media populației este calculată ca medie aritmetică simplă: se adună toate valorile din populație și apoi se împarte rezultatul la numărul de valori din populație.

      • Rețineți că mediile nu sunt întotdeauna calculate ca medie aritmetică.
      • În exemplul nostru, media populației: μ = 5 + 5 + 8 + 12 + 15 + 18 6 (\displaystyle (\frac (5+5+8+12+15+18)(6))) = 10,5
    4. Scădeți media populației din fiecare valoare din populație. Cu cât diferența este mai aproape de zero, cu atât mai aproape sens specific la media populaţiei. Găsiți diferența dintre fiecare valoare din populație și media acesteia și vă veți face o primă idee despre distribuția valorilor.

      • În exemplul nostru:
        x 1 (\displaystyle x_(1))- μ = 5 - 10,5 = -5,5
        x 2 (\displaystyle x_(2))- μ = 5 - 10,5 = -5,5
        x 3 (\displaystyle x_(3))- μ = 8 - 10,5 = -2,5
        x 4 (\displaystyle x_(4))- μ = 12 - 10,5 = 1,5
        x 5 (\displaystyle x_(5))- μ = 15 - 10,5 = 4,5
        x 6 (\displaystyle x_(6))- μ = 18 - 10,5 = 7,5
    5. Patratează fiecare rezultat obținut. Valorile diferențelor vor fi atât pozitive, cât și negative; Dacă aceste valori sunt reprezentate pe o linie numerică, ele se vor afla la dreapta și la stânga mediei populației. Acest lucru nu este bun pentru calcularea varianței, deoarece numerele pozitive și negative se anulează reciproc. Deci pătrați fiecare diferență pentru a obține numere exclusiv pozitive.

      • În exemplul nostru:
        (x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2)) pentru fiecare valoare a populației (de la i = 1 la i = 6):
        (-5,5)2 (\displaystyle ^(2)) = 30,25
        (-5,5)2 (\displaystyle ^(2)), Unde x n (\displaystyle x_(n))– ultima valoare din populatie.
      • Pentru a calcula valoarea medie a rezultatelor obținute, trebuie să găsiți suma lor și să o împărțiți la n:(( x 1 (\displaystyle x_(1)) - μ) 2 (\displaystyle ^(2)) + (x 2 (\displaystyle x_(2)) - μ) 2 (\displaystyle ^(2)) + ... + (x n (\displaystyle x_(n)) - μ) 2 (\displaystyle ^(2)))/n
      • Acum să scriem explicația de mai sus folosind variabile: (∑( x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2))) / n și obțineți o formulă pentru calcularea varianței populației.
Pentru date grupate varianta reziduala- media variațiilor intragrup:

Unde σ 2 j este varianța intragrup a grupului j.

Pentru date negrupate varianta reziduala– măsura acurateței aproximării, adică aproximarea dreptei de regresie la datele originale:
unde y(t) – prognoză conform ecuației tendinței; y t – serie de dinamică inițială; n – numărul de puncte; p – numărul de coeficienți ai ecuației de regresie (număr de variabile explicative).
În acest exemplu se numește estimator de varianță imparțial.

Exemplul nr. 1. Repartizarea lucrătorilor a trei întreprinderi ale unei asociații pe categorii tarifare se caracterizează prin următoarele date:

Categoria tarifară a lucrătoruluiNumărul de lucrători la întreprindere
intreprindere 1intreprindere 2intreprindere 3
1 50 20 40
2 100 80 60
3 150 150 200
4 350 300 400
5 200 150 250
6 150 100 150

Defini:
1. varianță pentru fiecare întreprindere (varianțe intra-grup);
2. media variațiilor în interiorul grupului;
3. dispersie intergrup;
4. varianta totala.

Soluţie.
Înainte de a începe să rezolvați problema, este necesar să aflați care caracteristică este eficientă și care este factorială. În exemplul luat în considerare, atributul rezultat este „Categoria tarifară”, iar atributul factor este „Numărul (numele) întreprinderii”.
Apoi avem trei grupuri (întreprinderi), pentru care este necesar să se calculeze media grupului și variațiile intragrup:


CompanieMedia grupului,Varianta în cadrul grupului,
1 4 1,8

Media variațiilor în interiorul grupului ( varianta reziduala) se va calcula folosind formula:


unde poti calcula:
sau:


Apoi:
Varianta totala va fi egala cu: s 2 = 1,6 + 0 = 1,6.
De asemenea, variația totală poate fi calculată folosind una dintre următoarele două formule:

Când rezolvăm probleme practice, de multe ori trebuie să te confrunți cu o caracteristică care ia doar două valori alternative. În acest caz, nu vorbim despre ponderea unei anumite valori a unei caracteristici, ci despre ponderea acesteia în totalitate. Dacă proporția unităților de populație care posedă caracteristica studiată se notează cu „ R", iar cei care nu au - prin " q", atunci varianța poate fi calculată folosind formula:
s 2 = p×q

Exemplul nr. 2. Pe baza datelor privind producția a șase echipe de lucru, determinați varianța intergrup și evaluați influența tura de muncă asupra productivității muncii lor dacă varianța totală este de 12,2.

Lucrator in echipa nr.Ieșire muncitor, buc.
în primul schimbîn al doilea schimb
1 18 13
2 19 14
3 22 15
4 20 17
5 24 16
6 23 15

Soluţie. Datele inițiale

Xf 1f 2f 3f 4f 5f 6Total
1 18 19 22 20 24 23 126
2 13 14 15 17 16 15 90
Total 31 33 37 37 40 38

Apoi avem 6 grupuri pentru care este necesar să se calculeze media grupului și variațiile intragrup.
1. Găsiți valorile medii ale fiecărui grup.







2. Aflați pătratul mediu al fiecărui grup.







Să rezumăm rezultatele calculului într-un tabel:
Număr de grupMedia grupuluiVarianta în cadrul grupului
1 1.42 0.24
2 1.42 0.24
3 1.41 0.24
4 1.46 0.25
5 1.4 0.24
6 1.39 0.24

3. Varianta în cadrul grupului caracterizează modificarea (variația) caracteristicii studiate (rezultate) în cadrul unui grup sub influența tuturor factorilor asupra acestuia, cu excepția factorului care stă la baza grupării:
Media variațiilor intragrup va fi calculată folosind formula:


4. Varianta intergrup caracterizează modificarea (variaţia) caracteristicii (rezultative) studiate sub influenţa unui factor (caracteristică factorială) care formează baza grupului.
Definim varianța intergrup ca fiind:

Unde


Apoi

Varianta totala caracterizează schimbarea (variația) caracteristicii (rezultate) studiate sub influența tuturor factorilor (caracteristicile factoriale) fără excepție. În funcție de condițiile problemei, este egal cu 12,2.
Relație de corelație empirică măsoară ce parte din variabilitatea totală a caracteristicii rezultate este cauzată de factorul studiat. Acesta este raportul dintre varianța factorilor și varianța totală:

Definim relația de corelație empirică:

Conexiunile dintre caracteristici pot fi slabe și puternice (strânse). Criteriile lor sunt evaluate pe scara Chaddock:
0,1 0,3 0,5 0,7 0,9 În exemplul nostru, relația dintre trăsătura Y și factorul X este slabă
Coeficient de determinare.

Să determinăm coeficientul de determinare:

Astfel, 0,67% din variație se datorează diferențelor dintre trăsături, iar 99,37% se datorează altor factori.
Concluzie: în acest caz, producția lucrătorilor nu depinde de munca pe o anumită tură, adică influenţa schimbului de muncă asupra productivităţii muncii lor nu este semnificativă şi se datorează altor factori.

Exemplul nr. 3. Bazat pe medie salariileși abaterile pătrate de la valoarea sa pentru două grupuri de lucrători, găsiți varianța totală prin aplicarea regulii de adunare a variațiilor:

Soluţie:
Media variațiilor în cadrul grupului

Definim varianța intergrup ca fiind:


Varianta totală va fi: 480 + 13824 = 14304

Teoria probabilității este o ramură specială a matematicii care este studiată numai de studenții instituțiilor de învățământ superior. Îți plac calculele și formulele? Nu vă sperie perspectivele de a vă familiariza cu distribuția normală, entropia ansamblului, așteptările matematice și dispersia unei variabile aleatoare discrete? Atunci acest subiect va fi foarte interesant pentru tine. Să aruncăm o privire la câteva dintre cele mai importante Noțiuni de bază această ramură a științei.

Să ne amintim elementele de bază

Chiar dacă vă amintiți cele mai simple concepte ale teoriei probabilităților, nu neglijați primele paragrafe ale articolului. Ideea este că, fără o înțelegere clară a elementelor de bază, nu veți putea lucra cu formulele discutate mai jos.

Deci, are loc un eveniment aleatoriu, un experiment. Ca urmare a acțiunilor pe care le întreprindem, putem obține mai multe rezultate - unele dintre ele apar mai des, altele mai rar. Probabilitatea unui eveniment este raportul dintre numărul de rezultate efectiv obținute de un tip la numărul total posibil. Numai cunoscând definiția clasică a acestui concept poți începe să studiezi așteptări matematiceși variațiile variabilelor aleatoare continue.

In medie

Înapoi la școală, în timpul orelor de matematică, ai început să lucrezi cu media aritmetică. Acest concept este utilizat pe scară largă în teoria probabilității și, prin urmare, nu poate fi ignorat. Principalul lucru pentru noi este acest moment este că o vom întâlni în formulele pentru așteptarea și dispersia matematică a unei variabile aleatoare.

Avem o succesiune de numere și vrem să aflăm media aritmetică. Tot ceea ce ni se cere este să însumăm tot ce este disponibil și să împărțim la numărul de elemente din secvență. Să avem numere de la 1 la 9. Suma elementelor va fi egală cu 45, iar această valoare o vom împărți la 9. Răspuns: - 5.

Dispersia

În termeni științifici, dispersia este pătratul mediu al abaterilor valorilor obținute ale unei caracteristici de la media aritmetică. Este notat cu o literă latină majusculă D. Ce este necesar pentru a o calcula? Pentru fiecare element al șirului, calculăm diferența dintre numărul existent și media aritmetică și o pătratăm. Vor exista exact atâtea valori câte rezultate pot exista pentru evenimentul pe care îl luăm în considerare. În continuare, însumăm tot ceea ce a primit și împărțim la numărul de elemente din succesiune. Dacă avem cinci rezultate posibile, atunci împărțiți la cinci.

Dispersia are, de asemenea, proprietăți care trebuie reținute pentru a fi utilizate la rezolvarea problemelor. De exemplu, când crește o variabilă aleatoare de X ori, varianța crește de X ori la pătrat (adică X*X). Ea nu se întâmplă niciodată mai putin de zeroși nu depinde de deplasarea valorilor cu o valoare egală în sus sau în jos. În plus, pentru încercările independente, varianța sumei este egală cu suma variațiilor.

Acum trebuie să luăm în considerare exemple de varianță a unei variabile aleatoare discrete și așteptările matematice.

Să presupunem că am efectuat 21 de experimente și am obținut 7 rezultate diferite. Am observat fiecare dintre ele de 1, 2, 2, 3, 4, 4 și, respectiv, de 5 ori. Cu ce ​​va fi egală varianța?

Mai întâi, să calculăm media aritmetică: suma elementelor, desigur, este 21. Împărțiți-o la 7, obținând 3. Acum scădeți 3 din fiecare număr din succesiunea originală, pătrați fiecare valoare și adăugați rezultatele împreună. Rezultatul este 12. Acum tot ce trebuie să facem este să împărțim numărul la numărul de elemente și, s-ar părea, atât. Dar există o captură! Să discutăm.

Dependența de numărul de experimente

Se pare că atunci când se calculează varianța, numitorul poate conține unul dintre cele două numere: fie N, fie N-1. Aici N este numărul de experimente efectuate sau numărul de elemente din secvență (care este în esență același lucru). De ce depinde asta?

Dacă numărul de teste este măsurat în sute, atunci trebuie să punem la numitor N. Dacă este în unități, atunci N-1. Oamenii de știință au decis să deseneze granița în mod destul de simbolic: astăzi trece prin numărul 30. Dacă am efectuat mai puțin de 30 de experimente, atunci vom împărți cantitatea cu N-1, iar dacă mai mult, atunci cu N.

Sarcină

Să revenim la exemplul nostru de rezolvare a problemei varianței și așteptărilor matematice. Am primit un număr intermediar 12, care trebuia împărțit la N sau N-1. Deoarece am efectuat 21 de experimente, adică mai puțin de 30, vom alege a doua opțiune. Deci răspunsul este: varianța este 12 / 2 = 2.

Valorea estimata

Să trecem la al doilea concept, pe care trebuie să îl luăm în considerare în acest articol. Așteptarea matematică este rezultatul adunării tuturor rezultatelor posibile înmulțite cu probabilitățile corespunzătoare. Este important de înțeles că valoarea obținută, precum și rezultatul calculării varianței, se obține o singură dată pentru întreaga problemă, indiferent de câte rezultate sunt luate în considerare în ea.

Formula pentru așteptarea matematică este destul de simplă: luăm rezultatul, îl înmulțim cu probabilitatea lui, adăugăm același lucru pentru al doilea, al treilea rezultat etc. Tot ce este legat de acest concept nu este greu de calculat. De exemplu, suma valorilor așteptate este egală cu valoarea așteptată a sumei. Același lucru este valabil și pentru lucrare. Nu orice cantitate din teoria probabilității vă permite să efectuați astfel de operații simple. Să luăm problema și să calculăm semnificația a două concepte pe care le-am studiat deodată. În plus, am fost distrași de teorie – este timpul să exersăm.

Încă un exemplu

Am efectuat 50 de studii și am obținut 10 tipuri de rezultate - numere de la 0 la 9 - care apar în procente diferite. Acestea sunt, respectiv: 2%, 10%, 4%, 14%, 2%,18%, 6%, 16%, 10%, 18%. Amintiți-vă că pentru a obține probabilități, trebuie să împărțiți valorile procentuale la 100. Astfel, obținem 0,02; 0,1 etc. Să prezentăm un exemplu de rezolvare a problemei pentru varianța unei variabile aleatoare și așteptarea matematică.

Calculăm media aritmetică folosind formula din care ne amintim scoala generala: 50/10 = 5.

Acum să convertim probabilitățile în numărul de rezultate „pe bucăți” pentru a fi mai ușor de numărat. Se obține 1, 5, 2, 7, 1, 9, 3, 8, 5 și 9. Din fiecare valoare obținută scădem media aritmetică, după care punem la pătrat fiecare dintre rezultatele obținute. Vedeți cum să faceți acest lucru folosind primul element ca exemplu: 1 - 5 = (-4). În continuare: (-4) * (-4) = 16. Pentru alte valori, faceți singur aceste operații. Dacă ați făcut totul corect, atunci după ce le-ați adunat pe toate, veți obține 90.

Să continuăm să calculăm varianța și valoarea așteptată împărțind 90 la N. De ce alegem N mai degrabă decât N-1? Corect, deoarece numărul de experimente efectuate depășește 30. Deci: 90/10 = 9. Am obținut varianța. Dacă primești un alt număr, nu dispera. Cel mai probabil, ai făcut o greșeală simplă în calcule. Verificați din nou ceea ce ați scris și probabil totul va fi la locul său.

În cele din urmă, amintiți-vă formula pentru așteptările matematice. Nu vom da toate calculele, vom scrie doar un răspuns pe care îl puteți verifica după finalizarea tuturor procedurilor necesare. Valoarea așteptată va fi 5,48. Să ne amintim doar cum să efectuăm operațiuni, folosind primele elemente ca exemplu: 0*0,02 + 1*0,1... și așa mai departe. După cum puteți vedea, pur și simplu înmulțim valoarea rezultatului cu probabilitatea acestuia.

Deviere

Un alt concept strâns legat de dispersie și așteptările matematice este deviația standard. Se notează fie prin literele latine sd, fie prin literele grecești „sigma”. Acest concept arată cât de mult se abate, în medie, valorile de la caracteristica centrală. Pentru a-i găsi valoarea, trebuie să calculați Rădăcină pătrată din dispersie.

Dacă trasați un grafic de distribuție normală și doriți să vedeți abaterea pătratului direct pe acesta, acest lucru se poate face în mai multe etape. Luați jumătate din imagine la stânga sau la dreapta modului (valoarea centrală), trageți o perpendiculară pe axa orizontală, astfel încât zonele figurilor rezultate să fie egale. Mărimea segmentului dintre mijlocul distribuției și proiecția rezultată pe axa orizontală va reprezenta abaterea standard.

Software

După cum se poate observa din descrierile formulelor și exemplele prezentate, calcularea varianței și a așteptărilor matematice nu este cea mai simplă procedură din punct de vedere aritmetic. Pentru a nu pierde timpul, are sens să folosești programul folosit în învățământul superior institutii de invatamant- se numește „R”. Are funcții care vă permit să calculați valori pentru multe concepte din statistică și teoria probabilității.

De exemplu, specificați un vector de valori. Aceasta se face astfel: vector<-c(1,5,2…). Теперь, когда вам потребуется посчитать какие-либо значения для этого вектора, вы пишете функцию и задаете его в качестве аргумента. Для нахождения дисперсии вам нужно будет использовать функцию var. Пример её использования: var(vector). Далее вы просто нажимаете «ввод» и получаете результат.

In cele din urma

Dispersia și așteptările matematice sunt fără de care este dificil să calculezi ceva în viitor. În cursul principal al prelegerilor la universități, acestea sunt discutate deja în primele luni de studiu a subiectului. Tocmai din cauza lipsei de înțelegere a acestor concepte simple și a incapacității de a le calcula, mulți studenți încep imediat să rămână în urmă în program și ulterior primesc note proaste la sfârșitul sesiunii, ceea ce îi privează de burse.

Exersează cel puțin o săptămână, o jumătate de oră pe zi, rezolvând sarcini similare cu cele prezentate în acest articol. Apoi, la orice test de teoria probabilităților, veți putea face față exemplelor fără sfaturi străine și cheat sheets.

Dispersia în statistici este definită ca abaterea standard a valorilor individuale ale unei caracteristici la pătrat de la media aritmetică. O metodă comună pentru calcularea abaterilor pătrate ale opțiunilor de la medie și apoi media lor.

În analiza statistică economică, se obișnuiește să se evalueze variația unei caracteristici folosind cel mai adesea abaterea standard; aceasta este rădăcina pătrată a varianței.

(3)

Caracterizează fluctuația absolută a valorilor unei caracteristici diferite și este exprimată în aceleași unități de măsură ca și opțiunile. În statistici, este adesea nevoie de a compara variația diferitelor caracteristici. Pentru astfel de comparații, se utilizează o măsură relativă a variației, coeficientul de variație.

Proprietăți de dispersie:

1) dacă scădeți orice număr din toate opțiunile, atunci varianța nu se va schimba;

2) dacă toate valorile opțiunii sunt împărțite la orice număr b, atunci varianța va scădea de b^2 ori, adică.

3) dacă calculați pătratul mediu al abaterilor de la orice număr cu o medie aritmetică inegală, atunci acesta va fi mai mare decât varianța. În același timp, printr-o valoare bine definită pe pătrat a diferenței dintre valoarea medie c.

Dispersia poate fi definită ca diferența dintre pătratul mediu și pătratul mediu.

17. Variații de grup și intergrup. Regula de adunare a variațiilor

Dacă o populație statistică este împărțită în grupuri sau părți în funcție de caracteristica studiată, atunci pentru o astfel de populație pot fi calculate următoarele tipuri de dispersie: grup (privat), media grup (privat) și intergrup.

Varianta totala– reflectă variaţia unei caracteristici datorită tuturor condiţiilor şi cauzelor care operează într-o populaţie statistică dată.

Varianta de grup- egal cu pătratul mediu al abaterilor valorilor individuale ale unei caracteristici din cadrul unui grup de la media aritmetică a acestui grup, numită media grupului. Cu toate acestea, media grupului nu coincide cu media generală pentru întreaga populație.

Varianta de grup reflectă variația unei trăsături numai datorită condițiilor și cauzelor care operează în cadrul grupului.

Media variațiilor de grup- este definită ca media aritmetică ponderată a variațiilor grupului, ponderile fiind volumele grupului.

Varianta intergrup- egal cu pătratul mediu al abaterilor mediilor grupului de la media generală.

Dispersia intergrupurilor caracterizează variația caracteristicii rezultate datorită caracteristicii de grupare.

Există o anumită relație între tipurile de dispersii luate în considerare: dispersia totală este egală cu suma dispersiei medii de grup și intergrup.

Această relație se numește regula de adunare a varianței.

18. Seria dinamică și componentele sale. Tipuri de serii temporale.

Rând în statistici- este vorba de date digitale care arată schimbarea unui fenomen în timp sau spațiu și face posibilă realizarea unei comparații statistice a fenomenelor atât în ​​procesul de dezvoltare a acestora în timp, cât și în diferite forme și tipuri de procese. Datorită acestui fapt, este posibilă detectarea dependenței reciproce a fenomenelor.

În statistică, procesul de dezvoltare a mișcării fenomenelor sociale în timp se numește de obicei dinamică. Pentru a afișa dinamica, se construiesc serii de dinamică (cronologică, de timp), care sunt serii de valori variabile în timp ale unui indicator statistic (de exemplu, numărul de persoane condamnate peste 10 ani), aranjate în ordine cronologică. Elementele lor constitutive sunt valorile digitale ale unui indicator dat și perioadele sau momentele de timp la care se referă.

Cea mai importantă caracteristică a seriei dinamice- mărimea lor (volum, mărime) a unui anumit fenomen realizat într-o anumită perioadă sau într-un anumit moment. În consecință, mărimea termenilor seriei dinamice este nivelul acesteia. Distinge nivelurile inițiale, mijlocii și finale ale seriei dinamice. Primul nivel arată valoarea primului, final - valoarea ultimului termen al seriei. Nivel mediu reprezintă intervalul mediu de variație cronologică și se calculează în funcție de faptul că seria dinamică este interval sau momentan.

O altă caracteristică importantă a seriei dinamice- timpul scurs de la observația inițială până la cea finală, sau numărul de astfel de observații.

Există diferite tipuri de serii temporale; acestea pot fi clasificate după următoarele criterii.

1) În funcție de modalitatea de exprimare a nivelurilor, seriile de dinamică se împart în serii de indicatori absoluti și derivați (valori relative și medii).

2) În funcție de modul în care nivelurile seriei exprimă starea fenomenului în anumite momente în timp (la începutul lunii, trimestrului, anului etc.) sau valoarea acestuia pe anumite intervale de timp (de exemplu, pe zi, lună, an etc.) etc.), distingeți între serii dinamice de moment și, respectiv, interval. Serii de momente sunt folosite relativ rar în activitatea analitică a agențiilor de aplicare a legii.

În teoria statistică, dinamica se distinge după o serie de alte criterii de clasificare: în funcție de distanța dintre niveluri - cu niveluri egale și nivele inegale în timp; în funcţie de prezenţa tendinţei principale a procesului studiat – staţionar şi non-staţionar. Atunci când se analizează seriile de timp, acestea pornesc de la următoarele; nivelurile seriei sunt prezentate sub formă de componente:

Y t = TP + E (t)

unde TP este o componentă deterministă care determină tendința generală de schimbare în timp sau tendință.

E (t) este o componentă aleatorie care provoacă fluctuații ale nivelurilor.

Așteptările și varianța sunt caracteristicile numerice cele mai frecvent utilizate ale unei variabile aleatorii. Ele caracterizează cele mai importante trăsături ale distribuției: poziția și gradul de împrăștiere a acesteia. În multe probleme practice, o caracteristică completă, exhaustivă a unei variabile aleatoare - legea distribuției - fie nu poate fi obținută deloc, fie nu este deloc necesară. În aceste cazuri, se limitează la o descriere aproximativă a unei variabile aleatorii folosind caracteristici numerice.

Valoarea așteptată este adesea numită pur și simplu valoarea medie a unei variabile aleatorii. Dispersia unei variabile aleatoare este o caracteristică a dispersiei, răspândirea unei variabile aleatoare în jurul așteptărilor sale matematice.

Așteptarea unei variabile aleatoare discrete

Să abordăm conceptul de așteptare matematică, mai întâi pe baza interpretării mecanice a distribuției unei variabile aleatoare discrete. Fie ca unitatea de masă să fie distribuită între punctele axei x X1 , X 2 , ..., X n, iar fiecare punct material are o masă corespunzătoare de p1 , p 2 , ..., p n. Este necesar să se selecteze un punct pe axa absciselor, care să caracterizeze poziția întregului sistem de puncte materiale, ținând cont de masele acestora. Este firesc să luăm ca un astfel de punct centrul de masă al sistemului de puncte materiale. Aceasta este media ponderată a variabilei aleatoare X, la care abscisa fiecărui punct Xi intră cu o „pondere” egală cu probabilitatea corespunzătoare. Valoarea medie a variabilei aleatoare obţinută în acest fel X se numește așteptarea sa matematică.

Așteptările matematice ale unei variabile aleatoare discrete este suma produselor tuturor valorilor sale posibile și probabilitățile acestor valori:

Exemplul 1. A fost organizată o loterie win-win. Există 1000 de câștiguri, dintre care 400 sunt 10 ruble. 300 - 20 de ruble fiecare. 200 - 100 de ruble fiecare. și 100 - 200 de ruble fiecare. Care este câștigul mediu pentru cineva care cumpără un bilet?

Soluţie. Vom găsi câștigurile medii dacă împărțim suma totală a câștigurilor, care este 10*400 + 20*300 + 100*200 + 200*100 = 50.000 de ruble, la 1000 (valoarea totală a câștigurilor). Apoi obținem 50000/1000 = 50 de ruble. Dar expresia pentru calcularea câștigurilor medii poate fi prezentată în următoarea formă:

Pe de altă parte, în aceste condiții, suma câștigată este o variabilă aleatorie, care poate lua valori de 10, 20, 100 și 200 de ruble. cu probabilități egale cu 0,4, respectiv; 0,3; 0,2; 0,1. Prin urmare, câștigul mediu așteptat este egal cu suma produselor mărimii câștigurilor și a probabilității de a le primi.

Exemplul 2. Editura a decis să publice o nouă carte. El plănuiește să vândă cartea cu 280 de ruble, din care el însuși va primi 200, 50 - librăria și 30 - autorul. Tabelul oferă informații despre costurile publicării unei cărți și probabilitatea de a vinde un anumit număr de exemplare ale cărții.

Găsiți profitul așteptat al editorului.

Soluţie. Variabila aleatoare „profit” este egală cu diferența dintre venitul din vânzări și costul costurilor. De exemplu, dacă se vând 500 de exemplare ale unei cărți, atunci venitul din vânzare este de 200 * 500 = 100.000, iar costul publicării este de 225.000 de ruble. Astfel, editorul se confruntă cu o pierdere de 125.000 de ruble. Următorul tabel rezumă valorile așteptate ale variabilei aleatoare - profit:

NumărProfit Xi Probabilitate pi Xi p i
500 -125000 0,20 -25000
1000 -50000 0,40 -20000
2000 100000 0,25 25000
3000 250000 0,10 25000
4000 400000 0,05 20000
Total: 1,00 25000

Astfel, obținem așteptarea matematică a profitului editorului:

.

Exemplul 3. Probabilitatea de a lovi cu o lovitură p= 0,2. Determinați consumul de proiectile care oferă o așteptare matematică a numărului de lovituri egal cu 5.

Soluţie. Din aceeași formulă de așteptare matematică pe care am folosit-o până acum, ne exprimăm X- consumul de coajă:

.

Exemplul 4. Determinați așteptările matematice ale unei variabile aleatorii X numărul de lovituri cu trei lovituri, dacă probabilitatea unei lovituri la fiecare lovitură p = 0,4 .

Sugestie: găsiți probabilitatea de valori ale variabilelor aleatoare prin formula lui Bernoulli .

Proprietățile așteptărilor matematice

Să luăm în considerare proprietățile așteptărilor matematice.

Proprietatea 1. Așteptarea matematică a unei constante este egală cu această constantă:

Proprietatea 2. Factorul constant poate fi scos din semnul așteptării matematice:

Proprietatea 3. Așteptările matematice ale sumei (diferenței) variabilelor aleatoare sunt egale cu suma (diferenței) așteptărilor lor matematice:

Proprietatea 4. Așteptările matematice ale unui produs de variabile aleatoare sunt egale cu produsul așteptărilor lor matematice:

Proprietatea 5. Dacă toate valorile unei variabile aleatoare X scade (creste) cu acelasi numar CU, atunci așteptarea sa matematică va scădea (crește) cu același număr:

Când nu te poți limita doar la așteptări matematice

În cele mai multe cazuri, doar așteptarea matematică nu poate caracteriza suficient o variabilă aleatoare.

Lasă variabilele aleatoare XȘi Y sunt date de următoarele legi de distribuție:

Sens X Probabilitate
-0,1 0,1
-0,01 0,2
0 0,4
0,01 0,2
0,1 0,1
Sens Y Probabilitate
-20 0,3
-10 0,1
0 0,2
10 0,1
20 0,3

Așteptările matematice ale acestor mărimi sunt aceleași - egale cu zero:

Cu toate acestea, modelele lor de distribuție sunt diferite. Valoare aleatoare X poate lua doar valori care diferă puțin de așteptările matematice și de variabila aleatoare Y poate lua valori care se abat semnificativ de la așteptările matematice. Un exemplu asemănător: salariul mediu nu face posibilă judecarea ponderii lucrătorilor cu plăți mari și slabe. Cu alte cuvinte, nu se poate judeca din așteptarea matematică ce abateri de la ea, cel puțin în medie, sunt posibile. Pentru a face acest lucru, trebuie să găsiți varianța variabilei aleatoare.

Varianta unei variabile aleatoare discrete

Varianta variabilă aleatoare discretă X se numește așteptarea matematică a pătratului abaterii sale de la așteptarea matematică:

Abaterea standard a unei variabile aleatoare X valoarea aritmetică a rădăcinii pătrate a varianței sale se numește:

.

Exemplul 5. Calculați variațiile și abaterile standard ale variabilelor aleatoare XȘi Y, ale căror legi de distribuție sunt date în tabelele de mai sus.

Soluţie. Așteptări matematice ale variabilelor aleatoare XȘi Y, așa cum a fost găsit mai sus, sunt egale cu zero. Conform formulei de dispersie la E(X)=E(y)=0 obținem:

Apoi abaterile standard ale variabilelor aleatoare XȘi Y inventa

.

Astfel, cu aceleași așteptări matematice, varianța variabilei aleatoare X foarte mic, dar o variabilă aleatorie Y- semnificativă. Aceasta este o consecință a diferențelor în distribuția lor.

Exemplul 6. Investitorul are 4 proiecte alternative de investiții. Tabelul rezumă profitul așteptat în aceste proiecte cu probabilitatea corespunzătoare.

Proiectul 1Proiectul 2Proiectul 3Proiectul 4
500, P=1 1000, P=0,5 500, P=0,5 500, P=0,5
0, P=0,5 1000, P=0,25 10500, P=0,25
0, P=0,25 9500, P=0,25

Găsiți așteptările matematice, varianța și abaterea standard pentru fiecare alternativă.

Soluţie. Să arătăm cum se calculează aceste valori pentru a treia alternativă:

Tabelul rezumă valorile găsite pentru toate alternativele.

Toate alternativele au aceleași așteptări matematice. Asta înseamnă că, pe termen lung, toată lumea are același venit. Abaterea standard poate fi interpretată ca o măsură a riscului - cu cât este mai mare, cu atât este mai mare riscul investiției. Un investitor care nu dorește mult risc va alege proiectul 1, deoarece are cea mai mică abatere standard (0). Dacă investitorul preferă riscul și randamentele mari într-o perioadă scurtă, atunci va alege proiectul cu cea mai mare abatere standard - proiectul 4.

Proprietăți de dispersie

Să prezentăm proprietățile dispersiei.

Proprietatea 1. Varianta unei valori constante este zero:

Proprietatea 2. Factorul constant poate fi scos din semnul de dispersie prin pătratul:

.

Proprietatea 3. Varianta unei variabile aleatoare este egală cu așteptarea matematică a pătratului acestei valori, din care se scade pătratul așteptării matematice a valorii în sine:

,

Unde .

Proprietatea 4. Varianta sumei (diferenței) variabilelor aleatoare este egală cu suma (diferenței) varianțelor acestora:

Exemplul 7. Se știe că o variabilă aleatoare discretă X ia doar două valori: −3 și 7. În plus, așteptarea matematică este cunoscută: E(X) = 4 . Aflați varianța unei variabile aleatoare discrete.

Soluţie. Să notăm prin p probabilitatea cu care o variabilă aleatoare ia o valoare X1 = −3 . Apoi probabilitatea valorii X2 = 7 va fi 1 − p. Să derivăm ecuația pentru așteptarea matematică:

E(X) = X 1 p + X 2 (1 − p) = −3p + 7(1 − p) = 4 ,

de unde obținem probabilitățile: p= 0,3 și 1 − p = 0,7 .

Legea distribuției unei variabile aleatoare:

X −3 7
p 0,3 0,7

Calculăm varianța acestei variabile aleatoare folosind formula de la proprietatea 3 a dispersiei:

D(X) = 2,7 + 34,3 − 16 = 21 .

Găsiți singur așteptările matematice ale unei variabile aleatoare și apoi uitați-vă la soluție

Exemplul 8. Variabilă aleatorie discretă X ia doar două valori. Acceptă cea mai mare dintre valorile 3 cu probabilitatea 0,4. În plus, este cunoscută varianța variabilei aleatoare D(X) = 6 . Aflați așteptările matematice ale unei variabile aleatoare.

Exemplul 9.Într-o urnă sunt 6 bile albe și 4 negre. Din urnă se extrag 3 bile. Numărul de bile albe dintre bilele extrase este o variabilă aleatorie discretă X. Găsiți așteptările matematice și varianța acestei variabile aleatoare.

Soluţie. Valoare aleatoare X poate lua valori 0, 1, 2, 3. Probabilitățile corespunzătoare pot fi calculate din regula înmulțirii probabilităților. Legea distribuției unei variabile aleatoare:

X 0 1 2 3
p 1/30 3/10 1/2 1/6

De aici așteptările matematice ale acestei variabile aleatoare:

M(X) = 3/10 + 1 + 1/2 = 1,8 .

Varianta unei variabile aleatoare date este:

D(X) = 0,3 + 2 + 1,5 − 3,24 = 0,56 .

Așteptarea și varianța unei variabile aleatoare continue

Pentru o variabilă aleatoare continuă, interpretarea mecanică a așteptării matematice va păstra același sens: centrul de masă pentru o unitate de masă distribuită continuu pe axa x cu densitate. f(X). Spre deosebire de o variabilă aleatoare discretă, al cărei argument al funcției Xi se schimbă brusc; pentru o variabilă aleatoare continuă, argumentul se schimbă continuu. Dar așteptarea matematică a unei variabile aleatoare continue este, de asemenea, legată de valoarea medie a acesteia.

Pentru a găsi așteptările matematice și varianța unei variabile aleatoare continue, trebuie să găsiți integrale definite . Dacă este dată funcția de densitate a unei variabile aleatoare continue, atunci aceasta intră direct în integrand. Dacă este dată o funcție de distribuție a probabilității, atunci prin diferențierea acesteia, trebuie să găsiți funcția de densitate.

Media aritmetică a tuturor valorilor posibile ale unei variabile aleatoare continue se numește ea așteptări matematice, notat cu sau .