Teoria probabilității este o ramură specială a matematicii care este studiată numai de studenții instituțiilor de învățământ superior. Îți plac calculele și formulele? Nu vă este frică de perspectivele de a vă familiariza cu distribuția normală, entropia ansamblului, așteptările matematice și dispersia discretă variabilă aleatorie? Atunci acest subiect va fi foarte interesant pentru tine. Să aruncăm o privire la câteva dintre cele mai importante Noțiuni de bază această ramură a științei.

Să ne amintim elementele de bază

Chiar dacă vă amintiți cele mai simple concepte ale teoriei probabilităților, nu neglijați primele paragrafe ale articolului. Ideea este că, fără o înțelegere clară a elementelor de bază, nu veți putea lucra cu formulele discutate mai jos.

Deci, are loc un eveniment aleatoriu, un experiment. Ca urmare a acțiunilor pe care le întreprindem, putem obține mai multe rezultate - unele dintre ele apar mai des, altele mai rar. Probabilitatea unui eveniment este raportul dintre numărul de rezultate efectiv obținute de un tip la numărul total posibil. Numai cunoscând definiția clasică a acestui concept poți începe să studiezi așteptări matematiceși variațiile variabilelor aleatoare continue.

In medie

Înapoi la școală, în timpul orelor de matematică, ai început să lucrezi cu media aritmetică. Acest concept este utilizat pe scară largă în teoria probabilității și, prin urmare, nu poate fi ignorat. Principalul lucru pentru noi este acest moment este că o vom întâlni în formulele pentru așteptarea și dispersia matematică a unei variabile aleatoare.

Avem o succesiune de numere și vrem să aflăm media aritmetică. Tot ceea ce ni se cere este să însumăm tot ce este disponibil și să împărțim la numărul de elemente din secvență. Să avem numere de la 1 la 9. Suma elementelor va fi egală cu 45, iar această valoare o vom împărți la 9. Răspuns: - 5.

Dispersia

În termeni științifici, dispersia este pătratul mediu al abaterilor valorilor obținute ale unei caracteristici de la media aritmetică. Este notat cu o literă latină majusculă D. Ce este necesar pentru a o calcula? Pentru fiecare element al șirului, calculăm diferența dintre numărul existent și media aritmetică și o pătratăm. Vor exista exact atâtea valori câte rezultate pot exista pentru evenimentul pe care îl luăm în considerare. În continuare, însumăm tot ceea ce a primit și împărțim la numărul de elemente din succesiune. Dacă avem cinci rezultate posibile, atunci împărțiți la cinci.

Dispersia are, de asemenea, proprietăți care trebuie reținute pentru a fi utilizate la rezolvarea problemelor. De exemplu, când crește o variabilă aleatoare de X ori, varianța crește de X ori la pătrat (adică X*X). Ea nu se întâmplă niciodată mai putin de zeroși nu depinde de deplasarea valorilor cu o valoare egală în sus sau în jos. În plus, pentru încercările independente, varianța sumei este egală cu suma variațiilor.

Acum trebuie să luăm în considerare exemple de varianță a unei variabile aleatoare discrete și așteptările matematice.

Să presupunem că am efectuat 21 de experimente și am obținut 7 rezultate diferite. Am observat fiecare dintre ele de 1, 2, 2, 3, 4, 4 și, respectiv, de 5 ori. Cu ce ​​va fi egală varianța?

Mai întâi, să calculăm media aritmetică: suma elementelor, desigur, este 21. Împărțiți-o la 7, obținând 3. Acum scădeți 3 din fiecare număr din succesiunea originală, pătrați fiecare valoare și adăugați rezultatele împreună. Rezultatul este 12. Acum tot ce trebuie să facem este să împărțim numărul la numărul de elemente și, s-ar părea, atât. Dar există o captură! Să discutăm.

Dependența de numărul de experimente

Se pare că atunci când se calculează varianța, numitorul poate conține unul dintre cele două numere: fie N, fie N-1. Aici N este numărul de experimente efectuate sau numărul de elemente din secvență (care este în esență același lucru). De ce depinde asta?

Dacă numărul de teste este măsurat în sute, atunci trebuie să punem la numitor N. Dacă este în unități, atunci N-1. Oamenii de știință au decis să deseneze granița în mod destul de simbolic: astăzi trece prin numărul 30. Dacă am efectuat mai puțin de 30 de experimente, atunci vom împărți cantitatea cu N-1, iar dacă mai mult, atunci cu N.

Sarcină

Să revenim la exemplul nostru de rezolvare a problemei varianței și așteptărilor matematice. Am primit un număr intermediar 12, care trebuia împărțit la N sau N-1. Deoarece am efectuat 21 de experimente, adică mai puțin de 30, vom alege a doua opțiune. Deci răspunsul este: varianța este 12 / 2 = 2.

Valorea estimata

Să trecem la al doilea concept, pe care trebuie să îl luăm în considerare în acest articol. Așteptarea matematică este rezultatul adunării tuturor rezultatelor posibile înmulțite cu probabilitățile corespunzătoare. Este important de înțeles că valoarea obținută, precum și rezultatul calculării varianței, se obține o singură dată pentru întreaga problemă, indiferent de câte rezultate sunt luate în considerare în ea.

Formula pentru așteptarea matematică este destul de simplă: luăm rezultatul, îl înmulțim cu probabilitatea lui, adăugăm același lucru pentru al doilea, al treilea rezultat etc. Tot ce este legat de acest concept nu este greu de calculat. De exemplu, suma valorilor așteptate este egală cu valoarea așteptată a sumei. Același lucru este valabil și pentru lucrare. Nu orice cantitate din teoria probabilității vă permite să efectuați astfel de operații simple. Să luăm problema și să calculăm semnificația a două concepte pe care le-am studiat deodată. În plus, am fost distrași de teorie – este timpul să exersăm.

Încă un exemplu

Am efectuat 50 de studii și am obținut 10 tipuri de rezultate - numere de la 0 la 9 - care apar în procente diferite. Acestea sunt, respectiv: 2%, 10%, 4%, 14%, 2%,18%, 6%, 16%, 10%, 18%. Amintiți-vă că pentru a obține probabilități, trebuie să împărțiți valorile procentuale la 100. Astfel, obținem 0,02; 0,1 etc. Să prezentăm un exemplu de rezolvare a problemei pentru varianța unei variabile aleatoare și așteptarea matematică.

Calculăm media aritmetică folosind formula din care ne amintim scoala generala: 50/10 = 5.

Acum să convertim probabilitățile în numărul de rezultate „pe bucăți” pentru a fi mai ușor de numărat. Se obține 1, 5, 2, 7, 1, 9, 3, 8, 5 și 9. Din fiecare valoare obținută scădem media aritmetică, după care punem la pătrat fiecare dintre rezultatele obținute. Vedeți cum să faceți acest lucru folosind primul element ca exemplu: 1 - 5 = (-4). În continuare: (-4) * (-4) = 16. Pentru alte valori, faceți singur aceste operații. Dacă ați făcut totul corect, atunci după ce le-ați adunat pe toate, veți obține 90.

Să continuăm să calculăm varianța și valoarea așteptată împărțind 90 la N. De ce alegem N mai degrabă decât N-1? Corect, deoarece numărul de experimente efectuate depășește 30. Deci: 90/10 = 9. Am obținut varianța. Dacă primești un alt număr, nu dispera. Cel mai probabil, ai făcut o greșeală simplă în calcule. Verificați din nou ceea ce ați scris și probabil totul va fi la locul său.

În cele din urmă, amintiți-vă formula pentru așteptările matematice. Nu vom da toate calculele, vom scrie doar un răspuns pe care îl puteți verifica după finalizarea tuturor procedurilor necesare. Valoarea așteptată va fi 5,48. Să ne amintim doar cum să efectuăm operațiuni, folosind primele elemente ca exemplu: 0*0,02 + 1*0,1... și așa mai departe. După cum puteți vedea, pur și simplu înmulțim valoarea rezultatului cu probabilitatea acestuia.

Deviere

Un alt concept strâns legat de dispersie și așteptările matematice este deviația standard. Se notează fie prin literele latine sd, fie prin literele grecești „sigma”. Acest concept arată cât de mult se abate, în medie, valorile de la caracteristica centrală. Pentru a-i găsi valoarea, trebuie să calculați Rădăcină pătrată din dispersie.

Dacă trasați un grafic de distribuție normală și doriți să vedeți direct pe el abatere pătrată, acest lucru se poate face în mai multe etape. Luați jumătate din imagine la stânga sau la dreapta modului (valoarea centrală), trageți o perpendiculară pe axa orizontală, astfel încât zonele figurilor rezultate să fie egale. Mărimea segmentului dintre mijlocul distribuției și proiecția rezultată pe axa orizontală va reprezenta abaterea standard.

Software

După cum se poate observa din descrierile formulelor și exemplele prezentate, calcularea varianței și a așteptărilor matematice nu este cea mai simplă procedură din punct de vedere aritmetic. Pentru a nu pierde timpul, are sens să folosești programul folosit în învățământul superior institutii de invatamant- se numește „R”. Are funcții care vă permit să calculați valori pentru multe concepte din statistică și teoria probabilității.

De exemplu, specificați un vector de valori. Aceasta se face astfel: vector<-c(1,5,2…). Теперь, когда вам потребуется посчитать какие-либо значения для этого вектора, вы пишете функцию и задаете его в качестве аргумента. Для нахождения дисперсии вам нужно будет использовать функцию var. Пример её использования: var(vector). Далее вы просто нажимаете «ввод» и получаете результат.

In cele din urma

Dispersia și așteptările matematice sunt fără de care este dificil să calculezi ceva în viitor. În cursul principal al prelegerilor la universități, acestea sunt discutate deja în primele luni de studiu a subiectului. Tocmai din cauza lipsei de înțelegere a acestor concepte simple și a incapacității de a le calcula, mulți studenți încep imediat să rămână în urmă în program și ulterior primesc note proaste la sfârșitul sesiunii, ceea ce îi privează de burse.

Exersează cel puțin o săptămână, o jumătate de oră pe zi, rezolvând sarcini similare cu cele prezentate în acest articol. Apoi, la orice test de teoria probabilităților, veți putea face față exemplelor fără sfaturi străine și cheat sheets.

Varianta unei variabile aleatoare este o măsură a răspândirii valorilor acestei variabile. Varianta scăzută înseamnă că valorile sunt grupate strâns. Dispersia mare indică o răspândire puternică a valorilor. Conceptul de varianță a unei variabile aleatoare este utilizat în statistică. De exemplu, dacă comparați varianța a două valori (cum ar fi între pacienții de sex masculin și de sex feminin), puteți testa semnificația unei variabile. Varianta este, de asemenea, utilizată la construirea modelelor statistice, deoarece variația scăzută poate fi un semn că supraajustați valorile.

Pași

Calcularea varianței eșantionului

  1. Înregistrați valorile eșantionului.În cele mai multe cazuri, statisticienii au acces doar la mostre de populații specifice. De exemplu, de regulă, statisticienii nu analizează costul întreținerii totalității tuturor mașinilor din Rusia - ei analizează un eșantion aleatoriu de câteva mii de mașini. Un astfel de eșantion va ajuta la determinarea costului mediu al unei mașini, dar, cel mai probabil, valoarea rezultată va fi departe de cea reală.

    • De exemplu, să analizăm numărul de chifle vândute într-o cafenea pe parcursul a 6 zile, luate în ordine aleatorie. Eșantionul arată astfel: 17, 15, 23, 7, 9, 13. Acesta este un eșantion, nu o populație, deoarece nu avem date despre chiflele vândute pentru fiecare zi în care cafeneaua este deschisă.
    • Dacă vi se oferă o populație mai degrabă decât un eșantion de valori, continuați la secțiunea următoare.
  2. Scrieți o formulă pentru a calcula varianța eșantionului. Dispersia este o măsură a răspândirii valorilor unei anumite cantități. Cu cât valoarea varianței este mai aproape de zero, cu atât valorile sunt grupate mai aproape. Când lucrați cu un eșantion de valori, utilizați următoarea formulă pentru a calcula varianța:

    • s 2 (\displaystyle s^(2)) = ∑[(x i (\displaystyle x_(i))- X) 2 (\displaystyle ^(2))] / (n - 1)
    • s 2 (\displaystyle s^(2))– aceasta este dispersia. Dispersia se măsoară în unități pătrate.
    • x i (\displaystyle x_(i))– fiecare valoare din eșantion.
    • x i (\displaystyle x_(i)) trebuie să scădeți x̅, să-l pătrați și apoi să adăugați rezultatele.
    • x̅ – medie eșantion (medie eșantion).
    • n – numărul de valori din eșantion.
  3. Calculați media eșantionului. Este notat cu x̅. Media eșantionului este calculată ca medie aritmetică simplă: se adună toate valorile din eșantion, apoi se împarte rezultatul la numărul de valori din eșantion.

    • În exemplul nostru, adăugați valorile din eșantion: 15 + 17 + 23 + 7 + 9 + 13 = 84
      Acum împărțiți rezultatul la numărul de valori din eșantion (în exemplul nostru sunt 6): 84 ÷ 6 = 14.
      Media eșantionului x̅ = 14.
    • Media eșantionului este valoarea centrală în jurul căreia sunt distribuite valorile din eșantion. Dacă valorile din grupul de eșantion din jurul eșantionului sunt medii, atunci varianța este mică; în caz contrar, varianța este mare.
  4. Scădeți media eșantionului din fiecare valoare din eșantion. Acum calculează diferența x i (\displaystyle x_(i))- x̅, unde x i (\displaystyle x_(i))– fiecare valoare din eșantion. Fiecare rezultat obținut indică gradul de abatere al unei anumite valori de la media eșantionului, adică cât de departe este această valoare de media eșantionului.

    • În exemplul nostru:
      x 1 (\displaystyle x_(1))- x = 17 - 14 = 3
      x 2 (\displaystyle x_(2))- x̅ = 15 - 14 = 1
      x 3 (\displaystyle x_(3))- x = 23 - 14 = 9
      x 4 (\displaystyle x_(4))- x̅ = 7 - 14 = -7
      x 5 (\displaystyle x_(5))- x̅ = 9 - 14 = -5
      x 6 (\displaystyle x_(6))- x̅ = 13 - 14 = -1
    • Corectitudinea rezultatelor obținute este ușor de verificat, deoarece suma lor ar trebui să fie egală cu zero. Acest lucru este legat de definirea mediei, deoarece valorile negative (distanțele de la medie la valori mai mici) sunt complet compensate de valori pozitive (distanțele de la medie la valori mai mari).
  5. După cum sa menționat mai sus, suma diferențelor x i (\displaystyle x_(i))- x̅ trebuie să fie egal cu zero. Aceasta înseamnă că varianța medie este întotdeauna zero, ceea ce nu dă nicio idee despre răspândirea valorilor unei anumite cantități. Pentru a rezolva această problemă, pătrați fiecare diferență x i (\displaystyle x_(i))- X. Acest lucru va duce la obținerea doar a unor numere pozitive, care nu vor aduna niciodată până la 0.

    • În exemplul nostru:
      (x 1 (\displaystyle x_(1))- X) 2 = 3 2 = 9 (\displaystyle ^(2)=3^(2)=9)
      (x 2 (\displaystyle (x_(2)))- X) 2 = 1 2 = 1 (\displaystyle ^(2)=1^(2)=1)
      9 2 = 81
      (-7) 2 = 49
      (-5) 2 = 25
      (-1) 2 = 1
    • Ai găsit pătratul diferenței - x̅) 2 (\displaystyle ^(2)) pentru fiecare valoare din eșantion.
  6. Calculați suma pătratelor diferențelor. Adică, găsiți acea parte a formulei care este scrisă astfel: ∑[( x i (\displaystyle x_(i))- X) 2 (\displaystyle ^(2))]. Aici semnul Σ înseamnă suma diferențelor pătrate pentru fiecare valoare x i (\displaystyle x_(i))în probă. Ați găsit deja diferențele la pătrat (x i (\displaystyle (x_(i)))- X) 2 (\displaystyle ^(2)) pentru fiecare valoare x i (\displaystyle x_(i))în probă; acum doar adăugați aceste pătrate.

    • În exemplul nostru: 9 + 1 + 81 + 49 + 25 + 1 = 166 .
  7. Împărțiți rezultatul la n - 1, unde n este numărul de valori din eșantion. Cu ceva timp în urmă, pentru a calcula varianța eșantionului, statisticienii au împărțit pur și simplu rezultatul la n; în acest caz, veți obține media varianței pătrate, care este ideală pentru a descrie varianța unui eșantion dat. Dar amintiți-vă că orice eșantion este doar o mică parte din populația de valori. Dacă luați o altă probă și efectuați aceleași calcule, veți obține un rezultat diferit. După cum se dovedește, împărțirea la n - 1 (mai degrabă decât doar n) oferă o estimare mai precisă a varianței populației, care este ceea ce vă interesează. Împărțirea cu n – 1 a devenit obișnuită, deci este inclusă în formula pentru calcularea varianței eșantionului.

    • În exemplul nostru, eșantionul include 6 valori, adică n = 6.
      Varianta eșantionului = s 2 = 166 6 − 1 = (\displaystyle s^(2)=(\frac (166)(6-1))=) 33,2
  8. Diferența dintre varianță și abaterea standard. Rețineți că formula conține un exponent, astfel încât dispersia este măsurată în unități pătrate ale valorii analizate. Uneori, o astfel de mărime este destul de dificil de operat; în astfel de cazuri, utilizați abaterea standard, care este egală cu rădăcina pătrată a varianței. De aceea, varianța eșantionului se notează ca s 2 (\displaystyle s^(2)), iar abaterea standard a probei este ca s (\displaystyle s).

    • În exemplul nostru, abaterea standard a eșantionului este: s = √33,2 = 5,76.

    Calcularea variației populației

    1. Analizați un set de valori. Setul include toate valorile cantității luate în considerare. De exemplu, dacă studiați vârsta rezidenților din regiunea Leningrad, atunci totalitatea include vârsta tuturor locuitorilor acestei regiuni. Când lucrați cu o populație, se recomandă să creați un tabel și să introduceți valorile populației în el. Luați în considerare următorul exemplu:

      • Într-o anumită cameră sunt 6 acvarii. Fiecare acvariu conține următorul număr de pești:
        x 1 = 5 (\displaystyle x_(1)=5)
        x 2 = 5 (\displaystyle x_(2)=5)
        x 3 = 8 (\displaystyle x_(3)=8)
        x 4 = 12 (\displaystyle x_(4)=12)
        x 5 = 15 (\displaystyle x_(5)=15)
        x 6 = 18 (\displaystyle x_(6)=18)
    2. Scrieți o formulă pentru a calcula varianța populației. Deoarece populația include toate valorile unei anumite cantități, formula de mai jos vă permite să obțineți valoarea exactă a varianței populației. Pentru a distinge varianța populației de varianța eșantionului (care este doar o estimare), statisticienii folosesc diverse variabile:

      • σ 2 (\displaystyle ^(2)) = (∑(x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2)))/n
      • σ 2 (\displaystyle ^(2))– dispersia populației (a se citi „sigma pătrat”). Dispersia se măsoară în unități pătrate.
      • x i (\displaystyle x_(i))– fiecare valoare în întregime.
      • Σ – semnul sumei. Adică din fiecare valoare x i (\displaystyle x_(i)) trebuie să scădeți μ, să-l pătrați și apoi să adăugați rezultatele.
      • μ – media populației.
      • n – numărul de valori din populație.
    3. Calculați media populației. Când se lucrează cu o populație, media ei este notată ca μ (mu). Media populației este calculată ca medie aritmetică simplă: se adună toate valorile din populație și apoi se împarte rezultatul la numărul de valori din populație.

      • Rețineți că mediile nu sunt întotdeauna calculate ca medie aritmetică.
      • În exemplul nostru, media populației: μ = 5 + 5 + 8 + 12 + 15 + 18 6 (\displaystyle (\frac (5+5+8+12+15+18)(6))) = 10,5
    4. Scădeți media populației din fiecare valoare din populație. Cu cât valoarea diferenței este mai aproape de zero, cu atât valoarea specifică este mai aproape de media populației. Găsiți diferența dintre fiecare valoare din populație și media acesteia și vă veți face o primă idee despre distribuția valorilor.

      • În exemplul nostru:
        x 1 (\displaystyle x_(1))- μ = 5 - 10,5 = -5,5
        x 2 (\displaystyle x_(2))- μ = 5 - 10,5 = -5,5
        x 3 (\displaystyle x_(3))- μ = 8 - 10,5 = -2,5
        x 4 (\displaystyle x_(4))- μ = 12 - 10,5 = 1,5
        x 5 (\displaystyle x_(5))- μ = 15 - 10,5 = 4,5
        x 6 (\displaystyle x_(6))- μ = 18 - 10,5 = 7,5
    5. Patratează fiecare rezultat obținut. Valorile diferențelor vor fi atât pozitive, cât și negative; Dacă aceste valori sunt reprezentate pe o dreaptă numerică, ele se vor afla la dreapta și la stânga mediei populației. Acest lucru nu este bun pentru calcularea varianței, deoarece numerele pozitive și negative se anulează reciproc. Deci pătrați fiecare diferență pentru a obține numere exclusiv pozitive.

      • În exemplul nostru:
        (x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2)) pentru fiecare valoare a populației (de la i = 1 la i = 6):
        (-5,5)2 (\displaystyle ^(2)) = 30,25
        (-5,5)2 (\displaystyle ^(2)), Unde x n (\displaystyle x_(n))– ultima valoare din populatie.
      • Pentru a calcula valoarea medie a rezultatelor obținute, trebuie să găsiți suma lor și să o împărțiți la n:(( x 1 (\displaystyle x_(1)) - μ) 2 (\displaystyle ^(2)) + (x 2 (\displaystyle x_(2)) - μ) 2 (\displaystyle ^(2)) + ... + (x n (\displaystyle x_(n)) - μ) 2 (\displaystyle ^(2)))/n
      • Acum să scriem explicația de mai sus folosind variabile: (∑( x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2))) / n și obțineți o formulă pentru calcularea varianței populației.

.

În schimb, dacă este un a.e. nenegativ. functioneaza astfel incat , atunci există o măsură de probabilitate absolut continuă, astfel încât să fie densitatea sa.

    Înlocuirea măsurii în integrala Lebesgue:

,

unde este orice funcție Borel care este integrabilă în raport cu măsura probabilității.

Dispersia, tipurile și proprietățile dispersiei Conceptul de dispersie

Dispersia în statistică se găsește ca abatere standard a valorilor individuale ale caracteristicii la pătrat de la media aritmetică. În funcție de datele inițiale, se determină folosind formulele de varianță simple și ponderate:

1. Varianta simpla(pentru date negrupate) se calculează folosind formula:

2. Varianta ponderată (pentru seriile de variații):

unde n este frecvența (repetabilitatea factorului X)

Un exemplu de găsire a varianței

Această pagină descrie un exemplu standard de găsire a varianței, puteți, de asemenea, să vă uitați la alte probleme pentru a o găsi

Exemplul 1. Determinarea grupului, mediei grupului, intergrupurilor și varianței totale

Exemplul 2. Găsirea varianței și coeficientului de variație într-un tabel de grupare

Exemplul 3. Găsirea varianței într-o serie discretă

Exemplul 4. Următoarele date sunt disponibile pentru un grup de 20 de studenți prin corespondență. Este necesar să se construiască o serie de intervale a distribuției caracteristicii, să se calculeze valoarea medie a caracteristicii și să se studieze dispersia acesteia

Să construim o grupare de intervale. Să determinăm intervalul intervalului folosind formula:

unde X max este valoarea maximă a caracteristicii de grupare; X min – valoarea minimă a caracteristicii de grupare; n – numărul de intervale:

Acceptăm n=5. Pasul este: h = (192 - 159)/ 5 = 6,6

Să creăm o grupare de intervale

Pentru calcule suplimentare, vom construi un tabel auxiliar:

X"i – mijlocul intervalului. (de exemplu, mijlocul intervalului 159 – 165,6 = 162,3)

Determinăm înălțimea medie a elevilor folosind formula medie aritmetică ponderată:

Să determinăm varianța folosind formula:

Formula poate fi transformată astfel:

Din această formulă rezultă că varianța este egală cu diferența dintre media pătratelor opțiunilor și pătratul și media.

Dispersie în serie de variații cu intervale egale folosind metoda momentelor se poate calcula în felul următor folosind a doua proprietate a dispersiei (împărțirea tuturor opțiunilor la valoarea intervalului). Determinarea varianței, calculat folosind metoda momentelor, folosind următoarea formulă este mai puțin laborioasă:

unde i este valoarea intervalului; A este un zero convențional, pentru care este convenabil să se folosească mijlocul intervalului cu cea mai mare frecvență; m1 este pătratul momentului de ordinul întâi; m2 - moment de ordinul doi

Varianta alternativă a trăsăturilor (dacă într-o populație statistică o caracteristică se modifică în așa fel încât există doar două opțiuni care se exclud reciproc, atunci o astfel de variabilitate se numește alternativă) poate fi calculată folosind formula:

Înlocuind q = 1- p în această formulă de dispersie, obținem:

Tipuri de variație

Varianta totala măsoară variația unei caracteristici la nivelul întregii populații în ansamblu sub influența tuturor factorilor care provoacă această variație. Este egal cu pătratul mediu al abaterilor valorilor individuale ale unei caracteristici x de la valoarea medie globală a lui x și poate fi definită ca varianță simplă sau varianță ponderată.

Varianta în cadrul grupului caracterizează variația aleatoare, adică parte a variației care se datorează influenței factorilor necontabiliați și nu depinde de atributul-factorial care formează baza grupului. O astfel de dispersie este egală cu pătratul mediu al abaterilor valorilor individuale ale atributului din grupul X de la media aritmetică a grupului și poate fi calculată ca dispersie simplă sau ca dispersie ponderată.

Prin urmare, măsuri de variație în cadrul grupului variația unei trăsături în cadrul unui grup și este determinată de formula:

unde xi este media grupului; ni este numărul de unități din grup.

De exemplu, variațiile intragrup care trebuie determinate în sarcina de a studia influența calificărilor lucrătorilor asupra nivelului productivității muncii într-un atelier arată variații ale producției în fiecare grup cauzate de toți factorii posibili (starea tehnică a echipamentului, disponibilitatea instrumente și materiale, vârsta lucrătorilor, intensitatea muncii etc.), cu excepția diferențelor de categorie de calificare (în cadrul unui grup toți lucrătorii au aceleași calificări).

Media variațiilor în interiorul grupului reflectă variația aleatoare, adică acea parte a variației care a avut loc sub influența tuturor celorlalți factori, cu excepția factorului de grupare. Se calculează folosind formula:

Varianta intergrup caracterizează variaţia sistematică a caracteristicii rezultate, care se datorează influenţei factorului-atribut care formează baza grupului. Este egal cu pătratul mediu al abaterilor mediilor grupului de la media generală. Varianta intergrup este calculată folosind formula:

Așteptările și varianța sunt caracteristicile numerice cele mai frecvent utilizate ale unei variabile aleatorii. Ele caracterizează cele mai importante trăsături ale distribuției: poziția și gradul de împrăștiere a acesteia. În multe probleme practice, o caracteristică completă, exhaustivă a unei variabile aleatoare - legea distribuției - fie nu poate fi obținută deloc, fie nu este deloc necesară. În aceste cazuri, se limitează la o descriere aproximativă a unei variabile aleatorii folosind caracteristici numerice.

Valoarea așteptată este adesea numită pur și simplu valoarea medie a unei variabile aleatorii. Dispersia unei variabile aleatoare este o caracteristică a dispersiei, răspândirea unei variabile aleatoare în jurul așteptărilor sale matematice.

Așteptarea unei variabile aleatoare discrete

Să abordăm conceptul de așteptare matematică, mai întâi pe baza interpretării mecanice a distribuției unei variabile aleatoare discrete. Fie ca unitatea de masă să fie distribuită între punctele axei x X1 , X 2 , ..., X n, iar fiecare punct material are o masă corespunzătoare de p1 , p 2 , ..., p n. Este necesar să se selecteze un punct pe axa absciselor, care să caracterizeze poziția întregului sistem de puncte materiale, ținând cont de masele acestora. Este firesc să luăm ca un astfel de punct centrul de masă al sistemului de puncte materiale. Aceasta este media ponderată a variabilei aleatoare X, la care abscisa fiecărui punct Xi intră cu o „pondere” egală cu probabilitatea corespunzătoare. Valoarea medie a variabilei aleatoare obţinută în acest fel X se numește așteptarea sa matematică.

Așteptările matematice ale unei variabile aleatoare discrete este suma produselor tuturor valorilor sale posibile și probabilitățile acestor valori:

Exemplul 1. A fost organizată o loterie win-win. Există 1000 de câștiguri, dintre care 400 sunt 10 ruble. 300 - 20 de ruble fiecare. 200 - 100 de ruble fiecare. și 100 - 200 de ruble fiecare. Care este câștigul mediu pentru cineva care cumpără un bilet?

Soluţie. Vom găsi câștigurile medii dacă împărțim suma totală a câștigurilor, care este 10*400 + 20*300 + 100*200 + 200*100 = 50.000 de ruble, la 1000 (valoarea totală a câștigurilor). Apoi obținem 50000/1000 = 50 de ruble. Dar expresia pentru calcularea câștigurilor medii poate fi prezentată în următoarea formă:

Pe de altă parte, în aceste condiții, mărimea câștigătoare este o variabilă aleatorie, care poate lua valori de 10, 20, 100 și 200 de ruble. cu probabilități egale cu 0,4, respectiv; 0,3; 0,2; 0,1. Prin urmare, câștigul mediu așteptat este egal cu suma produselor mărimii câștigurilor și a probabilității de a le primi.

Exemplul 2. Editura a decis să publice o nouă carte. El plănuiește să vândă cartea cu 280 de ruble, din care el însuși va primi 200, 50 - librăria și 30 - autorul. Tabelul oferă informații despre costurile publicării unei cărți și probabilitatea de a vinde un anumit număr de exemplare ale cărții.

Găsiți profitul așteptat al editorului.

Soluţie. Variabila aleatoare „profit” este egală cu diferența dintre venitul din vânzări și costul costurilor. De exemplu, dacă se vând 500 de exemplare ale unei cărți, atunci venitul din vânzare este de 200 * 500 = 100.000, iar costul publicării este de 225.000 de ruble. Astfel, editorul se confruntă cu o pierdere de 125.000 de ruble. Următorul tabel rezumă valorile așteptate ale variabilei aleatoare - profit:

NumărProfit Xi Probabilitate pi Xi p i
500 -125000 0,20 -25000
1000 -50000 0,40 -20000
2000 100000 0,25 25000
3000 250000 0,10 25000
4000 400000 0,05 20000
Total: 1,00 25000

Astfel, obținem așteptarea matematică a profitului editorului:

.

Exemplul 3. Probabilitatea de a lovi cu o lovitură p= 0,2. Determinați consumul de proiectile care oferă o așteptare matematică a numărului de lovituri egal cu 5.

Soluţie. Din aceeași formulă de așteptare matematică pe care am folosit-o până acum, ne exprimăm X- consumul de coajă:

.

Exemplul 4. Determinați așteptările matematice ale unei variabile aleatorii X numărul de lovituri cu trei lovituri, dacă probabilitatea unei lovituri la fiecare lovitură p = 0,4 .

Sugestie: găsiți probabilitatea de valori ale variabilelor aleatoare prin formula lui Bernoulli .

Proprietățile așteptărilor matematice

Să luăm în considerare proprietățile așteptărilor matematice.

Proprietatea 1. Așteptarea matematică a unei constante este egală cu această constantă:

Proprietatea 2. Factorul constant poate fi scos din semnul așteptării matematice:

Proprietatea 3. Așteptările matematice ale sumei (diferenței) variabilelor aleatoare sunt egale cu suma (diferenței) așteptărilor lor matematice:

Proprietatea 4. Așteptările matematice ale unui produs de variabile aleatoare sunt egale cu produsul așteptărilor lor matematice:

Proprietatea 5. Dacă toate valorile unei variabile aleatoare X scade (creste) cu acelasi numar CU, atunci așteptarea sa matematică va scădea (crește) cu același număr:

Când nu te poți limita doar la așteptări matematice

În cele mai multe cazuri, doar așteptarea matematică nu poate caracteriza suficient o variabilă aleatoare.

Lasă variabilele aleatoare XȘi Y sunt date de următoarele legi de distribuție:

Sens X Probabilitate
-0,1 0,1
-0,01 0,2
0 0,4
0,01 0,2
0,1 0,1
Sens Y Probabilitate
-20 0,3
-10 0,1
0 0,2
10 0,1
20 0,3

Așteptările matematice ale acestor mărimi sunt aceleași - egale cu zero:

Cu toate acestea, modelele lor de distribuție sunt diferite. Valoare aleatoare X poate lua doar valori care diferă puțin de așteptările matematice și de variabila aleatoare Y poate lua valori care se abat semnificativ de la așteptările matematice. Un exemplu asemănător: salariul mediu nu face posibilă judecarea ponderii lucrătorilor cu plăți mari și slabe. Cu alte cuvinte, nu se poate judeca din așteptarea matematică ce abateri de la ea, cel puțin în medie, sunt posibile. Pentru a face acest lucru, trebuie să găsiți varianța variabilei aleatoare.

Varianta unei variabile aleatoare discrete

Varianta variabilă aleatoare discretă X se numește așteptarea matematică a pătratului abaterii sale de la așteptarea matematică:

Abaterea standard a unei variabile aleatoare X valoarea aritmetică a rădăcinii pătrate a varianței sale se numește:

.

Exemplul 5. Calculați variațiile și abaterile standard ale variabilelor aleatoare XȘi Y, ale căror legi de distribuție sunt date în tabelele de mai sus.

Soluţie. Așteptări matematice ale variabilelor aleatoare XȘi Y, așa cum a fost găsit mai sus, sunt egale cu zero. Conform formulei de dispersie la E(X)=E(y)=0 obținem:

Apoi abaterile standard ale variabilelor aleatoare XȘi Y inventa

.

Astfel, cu aceleași așteptări matematice, varianța variabilei aleatoare X foarte mic, dar o variabilă aleatorie Y- semnificativă. Aceasta este o consecință a diferențelor în distribuția lor.

Exemplul 6. Investitorul are 4 proiecte alternative de investiții. Tabelul rezumă profitul așteptat în aceste proiecte cu probabilitatea corespunzătoare.

Proiectul 1Proiectul 2Proiectul 3Proiectul 4
500, P=1 1000, P=0,5 500, P=0,5 500, P=0,5
0, P=0,5 1000, P=0,25 10500, P=0,25
0, P=0,25 9500, P=0,25

Găsiți așteptările matematice, varianța și abaterea standard pentru fiecare alternativă.

Soluţie. Să arătăm cum se calculează aceste valori pentru a treia alternativă:

Tabelul rezumă valorile găsite pentru toate alternativele.

Toate alternativele au aceleași așteptări matematice. Asta înseamnă că, pe termen lung, toată lumea are același venit. Abaterea standard poate fi interpretată ca o măsură a riscului - cu cât este mai mare, cu atât este mai mare riscul investiției. Un investitor care nu dorește mult risc va alege proiectul 1, deoarece are cea mai mică abatere standard (0). Dacă investitorul preferă riscul și randamentele mari într-o perioadă scurtă, atunci va alege proiectul cu cea mai mare abatere standard - proiectul 4.

Proprietăți de dispersie

Să prezentăm proprietățile dispersiei.

Proprietatea 1. Varianta unei valori constante este zero:

Proprietatea 2. Factorul constant poate fi scos din semnul de dispersie prin pătratul:

.

Proprietatea 3. Varianta unei variabile aleatoare este egală cu așteptarea matematică a pătratului acestei valori, din care se scade pătratul așteptării matematice a valorii în sine:

,

Unde .

Proprietatea 4. Varianta sumei (diferenței) variabilelor aleatoare este egală cu suma (diferenței) varianțelor acestora:

Exemplul 7. Se știe că o variabilă aleatoare discretă X ia doar două valori: −3 și 7. În plus, așteptarea matematică este cunoscută: E(X) = 4 . Aflați varianța unei variabile aleatoare discrete.

Soluţie. Să notăm prin p probabilitatea cu care o variabilă aleatoare ia o valoare X1 = −3 . Apoi probabilitatea valorii X2 = 7 va fi 1 − p. Să derivăm ecuația pentru așteptarea matematică:

E(X) = X 1 p + X 2 (1 − p) = −3p + 7(1 − p) = 4 ,

de unde obținem probabilitățile: p= 0,3 și 1 − p = 0,7 .

Legea distribuției unei variabile aleatoare:

X −3 7
p 0,3 0,7

Calculăm varianța acestei variabile aleatoare folosind formula de la proprietatea 3 a dispersiei:

D(X) = 2,7 + 34,3 − 16 = 21 .

Găsiți singur așteptările matematice ale unei variabile aleatoare și apoi uitați-vă la soluție

Exemplul 8. Variabilă aleatorie discretă X ia doar două valori. Acceptă cea mai mare dintre valorile 3 cu probabilitatea 0,4. În plus, este cunoscută varianța variabilei aleatoare D(X) = 6 . Aflați așteptările matematice ale unei variabile aleatoare.

Exemplul 9.Într-o urnă sunt 6 bile albe și 4 negre. Din urnă se extrag 3 bile. Numărul de bile albe dintre bilele extrase este o variabilă aleatorie discretă X. Găsiți așteptările matematice și varianța acestei variabile aleatoare.

Soluţie. Valoare aleatoare X poate lua valori 0, 1, 2, 3. Probabilitățile corespunzătoare pot fi calculate din regula înmulțirii probabilităților. Legea distribuției unei variabile aleatoare:

X 0 1 2 3
p 1/30 3/10 1/2 1/6

De aici așteptările matematice ale acestei variabile aleatoare:

M(X) = 3/10 + 1 + 1/2 = 1,8 .

Varianta unei variabile aleatoare date este:

D(X) = 0,3 + 2 + 1,5 − 3,24 = 0,56 .

Așteptarea și varianța unei variabile aleatoare continue

Pentru o variabilă aleatoare continuă, interpretarea mecanică a așteptării matematice va păstra același sens: centrul de masă pentru o unitate de masă distribuită continuu pe axa x cu densitate. f(X). Spre deosebire de o variabilă aleatoare discretă, al cărei argument al funcției Xi se schimbă brusc; pentru o variabilă aleatoare continuă, argumentul se schimbă continuu. Dar așteptarea matematică a unei variabile aleatoare continue este, de asemenea, legată de valoarea medie a acesteia.

Pentru a găsi așteptările matematice și varianța unei variabile aleatoare continue, trebuie să găsiți integrale definite . Dacă este dată funcția de densitate a unei variabile aleatoare continue, atunci aceasta intră direct în integrand. Dacă este dată o funcție de distribuție a probabilității, atunci prin diferențierea acesteia, trebuie să găsiți funcția de densitate.

Media aritmetică a tuturor valorilor posibile ale unei variabile aleatoare continue se numește ea așteptări matematice, notat cu sau .

Această pagină descrie un exemplu standard de găsire a varianței, puteți, de asemenea, să vă uitați la alte probleme pentru a o găsi

Exemplul 1. Determinarea grupului, mediei grupului, intergrupurilor și varianței totale

Exemplul 2. Găsirea varianței și coeficientului de variație într-un tabel de grupare

Exemplul 3. Găsirea varianței într-o serie discretă

Exemplul 4. Următoarele date sunt disponibile pentru un grup de 20 de studenți prin corespondență. Este necesar să se construiască o serie de intervale a distribuției caracteristicii, să se calculeze valoarea medie a caracteristicii și să se studieze dispersia acesteia

Să construim o grupare de intervale. Să determinăm intervalul intervalului folosind formula:

unde X max este valoarea maximă a caracteristicii de grupare;
X min – valoarea minimă a caracteristicii de grupare;
n – numărul de intervale:

Acceptăm n=5. Pasul este: h = (192 - 159)/ 5 = 6,6

Să creăm o grupare de intervale

Pentru calcule suplimentare, vom construi un tabel auxiliar:

X"i – mijlocul intervalului. (de exemplu, mijlocul intervalului 159 – 165,6 = 162,3)

Determinăm înălțimea medie a elevilor folosind formula medie aritmetică ponderată:

Să determinăm varianța folosind formula:

Formula poate fi transformată astfel:

Din această formulă rezultă că varianța este egală cu diferența dintre media pătratelor opțiunilor și pătratul și media.

Dispersie în serie de variații cu intervale egale folosind metoda momentelor se poate calcula în felul următor folosind a doua proprietate a dispersiei (împărțirea tuturor opțiunilor la valoarea intervalului). Determinarea varianței, calculat folosind metoda momentelor, folosind următoarea formulă este mai puțin laborioasă:

unde i este valoarea intervalului;
A este un zero convențional, pentru care este convenabil să se folosească mijlocul intervalului cu cea mai mare frecvență;
m1 este pătratul momentului de ordinul întâi;
m2 - moment de ordinul doi

Varianta alternativă a trăsăturilor (dacă într-o populație statistică o caracteristică se modifică în așa fel încât există doar două opțiuni care se exclud reciproc, atunci o astfel de variabilitate se numește alternativă) poate fi calculată folosind formula:

Înlocuind q = 1- p în această formulă de dispersie, obținem:

Tipuri de variație

Varianta totala măsoară variația unei caracteristici la nivelul întregii populații în ansamblu sub influența tuturor factorilor care provoacă această variație. Este egal cu pătratul mediu al abaterilor valorilor individuale ale unei caracteristici x de la valoarea medie globală a lui x și poate fi definită ca varianță simplă sau varianță ponderată.

Varianta în cadrul grupului caracterizează variația aleatoare, adică parte a variației care se datorează influenței factorilor necontabiliați și nu depinde de atributul-factorial care formează baza grupului. O astfel de dispersie este egală cu pătratul mediu al abaterilor valorilor individuale ale atributului din grupul X de la media aritmetică a grupului și poate fi calculată ca dispersie simplă sau ca dispersie ponderată.



Prin urmare, măsuri de variație în cadrul grupului variația unei trăsături în cadrul unui grup și este determinată de formula:

unde xi este media grupului;
ni este numărul de unități din grup.

De exemplu, variațiile intragrup care trebuie determinate în sarcina de a studia influența calificărilor lucrătorilor asupra nivelului productivității muncii într-un atelier arată variații ale producției în fiecare grup cauzate de toți factorii posibili (starea tehnică a echipamentului, disponibilitatea instrumente și materiale, vârsta lucrătorilor, intensitatea muncii etc.), cu excepția diferențelor de categorie de calificare (în cadrul unui grup toți lucrătorii au aceleași calificări).