Teoria probabilității este o ramură specială a matematicii care este studiată numai de studenții instituțiilor de învățământ superior. Îți plac calculele și formulele? Nu vă este frică de perspectivele de a vă familiariza cu distribuția normală, entropia ansamblului, așteptările matematice și dispersia discretă variabilă aleatorie? Atunci acest subiect va fi foarte interesant pentru tine. Să aruncăm o privire la câteva dintre cele mai importante Noțiuni de bază această ramură a științei.

Să ne amintim elementele de bază

Chiar dacă vă amintiți cele mai simple concepte ale teoriei probabilităților, nu neglijați primele paragrafe ale articolului. Ideea este că, fără o înțelegere clară a elementelor de bază, nu veți putea lucra cu formulele discutate mai jos.

Deci, are loc un eveniment aleatoriu, un experiment. Ca urmare a acțiunilor pe care le întreprindem, putem obține mai multe rezultate - unele dintre ele apar mai des, altele mai rar. Probabilitatea unui eveniment este raportul dintre numărul de rezultate efectiv obținute de un tip la numărul total posibil. Numai cunoscând definiția clasică a acestui concept poți începe să studiezi așteptări matematiceși variațiile variabilelor aleatoare continue.

In medie

Înapoi la școală, în timpul orelor de matematică, ai început să lucrezi cu media aritmetică. Acest concept este utilizat pe scară largă în teoria probabilității și, prin urmare, nu poate fi ignorat. Principalul lucru pentru noi este acest moment este că o vom întâlni în formulele pentru așteptarea și dispersia matematică a unei variabile aleatoare.

Avem o succesiune de numere și vrem să aflăm media aritmetică. Tot ceea ce ni se cere este să însumăm tot ce este disponibil și să împărțim la numărul de elemente din secvență. Să avem numere de la 1 la 9. Suma elementelor va fi egală cu 45, iar această valoare o vom împărți la 9. Răspuns: - 5.

Dispersia

În termeni științifici, dispersia este pătratul mediu al abaterilor valorilor obținute ale unei caracteristici de la media aritmetică. Este notat cu o literă latină majusculă D. Ce este necesar pentru a o calcula? Pentru fiecare element al șirului, calculăm diferența dintre numărul existent și media aritmetică și o pătratăm. Vor exista exact atâtea valori câte rezultate pot exista pentru evenimentul pe care îl luăm în considerare. În continuare, însumăm tot ceea ce a primit și împărțim la numărul de elemente din succesiune. Dacă avem cinci rezultate posibile, atunci împărțiți la cinci.

Dispersia are, de asemenea, proprietăți care trebuie reținute pentru a fi utilizate la rezolvarea problemelor. De exemplu, când crește o variabilă aleatoare de X ori, varianța crește de X ori la pătrat (adică X*X). Ea nu se întâmplă niciodată mai putin de zeroși nu depinde de deplasarea valorilor cu o valoare egală în sus sau în jos. În plus, pentru încercările independente, varianța sumei este egală cu suma variațiilor.

Acum trebuie să luăm în considerare exemple de varianță a unei variabile aleatoare discrete și așteptările matematice.

Să presupunem că am efectuat 21 de experimente și am obținut 7 rezultate diferite. Am observat fiecare dintre ele de 1, 2, 2, 3, 4, 4 și, respectiv, de 5 ori. Cu ce ​​va fi egală varianța?

Mai întâi, să calculăm media aritmetică: suma elementelor, desigur, este 21. Împărțiți-o la 7, obținând 3. Acum scădeți 3 din fiecare număr din succesiunea originală, pătrați fiecare valoare și adăugați rezultatele împreună. Rezultatul este 12. Acum tot ce trebuie să facem este să împărțim numărul la numărul de elemente și, s-ar părea, atât. Dar există o captură! Să discutăm.

Dependența de numărul de experimente

Se pare că atunci când se calculează varianța, numitorul poate conține unul dintre cele două numere: fie N, fie N-1. Aici N este numărul de experimente efectuate sau numărul de elemente din secvență (care este în esență același lucru). De ce depinde asta?

Dacă numărul de teste este măsurat în sute, atunci trebuie să punem la numitor N. Dacă este în unități, atunci N-1. Oamenii de știință au decis să deseneze granița în mod destul de simbolic: astăzi trece prin numărul 30. Dacă am efectuat mai puțin de 30 de experimente, atunci vom împărți cantitatea cu N-1, iar dacă mai mult, atunci cu N.

Sarcină

Să revenim la exemplul nostru de rezolvare a problemei varianței și așteptărilor matematice. Am primit un număr intermediar 12, care trebuia împărțit la N sau N-1. Deoarece am efectuat 21 de experimente, adică mai puțin de 30, vom alege a doua opțiune. Deci răspunsul este: varianța este 12 / 2 = 2.

Valorea estimata

Să trecem la al doilea concept, pe care trebuie să îl luăm în considerare în acest articol. Așteptarea matematică este rezultatul adunării tuturor rezultatelor posibile înmulțite cu probabilitățile corespunzătoare. Este important de înțeles că valoarea obținută, precum și rezultatul calculării varianței, se obține o singură dată pentru întreaga problemă, indiferent de câte rezultate sunt luate în considerare în ea.

Formula pentru așteptarea matematică este destul de simplă: luăm rezultatul, îl înmulțim cu probabilitatea lui, adăugăm același lucru pentru al doilea, al treilea rezultat etc. Tot ce este legat de acest concept nu este greu de calculat. De exemplu, suma valorilor așteptate este egală cu valoarea așteptată a sumei. Același lucru este valabil și pentru lucrare. Nu orice cantitate din teoria probabilității vă permite să efectuați astfel de operații simple. Să luăm problema și să calculăm semnificația a două concepte pe care le-am studiat deodată. În plus, am fost distrași de teorie – este timpul să exersăm.

Încă un exemplu

Am efectuat 50 de studii și am obținut 10 tipuri de rezultate - numere de la 0 la 9 - care apar în procente diferite. Acestea sunt, respectiv: 2%, 10%, 4%, 14%, 2%,18%, 6%, 16%, 10%, 18%. Amintiți-vă că pentru a obține probabilități, trebuie să împărțiți valorile procentuale la 100. Astfel, obținem 0,02; 0,1 etc. Să prezentăm un exemplu de rezolvare a problemei pentru varianța unei variabile aleatoare și așteptarea matematică.

Calculăm media aritmetică folosind formula din care ne amintim scoala generala: 50/10 = 5.

Acum să convertim probabilitățile în numărul de rezultate „pe bucăți” pentru a fi mai ușor de numărat. Se obține 1, 5, 2, 7, 1, 9, 3, 8, 5 și 9. Din fiecare valoare obținută scădem media aritmetică, după care punem la pătrat fiecare dintre rezultatele obținute. Vedeți cum să faceți acest lucru folosind primul element ca exemplu: 1 - 5 = (-4). În continuare: (-4) * (-4) = 16. Pentru alte valori, faceți singur aceste operații. Dacă ați făcut totul corect, atunci după ce le-ați adunat pe toate, veți obține 90.

Să continuăm să calculăm varianța și valoarea așteptată împărțind 90 la N. De ce alegem N mai degrabă decât N-1? Corect, deoarece numărul de experimente efectuate depășește 30. Deci: 90/10 = 9. Am obținut varianța. Dacă primești un alt număr, nu dispera. Cel mai probabil, ai făcut o greșeală simplă în calcule. Verificați din nou ceea ce ați scris și probabil totul va fi la locul său.

În cele din urmă, amintiți-vă formula pentru așteptările matematice. Nu vom da toate calculele, vom scrie doar un răspuns pe care îl puteți verifica după finalizarea tuturor procedurilor necesare. Valoarea așteptată va fi 5,48. Să ne amintim doar cum să efectuăm operațiuni, folosind primele elemente ca exemplu: 0*0,02 + 1*0,1... și așa mai departe. După cum puteți vedea, pur și simplu înmulțim valoarea rezultatului cu probabilitatea acestuia.

Deviere

Un alt concept strâns legat de dispersie și așteptările matematice este deviația standard. Se notează fie prin literele latine sd, fie prin literele grecești „sigma”. Acest concept arată cât de mult se abate, în medie, valorile de la caracteristica centrală. Pentru a-i găsi valoarea, trebuie să calculați Rădăcină pătrată din dispersie.

Dacă trasați un grafic de distribuție normală și doriți să vedeți direct pe el abatere pătrată, acest lucru se poate face în mai multe etape. Luați jumătate din imagine la stânga sau la dreapta modului (valoarea centrală), trageți o perpendiculară pe axa orizontală, astfel încât zonele figurilor rezultate să fie egale. Mărimea segmentului dintre mijlocul distribuției și proiecția rezultată pe axa orizontală va reprezenta abaterea standard.

Software

După cum se poate observa din descrierile formulelor și exemplele prezentate, calcularea varianței și a așteptărilor matematice nu este cea mai simplă procedură din punct de vedere aritmetic. Pentru a nu pierde timpul, are sens să folosești programul folosit în învățământul superior institutii de invatamant- se numește „R”. Are funcții care vă permit să calculați valori pentru multe concepte din statistică și teoria probabilității.

De exemplu, specificați un vector de valori. Aceasta se face astfel: vector<-c(1,5,2…). Теперь, когда вам потребуется посчитать какие-либо значения для этого вектора, вы пишете функцию и задаете его в качестве аргумента. Для нахождения дисперсии вам нужно будет использовать функцию var. Пример её использования: var(vector). Далее вы просто нажимаете «ввод» и получаете результат.

In cele din urma

Dispersia și așteptările matematice sunt fără de care este dificil să calculezi ceva în viitor. În cursul principal al prelegerilor la universități, acestea sunt discutate deja în primele luni de studiu a subiectului. Tocmai din cauza lipsei de înțelegere a acestor concepte simple și a incapacității de a le calcula, mulți studenți încep imediat să rămână în urmă în program și ulterior primesc note proaste la sfârșitul sesiunii, ceea ce îi privează de burse.

Exersează cel puțin o săptămână, o jumătate de oră pe zi, rezolvând sarcini similare cu cele prezentate în acest articol. Apoi, la orice test de teoria probabilităților, veți putea face față exemplelor fără sfaturi străine și cheat sheets.

Cu toate acestea, această caracteristică singură nu este suficientă pentru a studia o variabilă aleatorie. Să ne imaginăm doi trăgători trăgând la o țintă. Unul trage cu precizie și lovește aproape de centru, în timp ce celălalt... se distrează și nici măcar nu țintește. Dar ce e amuzant este că el in medie rezultatul va fi exact același cu primul shooter! Această situație este ilustrată în mod convențional de următoarele variabile aleatoare:

Așteptarea matematică „lunetist” este egală cu , însă, pentru „persoana interesantă”: – este și zero!

Astfel, este necesar să se cuantifice cât de departe risipite gloanțe (valori ale variabilelor aleatoare) în raport cu centrul țintei (așteptare matematică). bine si împrăștiere tradus din latină nu este altfel decât dispersie .

Să vedem cum se determină această caracteristică numerică folosind unul dintre exemplele din prima parte a lecției:

Acolo am găsit o așteptare matematică dezamăgitoare a acestui joc, iar acum trebuie să calculăm varianța acestuia, care notat cu prin .

Să aflăm cât de mult sunt „împrăștiate” câștigurile/pierderile față de valoarea medie. Evident, pentru asta trebuie să calculăm diferențeîntre valori ale variabilelor aleatoare si ea așteptări matematice:

–5 – (–0,5) = –4,5
2,5 – (–0,5) = 3
10 – (–0,5) = 10,5

Acum se pare că trebuie să rezumați rezultatele, dar acest mod nu este potrivit - din cauza faptului că fluctuațiile la stânga se vor anula reciproc cu fluctuații la dreapta. Deci, de exemplu, un trăgător „amator”. (exemplu de mai sus) diferențele vor fi , iar atunci când sunt adăugate vor da zero, așa că nu vom obține nicio estimare a dispersiei împușcării sale.

Pentru a ocoli această problemă, puteți lua în considerare module diferențe, dar din motive tehnice abordarea a prins rădăcini atunci când sunt pătrate. Este mai convenabil să formulați soluția într-un tabel:

Și aici se cere să calculeze medie ponderată valoarea abaterilor pătrate. Ce este? Este a lor valorea estimata, care este o măsură a împrăștierii:

definiție variaţiile. Din definiție reiese imediat că varianța nu poate fi negativă– ia notă pentru practică!

Să ne amintim cum să găsim valoarea așteptată. Înmulțiți diferențele la pătrat cu probabilitățile corespunzătoare (continuare tabel):
– la sens figurat, aceasta este „forța de tracțiune”,
și rezumați rezultatele:

Nu crezi că, în comparație cu câștigurile, rezultatul s-a dovedit a fi prea mare? Așa este - l-am pătrat și pentru a reveni la dimensiunea jocului nostru, trebuie să luăm rădăcina pătrată. Această cantitate se numește deviație standard și este notat cu litera greacă „sigma”:

Această valoare este uneori numită deviație standard .

Care este sensul lui? Dacă ne abatem de la așteptarea matematică la stânga și la dreapta prin abaterea standard:

– atunci cele mai probabile valori ale variabilei aleatoare vor fi „concentrate” pe acest interval. Ce observăm de fapt:

Cu toate acestea, se întâmplă că atunci când se analizează împrăștierea se operează aproape întotdeauna cu conceptul de dispersie. Să ne dăm seama ce înseamnă în legătură cu jocuri. Dacă în cazul săgeților vorbim despre „precizia” lovirilor în raport cu centrul țintei, atunci dispersia caracterizează două lucruri:

În primul rând, este evident că pe măsură ce pariurile cresc, și dispersia crește. Deci, de exemplu, dacă creștem de 10 ori, atunci așteptarea matematică va crește de 10 ori, iar varianța va crește de 100 de ori (deoarece aceasta este o cantitate pătratică). Dar rețineți că regulile jocului în sine nu s-au schimbat! Doar ratele s-au schimbat, aproximativ vorbind, înainte de a paria 10 ruble, acum sunt 100.

Al doilea punct, mai interesant, este că variația caracterizează stilul de joc. Fixați mental pariurile jocului la un anumit nivel, și să vedem ce este:

Un joc cu variație scăzută este un joc precaut. Jucătorul tinde să aleagă cele mai de încredere scheme, unde nu pierde/câștigă prea mult la un moment dat. De exemplu, sistemul roșu/negru la ruletă (vezi exemplul 4 al articolului Variabile aleatoare) .

Joc cu variație mare. Ea este numită des dispersive joc. Acesta este un stil de joc aventuros sau agresiv, în care jucătorul alege scheme de „adrenalină”. Să ne amintim măcar "Martingala", în care sumele puse în joc sunt ordine de mărime mai mari decât jocul „liniștit” de la punctul precedent.

Situația în poker este orientativă: există așa-zise strâmt jucători care au tendința de a fi precauți și „tremurați” cu privire la fondurile lor de jocuri (rulaj bancar). Nu este surprinzător, bankroll-ul lor nu fluctuează semnificativ (varianță scăzută). Dimpotrivă, dacă un jucător are o variație mare, atunci el este un agresor. Adesea își asumă riscuri, face pariuri mari și poate fie să spargă o bancă uriașă, fie să piardă în frânturi.

Același lucru se întâmplă în Forex și așa mai departe - există o mulțime de exemple.

Mai mult, în toate cazurile, nu contează dacă jocul este jucat pentru bani sau mii de dolari. Fiecare nivel are jucătorii săi cu dispersie scăzută și mare. Ei bine, după cum ne amintim, câștigul mediu este „responsabil” valorea estimata.

Probabil ați observat că găsirea variației este un proces lung și minuțios. Dar matematica este generoasă:

Formula pentru găsirea varianței

Această formulă este derivată direct din definiția varianței și o punem imediat în uz. Voi copia semnul cu jocul nostru de mai sus:

și așteptarea matematică găsită.

Să calculăm varianța în al doilea mod. Mai întâi, să găsim așteptarea matematică - pătratul variabilei aleatoare. De determinarea așteptărilor matematice:

În acest caz:

Astfel, conform formulei:

După cum se spune, simți diferența. Și în practică, desigur, este mai bine să utilizați formula (cu excepția cazului în care condiția cere altfel).

Stăpânim tehnica de rezolvare și proiectare:

Exemplul 6

Găsiți așteptările sale matematice, varianța și abaterea standard.

Această sarcină se găsește peste tot și, de regulă, nu are sens semnificativ.
Vă puteți imagina mai multe becuri cu cifre care se aprind într-un cămin de nebuni cu anumite probabilități :)

Soluţie: Este convenabil să rezumați calculele de bază într-un tabel. Mai întâi, scriem datele inițiale în primele două rânduri. Apoi calculăm produsele, apoi și în final sumele din coloana din dreapta:

De fapt, aproape totul este gata. A treia linie arată o așteptare matematică gata făcută: .

Calculăm varianța folosind formula:

Și în sfârșit, abaterea standard:
– Personal, de obicei rotunjesc la 2 zecimale.

Toate calculele pot fi efectuate pe un calculator sau chiar mai bine - în Excel:

E greu să greșești aici :)

Răspuns:

Cei care doresc își pot simplifica și mai mult viața și pot profita de mine calculator (demo), care nu numai că va rezolva instantaneu această problemă, ci și va construi grafică tematică (o sa ajungem acolo in curand). Programul poate fi descărcați din bibliotecă– dacă ați descărcat cel puțin un material educațional, sau primiți altă cale. Vă mulțumim pentru susținerea proiectului!

Câteva sarcini de rezolvat singur:

Exemplul 7

Calculați varianța variabilei aleatoare din exemplul anterior prin definiție.

Si un exemplu asemanator:

Exemplul 8

O variabilă aleatorie discretă este specificată de legea sa de distribuție:

Da, valorile variabilelor aleatoare pot fi destul de mari (exemplu din munca reală), și aici, dacă este posibil, folosiți Excel. Așa cum, apropo, în Exemplul 7 - este mai rapid, mai fiabil și mai plăcut.

Soluții și răspunsuri în partea de jos a paginii.

Pentru a încheia partea a 2-a a lecției, ne vom uita la o altă problemă tipică, s-ar putea spune chiar un mic puzzle:

Exemplul 9

O variabilă aleatoare discretă poate lua doar două valori: și , și . Probabilitatea, așteptările matematice și varianța sunt cunoscute.

Soluţie: Să începem cu o probabilitate necunoscută. Deoarece o variabilă aleatoare poate lua doar două valori, suma probabilităților evenimentelor corespunzătoare este:

iar de atunci .

Rămâne doar să găsești..., e ușor de spus :) Dar ei bine, iată. Prin definiția așteptărilor matematice:
– înlocuirea cantităților cunoscute:

– și nimic mai mult nu poate fi stors din această ecuație, cu excepția faptului că o puteți rescrie în direcția obișnuită:

sau:

Cred că poți ghici următorii pași. Să compunem și să rezolvăm sistemul:

Decimalele sunt, desigur, o totală rușine; înmulțiți ambele ecuații cu 10:

si imparti la 2:

Asa e mai bine. Din prima ecuație exprimăm:
(aceasta este calea mai ușoară)– înlocuiți în a doua ecuație:


Construim pătratși faceți simplificări:

Înmulțit cu:

Rezultatul a fost ecuație pătratică, găsim că este discriminant:
- Grozav!

și obținem două soluții:

1) dacă , Acea ;

2) dacă , Acea .

Condiția este îndeplinită de prima pereche de valori. Cu o probabilitate mare, totul este corect, dar, cu toate acestea, să notăm legea distribuției:

și efectuați o verificare, și anume, găsiți așteptarea:

Așteptarea matematică (valoarea medie) a unei variabile aleatoare X dată pe un spațiu de probabilitate discret este numărul m =M[X]=∑x i p i dacă seria converge absolut.

Scopul serviciului. Utilizarea serviciului online se calculează așteptările matematice, varianța și abaterea standard(vezi exemplu). În plus, este reprezentat grafic un grafic al funcției de distribuție F(X).

Proprietăți ale așteptării matematice a unei variabile aleatoare

  1. Așteptarea matematică a unei valori constante este egală cu sine: M[C]=C, C – constantă;
  2. M=C M[X]
  3. Așteptările matematice ale sumei variabilelor aleatoare este egală cu suma așteptărilor lor matematice: M=M[X]+M[Y]
  4. Așteptările matematice ale produsului variabilelor aleatoare independente este egală cu produsul așteptărilor lor matematice: M=M[X] M[Y] , dacă X și Y sunt independenți.

Proprietăți de dispersie

  1. Varianta unei valori constante este zero: D(c)=0.
  2. Factorul constant poate fi scos de sub semnul de dispersie prin pătratul: D(k*X)= k 2 D(X).
  3. Dacă variabilele aleatoare X și Y sunt independente, atunci varianța sumei este egală cu suma varianțelor: D(X+Y)=D(X)+D(Y).
  4. Dacă variabilele aleatoare X și Y sunt dependente: D(X+Y)=DX+DY+2(X-M[X])(Y-M[Y])
  5. Următoarea formulă de calcul este valabilă pentru dispersie:
    D(X)=M(X 2)-(M(X)) 2

Exemplu. Sunt cunoscute așteptările și variațiile matematice ale a două variabile aleatoare independente X și Y: M(x)=8, M(Y)=7, D(X)=9, D(Y)=6. Aflați așteptările matematice și varianța variabilei aleatoare Z=9X-8Y+7.
Soluţie. Pe baza proprietăților așteptărilor matematice: M(Z) = M(9X-8Y+7) = 9*M(X) - 8*M(Y) + M(7) = 9*8 - 8*7 + 7 = 23 .
Pe baza proprietăților dispersiei: D(Z) = D(9X-8Y+7) = D(9X) - D(8Y) + D(7) = 9^2D(X) - 8^2D(Y) + 0 = 81*9 - 64*6 = 345

Algoritm pentru calcularea așteptărilor matematice

Proprietăți ale variabilelor aleatoare discrete: toate valorile lor pot fi renumerotate prin numere naturale; Atribuiți fiecărei valori o probabilitate diferită de zero.
  1. Înmulțim perechile unul câte unul: x i cu p i .
  2. Adăugați produsul fiecărei perechi x i p i .
    De exemplu, pentru n = 4: m = ∑x i p i = x 1 p 1 + x 2 p 2 + x 3 p 3 + x 4 p 4
Funcția de distribuție a unei variabile aleatoare discrete treptat, ea crește brusc în acele puncte ale căror probabilități sunt pozitive.

Exemplul nr. 1.

x i 1 3 4 7 9
p i 0.1 0.2 0.1 0.3 0.3

Găsim așteptările matematice folosind formula m = ∑x i p i .
Așteptări M[X].
M[x] = 1*0,1 + 3*0,2 + 4*0,1 + 7*0,3 + 9*0,3 = 5,9
Găsim varianța folosind formula d = ∑x 2 i p i - M[x] 2 .
Varianta D[X].
D[X] = 1 2 *0,1 + 3 2 *0,2 + 4 2 *0,1 + 7 2 *0,3 + 9 2 *0,3 - 5,9 2 = 7,69
Abaterea standard σ(x).
σ = sqrt(D[X]) = sqrt(7,69) = 2,78

Exemplul nr. 2. O variabilă aleatorie discretă are următoarea serie de distribuție:

X -10 -5 0 5 10
R A 0,32 2A 0,41 0,03
Aflați valoarea lui a, așteptarea matematică și abaterea standard a acestei variabile aleatoare.

Soluţie. Valoarea lui a se găsește din relația: Σp i = 1
Σp i = a + 0,32 + 2 a + 0,41 + 0,03 = 0,76 + 3 a = 1
0,76 + 3 a = 1 sau 0,24=3 a , de unde a = 0,08

Exemplul nr. 3. Determinați legea distribuției unei variabile aleatoare discrete dacă varianța ei este cunoscută și x 1 x 1 =6; x 2 =9; x 3 =x; x 4 =15
p1 = 0,3; p2 = 0,3; p3 = 0,1; p 4 = 0,3
d(x)=12,96

Soluţie.
Aici trebuie să creați o formulă pentru a găsi varianța d(x):
d(x) = x 1 2 p 1 +x 2 2 p 2 +x 3 2 p 3 +x 4 2 p 4 -m(x) 2
unde așteptarea m(x)=x 1 p 1 +x 2 p 2 +x 3 p 3 +x 4 p 4
Pentru datele noastre
m(x)=6*0,3+9*0,3+x 3 *0,1+15*0,3=9+0,1x 3
12,96 = 6 2 0,3+9 2 0,3+x 3 2 0,1+15 2 0,3-(9+0,1x 3) 2
sau -9/100 (x 2 -20x+96)=0
În consecință, trebuie să găsim rădăcinile ecuației și vor fi două dintre ele.
x 3 =8, x 3 =12
Alegeți-l pe cel care îndeplinește condiția x 1 x 3 =12

Legea distribuției unei variabile aleatoare discrete
x 1 =6; x 2 =9; x 3 =12; x 4 =15
p1 = 0,3; p2 = 0,3; p3 = 0,1; p 4 = 0,3

Această pagină descrie un exemplu standard de găsire a varianței, puteți, de asemenea, să vă uitați la alte probleme pentru a o găsi

Exemplul 1. Determinarea grupului, mediei grupului, intergrupurilor și varianței totale

Exemplul 2. Găsirea varianței și coeficientului de variație într-un tabel de grupare

Exemplul 3. Găsirea varianței într-o serie discretă

Exemplul 4. Următoarele date sunt disponibile pentru un grup de 20 de studenți prin corespondență. Este necesar să se construiască o serie de intervale a distribuției caracteristicii, să se calculeze valoarea medie a caracteristicii și să se studieze dispersia acesteia

Să construim o grupare de intervale. Să determinăm intervalul intervalului folosind formula:

unde X max este valoarea maximă a caracteristicii de grupare;
X min – valoarea minimă a caracteristicii de grupare;
n – numărul de intervale:

Acceptăm n=5. Pasul este: h = (192 - 159)/ 5 = 6,6

Să creăm o grupare de intervale

Pentru calcule suplimentare, vom construi un tabel auxiliar:

X"i – mijlocul intervalului. (de exemplu, mijlocul intervalului 159 – 165,6 = 162,3)

Determinăm înălțimea medie a elevilor folosind formula medie aritmetică ponderată:

Să determinăm varianța folosind formula:

Formula poate fi transformată astfel:

Din această formulă rezultă că varianța este egală cu diferența dintre media pătratelor opțiunilor și pătratul și media.

Dispersie în serie de variații cu intervale egale folosind metoda momentelor se poate calcula în felul următor folosind a doua proprietate a dispersiei (împărțirea tuturor opțiunilor la valoarea intervalului). Determinarea varianței, calculat folosind metoda momentelor, folosind următoarea formulă este mai puțin laborioasă:

unde i este valoarea intervalului;
A este un zero convențional, pentru care este convenabil să se folosească mijlocul intervalului cu cea mai mare frecvență;
m1 este pătratul momentului de ordinul întâi;
m2 - moment de ordinul doi

Varianta alternativă a trăsăturilor (dacă într-o populație statistică o caracteristică se modifică în așa fel încât există doar două opțiuni care se exclud reciproc, atunci o astfel de variabilitate se numește alternativă) poate fi calculată folosind formula:

Înlocuind q = 1- p în această formulă de dispersie, obținem:

Tipuri de variație

Varianta totala măsoară variația unei caracteristici la nivelul întregii populații în ansamblu sub influența tuturor factorilor care provoacă această variație. Este egal cu pătratul mediu al abaterilor valorilor individuale ale unei caracteristici x de la valoarea medie globală a lui x și poate fi definită ca varianță simplă sau varianță ponderată.

Varianta în cadrul grupului caracterizează variația aleatoare, adică parte a variației care se datorează influenței factorilor necontabiliați și nu depinde de atributul-factorial care formează baza grupului. O astfel de dispersie este egală cu pătratul mediu al abaterilor valorilor individuale ale atributului din grupul X de la media aritmetică a grupului și poate fi calculată ca dispersie simplă sau ca dispersie ponderată.



Prin urmare, măsuri de variație în cadrul grupului variația unei trăsături în cadrul unui grup și este determinată de formula:

unde xi este media grupului;
ni este numărul de unități din grup.

De exemplu, variațiile intragrup care trebuie determinate în sarcina de a studia influența calificărilor lucrătorilor asupra nivelului productivității muncii într-un atelier arată variații ale producției în fiecare grup cauzate de toți factorii posibili (starea tehnică a echipamentului, disponibilitatea instrumente și materiale, vârsta lucrătorilor, intensitatea muncii etc.), cu excepția diferențelor de categorie de calificare (în cadrul unui grup toți lucrătorii au aceleași calificări).

Să calculăm înDOMNIȘOARĂEXCELAvarianța eșantionului și abaterea standard. Vom calcula, de asemenea, varianța unei variabile aleatoare dacă distribuția ei este cunoscută.

Să luăm în considerare mai întâi dispersie, apoi deviație standard.

Varianta eșantionului

Varianta eșantionului (varianța eșantionului,probăvarianţă) caracterizează răspândirea valorilor în matrice relativ la .

Toate cele 3 formule sunt echivalente din punct de vedere matematic.

Din prima formulă este clar că varianța eșantionului este suma abaterilor pătrate ale fiecărei valori din matrice de la medie, împărțit la dimensiunea eșantionului minus 1.

variaţiile mostre se folosește funcția DISP(), engleză. numele VAR, adică Varianta. Din versiunea MS EXCEL 2010, se recomandă utilizarea analogului său DISP.V(), engleză. numele VARS, adică Varianta eșantionului. În plus, începând cu versiunea de MS EXCEL 2010, există o funcție DISP.Г(), engleză. numele VARP, adică Varianta populației, care calculează dispersie Pentru populatie. Întreaga diferență se reduce la numitor: în loc de n-1 ca DISP.V(), DISP.G() are doar n în numitor. Înainte de MS EXCEL 2010, funcția VAR() a fost utilizată pentru a calcula varianța populației.

Varianta eșantionului
=QUADROTCL(Eșantion)/(COUNT(Eșantion)-1)
=(SUMA(Eșantion)-COUNT(Eșantion)*MEDIE(Eșantion)^2)/ (NUMĂR(Eșantion)-1)– formula uzuală
=SUMA((Eșantion -MEDIE(Eșantion))^2)/ (NUMĂR (Eșantion)-1) –

Varianta eșantionului este egal cu 0, numai dacă toate valorile sunt egale între ele și, în consecință, egale valoarea medie. De obicei, cu cât valoarea este mai mare variaţiile, cu atât este mai mare răspândirea valorilor în matrice.

Varianta eșantionului este o estimare punctuala variaţiile distribuţia variabilei aleatoare din care a fost făcută probă. Despre construcție intervale de încredere la evaluare variaţiile poate fi citit in articol.

Varianta unei variabile aleatoare

A calcula dispersie variabilă aleatoare, trebuie să o știți.

Pentru variaţiile variabila aleatoare X este adesea desemnată Var(X). Dispersia egal cu pătratul abaterii de la medie E(X): Var(X)=E[(X-E(X)) 2 ]

dispersie calculat prin formula:

unde x i este valoarea pe care o poate lua o variabilă aleatoare și μ este valoarea medie (), p(x) este probabilitatea ca variabila aleatoare să ia valoarea x.

Dacă o variabilă aleatoare are , atunci dispersie calculat prin formula:

Dimensiune variaţiile corespunde pătratului unității de măsură a valorilor inițiale. De exemplu, dacă valorile din eșantion reprezintă măsurători ale greutății părții (în kg), atunci dimensiunea varianței ar fi kg 2 . Acest lucru poate fi dificil de interpretat, deci pentru a caracteriza răspândirea valorilor, o valoare egală cu rădăcina pătrată a variaţiiledeviație standard.

Unele proprietăți variaţiile:

Var(X+a)=Var(X), unde X este o variabilă aleatoare și a este o constantă.

Var(aХ)=a 2 Var(X)

Var(X)=E[(X-E(X)) 2 ]=E=E(X 2)-E(2*X*E(X))+(E(X)) 2 =E(X 2)- 2*E(X)*E(X)+(E(X)) 2 =E(X 2)-(E(X)) 2

Această proprietate de dispersie este utilizată în articol despre regresia liniară.

Var(X+Y)=Var(X) + Var(Y) + 2*Cov(X;Y), unde X și Y sunt variabile aleatoare, Cov(X;Y) este covarianța acestor variabile aleatoare.

Dacă variabilele aleatoare sunt independente, atunci ele covarianta este egal cu 0 și, prin urmare, Var(X+Y)=Var(X)+Var(Y). Această proprietate de dispersie este utilizată în derivare.

Să arătăm că pentru mărimi independente Var(X-Y)=Var(X+Y). Într-adevăr, Var(X-Y)= Var(X-Y)= Var(X+(-Y))= Var(X)+Var(-Y)= Var(X)+Var(-Y)= Var(X)+(- 1) 2 Var(Y)= Var(X)+Var(Y)= Var(X+Y). Această proprietate de dispersie este utilizată pentru a construi .

Deviația standard a eșantionului

Deviația standard a eșantionului este o măsură a cât de larg sunt împrăștiate valorile dintr-un eșantion în raport cu .

A-priorie, deviație standard egal cu rădăcina pătrată a variaţiile:

Deviație standard nu ține cont de mărimea valorilor în probă, ci doar gradul de dispersie a valorilor din jurul lor in medie. Pentru a ilustra acest lucru, să dăm un exemplu.

Să calculăm abaterea standard pentru 2 eșantioane: (1; 5; 9) și (1001; 1005; 1009). În ambele cazuri, s=4. Este evident că raportul dintre abaterea standard și valorile matricei diferă semnificativ între eșantioane. Pentru astfel de cazuri este folosit Coeficientul de variație(Coeficient de variație, CV) - raport Deviație standard la medie aritmetic, exprimat ca procent.

În MS EXCEL 2007 și versiuni anterioare pentru calcul Deviația standard a eșantionului se folosește funcția =STDEVAL(), engleză. numele STDEV, adică Deviație standard. Din versiunea MS EXCEL 2010, se recomandă utilizarea analogului său =STDEV.B() , engleză. numele STDEV.S, adică Exemplu de deviare standard.

În plus, începând cu versiunea de MS EXCEL 2010, există o funcție STANDARDEV.G(), engleză. numele STDEV.P, adică Deviația standard a populației, care calculează deviație standard Pentru populatie. Toată diferența se reduce la numitor: în loc de n-1 ca în STANDARDEV.V(), STANDARDEVAL.G() are doar n în numitor.

Deviație standard poate fi calculat și direct folosind formulele de mai jos (vezi fișierul exemplu)
=ROOT(QUADROTCL(Eșantion)/(COUNT(Eșantion)-1))
=ROOT((SUMA(Eșantion)-NUMĂR (Eșantion)*MEDIA(Eșantion)^2)/(NUMĂR (Eșantion)-1))

Alte măsuri de împrăștiere

Funcția SQUADROTCL() calculează cu o sumă a abaterilor pătrate ale valorilor de la acestea in medie. Această funcție va returna același rezultat ca și formula =DISP.G( Probă)*VERIFICA( Probă) , Unde Probă- o referință la un interval care conține o matrice de valori ale eșantionului (). Calculele în funcția QUADROCL() se fac după formula:

Funcția SROTCL() este, de asemenea, o măsură a răspândirii unui set de date. Funcția SROTCL() calculează media valorilor absolute a abaterilor valorilor de la in medie. Această funcție va returna același rezultat ca și formula =SUMPRODUS(ABS(Eșantion-MEDIE(Eșantion)))/COUNT(Eșantion), Unde Probă- o legătură către un interval care conține o serie de valori eșantion.

Calculele în funcția SROTCL () se fac după formula: