Valorile obținute din experiență conțin inevitabil erori din cauza unei game largi de motive. Printre acestea, ar trebui să se facă distincția între erorile sistematice și aleatorii. Erorile sistematice sunt cauzate de motive care acționează într-un mod foarte specific și pot fi întotdeauna eliminate sau luate în considerare destul de precis. Erorile aleatorii sunt cauzate de un număr foarte mare de cauze individuale care nu pot fi explicate cu acuratețe și care acționează în moduri diferite în fiecare măsurătoare individuală. Aceste erori nu pot fi excluse complet; pot fi luate în considerare doar în medie, pentru care este necesar să se cunoască legile care guvernează erorile aleatorii.

Vom nota mărimea măsurată cu A și eroare aleatorie la măsurarea x. Deoarece eroarea x poate lua orice valoare, este o variabilă aleatoare continuă, care este pe deplin caracterizată de legea sa de distribuție.

Cea mai simplă și care reflectă cel mai exact realitatea (în marea majoritate a cazurilor) este așa-numita legea normală de distribuție a erorilor:

Această lege de distribuție poate fi obținută din diverse premise teoretice, în special din cerința ca cea mai probabilă valoare a unei mărimi necunoscute pentru care se obține o serie de valori cu același grad de precizie prin măsurare directă este media aritmetică a aceste valori. Se numește cantitatea 2 dispersie a acestei legi normale.

In medie

Determinarea dispersiei din datele experimentale. Dacă pentru orice valoare A, n valori a i sunt obținute prin măsurare directă cu același grad de precizie și dacă erorile valorii A sunt supuse legii distribuției normale, atunci cea mai probabilă valoare a lui A va fi in medie:

a - medie aritmetică,

a i - valoare măsurată la pasul i.

Abaterea valorii observate (pentru fiecare observatie) a i a valorii A de la medie aritmetică: a i - a.

Pentru a determina varianța legii distribuției normale a erorilor în acest caz, utilizați formula:

2 - dispersie,
a - medie aritmetică,
n - numărul de măsurători ale parametrilor,

Deviație standard

Deviație standard arată abaterea absolută a valorilor măsurate de la medie aritmetică. În conformitate cu formula pentru măsurarea preciziei unei combinații liniare eroare pătrată medie Media aritmetică este determinată de formula:

, Unde


a - medie aritmetică,
n - numărul de măsurători ale parametrilor,
a i - valoare măsurată la pasul i.

Coeficientul de variație

Coeficientul de variație caracterizează măsura relativă a abaterii valorilor măsurate de la medie aritmetică:

, Unde

V - coeficient de variație,
- deviație standard,
a - medie aritmetică.

Cu cât valoarea este mai mare coeficient de variație, cu cât este relativ mai mare dispersia și uniformitatea mai mică a valorilor studiate. Dacă coeficientul de variație mai puțin de 10%, apoi variabilitate serie de variații este considerat a fi nesemnificativ, de la 10% la 20% este considerat mediu, mai mult de 20% și mai puțin de 33% este considerat semnificativ și dacă coeficientul de variație depășește 33%, aceasta indică eterogenitatea informațiilor și necesitatea excluderii celor mai mari și mai mici valori.

Abaterea liniară medie

Unul dintre indicatorii amplorii și intensității variației este abaterea liniară medie(modul de abatere medie) de la media aritmetică. Abaterea liniară medie calculat prin formula:

, Unde

_
a - abaterea liniară medie,
a - medie aritmetică,
n - numărul de măsurători ale parametrilor,
a i - valoare măsurată la pasul i.

Pentru a verifica conformitatea valorilor studiate cu legea distribuției normale, se utilizează relația indicator de asimetrie la greşeala şi atitudinea lui indicator de curtoză spre greşeala lui.

Indicator de asimetrie

Indicator de asimetrie(A) și eroarea sa (m a) se calculează folosind următoarele formule:

, Unde

A - indicator de asimetrie,
- deviație standard,
a - medie aritmetică,
n - numărul de măsurători ale parametrilor,
a i - valoare măsurată la pasul i.

Indicator de kurtoză

Indicator de kurtoză(E) și eroarea acesteia (m e) se calculează folosind următoarele formule:

, Unde

Pentru a calcula media geometrică simplă, se utilizează formula:

ponderat geometric

Pentru a determina media geometrică ponderată, se utilizează formula:

Diametrele medii ale roților, țevilor și laturile medii ale pătratelor sunt determinate folosind pătratul mediu.

Valorile pătrate medii sunt utilizate pentru a calcula unii indicatori, de exemplu, coeficientul de variație, care caracterizează ritmul de producție. Aici abaterea standard de la producția planificată pentru o anumită perioadă este determinată folosind următoarea formulă:

Aceste valori caracterizează cu exactitate modificarea indicatorilor economici în comparație cu valoarea lor de bază, luată în valoarea medie.

Quadratic simplu

Rădăcina medie pătrată se calculează folosind formula:

Ponderat cuadratic

Pătratul mediu ponderat este egal cu:

22. Indicatorii absoluti de variație includ:

gama de variatie

abaterea liniară medie

dispersie

deviație standard

Interval de variație (r)

Gama de variație- este diferența dintre valorile maxime și minime ale atributului

Ea arată limitele în care se modifică valoarea unei caracteristici în populația studiată.

Experiența de muncă a celor cinci solicitanți în munca anterioară este: 2,3,4,7 și 9 ani. Rezolvare: interval de variație = 9 - 2 = 7 ani.

Pentru o descriere generalizată a diferențelor în valorile atributelor, indicatorii de variație medie sunt calculate pe baza luării în considerare a abaterilor de la media aritmetică. Diferența este luată ca o abatere de la medie.

În acest caz, pentru a evita ca suma abaterilor variantelor unei caracteristici de la cotitura medie la zero (proprietatea zero a mediei), trebuie fie să ignorăm semnele abaterii, adică să luăm această sumă modulo , fie pătratează valorile abaterii

Abaterea medie liniară și pătrată

Abaterea liniară medie este media aritmetică a abaterilor absolute ale valorilor individuale ale unei caracteristici de la medie.

Abaterea liniară medie este simplă:

Experiența de muncă a celor cinci solicitanți în munca anterioară este: 2,3,4,7 și 9 ani.

În exemplul nostru: ani;

Răspuns: 2,4 ani.

Abaterea liniară medie ponderată se aplică datelor grupate:

Datorită convenției sale, abaterea liniară medie este utilizată în practică relativ rar (în special, pentru a caracteriza îndeplinirea obligațiilor contractuale privind uniformitatea livrării; în analiza calității produsului, ținând cont de caracteristicile tehnologice ale producției).

Deviație standard

Cea mai perfectă caracteristică a variației este deviația pătrată medie, care se numește standard (sau abatere standard). Deviație standard() este egal cu rădăcina pătrată a abaterii pătrate medii a valorilor individuale ale atributului medie aritmetică:

Abaterea standard este simplă:

Abaterea standard ponderată se aplică datelor grupate:

Între pătratul mediu și abaterile liniare medii în condiții normale de distribuție apare următorul raport: ~ 1,25.

Abaterea standard, fiind principala măsură absolută a variației, este utilizată la determinarea valorilor ordonate ale unei curbe de distribuție normală, în calculele legate de organizarea observării eșantionului și stabilirea acurateței caracteristicilor eșantionului, precum și la evaluarea limitele de variație ale unei caracteristici într-o populație omogenă.

Așteptări și variații

Să măsurăm o variabilă aleatoare N de ori, de exemplu, măsurăm viteza vântului de zece ori și dorim să găsim valoarea medie. Cum este valoarea medie legată de funcția de distribuție?

Să aruncăm zarurile un numar mare de o singura data. Numărul de puncte care vor apărea pe zar la fiecare aruncare este o variabilă aleatorie și poate lua orice valoare naturală de la 1 la 6. Media aritmetică a punctelor pierdute calculate pentru toate aruncările de zaruri este, de asemenea, o variabilă aleatorie, dar pentru mari N tinde spre un număr foarte specific – așteptarea matematică M x. În acest caz M x = 3,5.

Cum ai obținut această valoare? Lăsa să intre N teste, odată ce obțineți 1 punct, odată ce obțineți 2 puncte și așa mai departe. Apoi când N→ ∞ numărul de rezultate în care a fost aruncat un punct, În mod similar, Prin urmare

Modelul 4.5. Zaruri

Să presupunem acum că cunoaștem legea distribuției variabilă aleatorie X, adică știm că variabila aleatoare X poate lua valori X 1 , X 2 , ..., x k cu probabilităţi p 1 , p 2 , ..., p k.

Valorea estimata M x variabilă aleatorie X este egal cu:

Răspuns. 2,8.

Așteptările matematice nu sunt întotdeauna o estimare rezonabilă a unei variabile aleatorii. Deci, pentru a estima media salariile este mai rezonabil să folosim conceptul de mediană, adică o astfel de valoare încât numărul de persoane care primesc un salariu mai mic decât mediana și unul mai mare să coincidă.

Median variabila aleatoare se numeste numar X 1/2 este astfel încât p (X < X 1/2) = 1/2.

Cu alte cuvinte, probabilitatea p 1 că variabila aleatoare X va fi mai mic X 1/2, și probabilitate p 2 că variabila aleatoare X va fi mai mare X 1/2 sunt identice și egale cu 1/2. Mediana nu este determinată în mod unic pentru toate distribuțiile.

Să revenim la variabila aleatoare X, care poate lua valori X 1 , X 2 , ..., x k cu probabilităţi p 1 , p 2 , ..., p k.

Varianta variabilă aleatorie X este valoarea medie a abaterii pătrate a unei variabile aleatoare de la ea așteptări matematice:

Exemplul 2

În condițiile exemplului anterior, calculați varianța și abaterea standard a variabilei aleatoare X.

Răspuns. 0,16, 0,4.

Modelul 4.6. Trage într-o țintă

Exemplul 3

Aflați distribuția de probabilitate a numărului de puncte care apar pe zaruri la prima aruncare, mediana, așteptările matematice, varianța și deviație standard.

Orice margine este la fel de probabil să cadă, deci distribuția va arăta astfel:

Abaterea standard Se poate observa că abaterea valorii de la valoarea medie este foarte mare.

Proprietățile așteptărilor matematice:

  • Așteptările matematice ale sumei variabilelor aleatoare independente este egală cu suma așteptărilor lor matematice:

Exemplul 4

Aflați așteptările matematice ale sumei și produsului punctelor aruncate pe două zaruri.

În exemplul 3 am găsit că pentru un cub M (X) = 3,5. Deci pentru două cuburi

Proprietăți de dispersie:

  • Varianța sumei variabilelor aleatoare independente este egală cu suma varianțelor:

Dx + y = Dx + Dy.

Lasă pt N aruncări pe zarurile aruncate y puncte. Apoi

Acest rezultat este valabil nu numai pentru aruncările de zaruri. În multe cazuri, determină acuratețea măsurării empirice a așteptărilor matematice. Se poate observa că odată cu creșterea numărului de măsurători N răspândirea valorilor în jurul mediei, adică abaterea standard, scade proporțional

Varianta unei variabile aleatoare este legată de așteptarea matematică a pătratului acestei variabile aleatoare prin următoarea relație:

Să găsim așteptările matematice ale ambelor părți ale acestei egalități. A-priorie,

Așteptarea matematică a părții drepte a egalității, conform proprietății așteptărilor matematice, este egală cu

Deviație standard

Deviație standard egal cu rădăcina pătrată a varianței:
La determinarea abaterii standard pentru un volum suficient de mare al populației studiate (n > 30), se folosesc următoarele formule:

Informații conexe.


X i - variabile aleatoare (actuale);

X valoarea medie a variabilelor aleatoare pentru eșantion se calculează folosind formula:

Asa de, varianța este pătratul mediu al abaterilor . Adică, valoarea medie este mai întâi calculată, apoi luată diferența dintre fiecare valoare originală și valoarea medie este pătrat , se adaugă și apoi se împarte la numărul de valori din populație.

Diferența dintre o valoare individuală și medie reflectă măsura abaterii. Este pătrat astfel încât toate abaterile să devină exclusiv numere pozitive și pentru a evita distrugerea reciprocă a abaterilor pozitive și negative atunci când le însumăm. Apoi, având în vedere abaterile pătrate, calculăm pur și simplu media aritmetică.

Răspunsul la cuvântul magic „dispersie” constă doar în aceste trei cuvinte: medie - pătrat - abateri.

Abaterea standard (MSD)

Extragerea din varianță Rădăcină pătrată, primim așa-numitul „ deviație standard". Sunt nume „abatere standard” sau „sigma” (de la numele literei grecești σ .). Formula medie abatere pătrată are forma:

Asa de, dispersia este pătrat sigma sau abaterea standard este pătrat.

Deviația standard, evident, caracterizează și măsura dispersiei datelor, dar acum (spre deosebire de dispersie) poate fi comparată cu datele originale, deoarece au aceleași unități de măsură (acest lucru este clar din formula de calcul). Intervalul de variație este diferența dintre valorile extreme. Deviația standard, ca măsură a incertitudinii, este, de asemenea, implicată în multe calcule statistice. Cu ajutorul acestuia, se determină gradul de acuratețe al diferitelor estimări și prognoze. Dacă variația este foarte mare, atunci și abaterea standard va fi mare și, prin urmare, prognoza va fi inexactă, ceea ce va fi exprimat, de exemplu, în intervale de încredere foarte largi.

Prin urmare, în metodele de prelucrare a datelor statistice în evaluările imobiliare, în funcție de acuratețea cerută a sarcinii, se utilizează regula două sau trei sigma.

Pentru a compara regula două sigma și regula trei sigma, folosim formula lui Laplace:

F - F,

unde Ф(x) este funcția Laplace;



Valoarea minima

β = valoarea maximă

s = valoarea sigma (deviația standard)

a = medie

În acest caz se folosește vedere privată Formula lui Laplace când limitele α și β ale valorilor variabilei aleatoare X sunt distanțate egal de centrul distribuției a = M(X) de o anumită valoare d: a = a-d, b = a+d. Sau (1) Formula (1) determină probabilitatea unei abateri date d a unei variabile aleatoare X c legea normală distribuția din așteptarea sa matematică M(X) = a. Dacă în formula (1) luăm succesiv d = 2s și d = 3s, obținem: (2), (3).

Regula două sigma

Poate fi aproape sigur (cu o probabilitate de încredere de 0,954) ca toate valorile unei variabile aleatoare X cu o lege de distribuție normală să devieze de la așteptarea sa matematică M(X) = a cu o sumă nu mai mare de 2s (două abateri standard) ). Probabilitatea de încredere (Pd) este probabilitatea evenimentelor care sunt acceptate convențional ca fiabile (probabilitatea lor este apropiată de 1).

Să ilustrăm geometric regula două sigma. În fig. Figura 6 prezintă o curbă Gaussiană cu centrul de distribuție a. Aria delimitată de întreaga curbă și de axa Ox este 1 (100%), iar aria trapez curbatîntre abscisele a–2s și a+2s, conform regulii două sigma, este egal cu 0,954 (95,4% din suprafața totală). Aria zonelor umbrite este 1-0,954 = 0,046 (»5% din suprafața totală). Aceste zone sunt numite regiunea critică a variabilei aleatoare. Valorile unei variabile aleatorii care se încadrează în regiunea critică sunt puțin probabile și, în practică, sunt acceptate convențional ca imposibile.

Probabilitatea unor valori imposibile condiționat se numește nivelul de semnificație al unei variabile aleatorii. Nivelul de semnificație este legat de probabilitatea de încredere prin formula:

unde q este nivelul de semnificație exprimat ca procent.

Regula trei sigma

La rezolvarea problemelor care necesită o mai mare fiabilitate, atunci când probabilitatea de încredere (Pd) este luată egală cu 0,997 (mai precis, 0,9973), în locul regulii două sigma, conform formulei (3), se utilizează regula trei sigma



Conform regula trei sigma la probabilitatea de încredere 0,9973 zona critică va fi zona valorilor atributelor în afara intervalului (a-3s, a+3s). Nivelul de semnificație este de 0,27%.

Cu alte cuvinte, probabilitatea ca valoare absolută abaterile vor depasi de trei ori deviatia standard, foarte mica, si anume egala cu 0,0027 = 1-0,9973. Aceasta înseamnă că doar 0,27% din cazuri se va întâmpla acest lucru. Astfel de evenimente, bazate pe principiul imposibilității unor evenimente improbabile, pot fi considerate practic imposibile. Acestea. eșantionarea este foarte precisă.

Aceasta este esența regulii trei sigma:

Dacă o variabilă aleatoare este distribuită normal, atunci valoarea absolută a abaterii ei de la așteptările matematice nu depășește de trei ori abaterea standard (MSD).

În practică, regula trei sigma se aplică după cum urmează: dacă nu se cunoaște distribuția variabilei aleatoare care este studiată, dar este îndeplinită condiția specificată în regula de mai sus, atunci există motive să presupunem că variabila studiată este distribuită în mod normal. ; altfel nu este distribuit în mod normal.

Nivelul de semnificație este luat în funcție de gradul de risc permis și de sarcina la îndemână. Pentru evaluarea imobilelor se adoptă de obicei un eșantion mai puțin precis, urmând regula două sigma.

Deviație standard(sinonime: deviație standard, deviație standard, abatere pătrată; termeni conexe: deviație standard, spread standard) - în teoria probabilităților și statistică, cel mai comun indicator al dispersării valorilor unei variabile aleatoare în raport cu așteptarea sa matematică. Cu matrice limitate de mostre de valori, în loc de așteptarea matematică, se folosește media aritmetică a setului de eșantioane.

YouTube enciclopedic

  • 1 / 5

    Abaterea standard se măsoară în unități de măsură ale variabilei aleatoare în sine și este utilizată la calcularea erorii standard a mediei aritmetice, la construirea intervalelor de încredere, la testarea statistică a ipotezelor, la măsurarea relației liniare dintre variabilele aleatoare. Definit ca rădăcina pătrată a varianței unei variabile aleatoare.

    Deviație standard:

    s = n n − 1 σ 2 = 1 n − 1 ∑ i = 1 n (x i − x ¯) 2 ; (\displaystyle s=(\sqrt ((\frac (n)(n-1))\sigma ^(2)))=(\sqrt ((\frac (1)(n-1))\sum _( i=1)^(n)\left(x_(i)-(\bar (x))\right)^(2)));)
    • Notă: Foarte des există discrepanțe în denumirile MSD (Root Mean Square Deviation) și STD (Standard Deviation) cu formulele lor. De exemplu, în modulul numPy al limbajului de programare Python, funcția std() este descrisă ca „abatere standard”, în timp ce formula reflectă abaterea standard (diviziunea după rădăcina eșantionului). În Excel, funcția STANDARDEVAL() este diferită (diviziunea la rădăcina lui n-1).

    Deviație standard(estimarea abaterii standard a unei variabile aleatoare X raportat la așteptările sale matematice bazate pe o estimare imparțială a varianței sale) s (\displaystyle s):

    σ = 1 n ∑ i = 1 n (x i − x ¯) 2 . (\displaystyle \sigma =(\sqrt ((\frac (1)(n))\sum _(i=1)^(n)\stanga(x_(i)-(\bar (x))\dreapta) ^(2))).)

    Unde σ 2 (\displaystyle \sigma ^(2))- dispersie; x i (\displaystyle x_(i)) - i al-lea element al selecției; n (\displaystyle n)- marime de mostra; - media aritmetică a eșantionului:

    x ¯ = 1 n ∑ i = 1 n x i = 1 n (x 1 + … + x n) . (\displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\ldots +x_(n)).)

    Trebuie remarcat faptul că ambele estimări sunt părtinitoare. ÎN caz general Este imposibil să construiți o estimare imparțială. Cu toate acestea, estimarea bazată pe estimarea variației imparțiale este consecventă.

    În conformitate cu GOST R 8.736-2011, abaterea standard este calculată folosind a doua formulă a acestei secțiuni. Vă rugăm să verificați rezultatele.

    Regula trei sigma

    Regula trei sigma (3 σ (\displaystyle 3\sigma )) - aproape toate valorile unei variabile aleatoare distribuite normal se află în interval (x ¯ - 3 σ ; x ¯ + 3 σ) (\displaystyle \left((\bar (x))-3\sigma;(\bar (x))+3\sigma \right)). Mai strict - cu probabilitate de aproximativ 0,9973, valoarea unei variabile aleatoare distribuite normal se află în intervalul specificat (cu condiția ca valoarea x ¯ (\displaystyle (\bar (x))) adevărat și nu obținut ca urmare a prelucrării probei).

    Dacă valoarea adevărată x ¯ (\displaystyle (\bar (x))) este necunoscut, atunci nu trebuie să utilizați σ (\displaystyle \sigma ), A s. Prin urmare, regula de trei sigma este convertită la regula de trei s .

    Interpretarea valorii abaterii standard

    O valoare mai mare a deviației standard arată o răspândire mai mare a valorilor în setul prezentat cu valoarea medie a setului; o valoare mai mică, în consecință, arată că valorile din set sunt grupate în jurul valorii medii.

    De exemplu, avem trei seturi de numere: (0, 0, 14, 14), (0, 6, 8, 14) și (6, 6, 8, 8). Toate cele trei seturi au valori medii egale cu 7 și, respectiv, abateri standard egale cu 7, 5 și 1. Ultimul set are o abatere standard mică, deoarece valorile din set sunt grupate în jurul valorii medii; primul set are cel mai mult mare importanță abaterea standard - valorile din cadrul setului diferă foarte mult de valoarea medie.

    Într-un sens general, abaterea standard poate fi considerată o măsură a incertitudinii. De exemplu, în fizică, abaterea standard este utilizată pentru a determina eroarea unei serii de măsurători succesive a unei cantități. Această valoare este foarte importantă pentru determinarea plauzibilității fenomenului studiat în comparație cu valoarea prezisă de teorie: dacă valoarea medie a măsurătorilor diferă mult de valorile prezise de teorie (deviație standard mare), atunci valorile obținute sau metoda de obținere a acestora trebuie reverificate. identificate cu riscul de portofoliu.

    Climat

    Să presupunem că există două orașe cu aceeași temperatură medie zilnică maximă, dar unul este situat pe coastă, iar celălalt pe câmpie. Se știe că orașele situate pe coastă au multe temperaturi maxime diurne diferite, care sunt mai scăzute decât orașele situate în interior. Prin urmare, abaterea standard a temperaturilor maxime zilnice pentru un oraș de coastă va fi mai mică decât pentru un al doilea oraș, în ciuda faptului că valoarea medie a acestora este aceeași, ceea ce înseamnă, în practică, că probabilitatea ca Temperatura maxima aerul fiecărei zile specifice a anului va diferi mai mult de valoarea medie, mai mare pentru un oraș situat în interiorul continentului.

    Sport

    Să presupunem că există mai multe echipe de fotbal care sunt evaluate în funcție de un set de parametri, de exemplu, numărul de goluri marcate și primite, șanse de gol etc. Cel mai probabil, cea mai bună echipă din această grupă va avea cele mai bune valori conform mai multor parametri. Cu cât abaterea standard a echipei pentru fiecare dintre parametrii prezentați este mai mică, cu atât rezultatul echipei este mai previzibil; astfel de echipe sunt echilibrate. Pe de altă parte, echipa cu de mare valoare abaterea standard este dificil de prezis rezultatul, care, la rândul său, se explică prin dezechilibru, de exemplu, apărare puternică, dar cu un atac slab.

    Utilizarea abaterii standard a parametrilor echipei face posibilă, într-o măsură sau alta, să se prezică rezultatul unui meci între două echipe, evaluând punctele forte și părţile slabe comenzile și deci metodele alese de luptă.