O serie de variații discrete este construită pentru caracteristici discrete.

Pentru a construi o serie de variații discrete, trebuie să efectuați următorii pași: 1) aranjați unitățile de observație în ordinea crescătoare a valorii studiate a caracteristicii,

2) determinați toate valorile posibile ale atributului x i, aranjați-le în ordine crescătoare,

valoarea atributului, i .

frecvența valorii atributului si denota f i . Suma tuturor frecvențelor unei serii este egală cu numărul de elemente din populația studiată.

Exemplul 1 .

Lista notelor primite de elevi la examene: 3; 4; 3; 5; 4; 2; 2; 4; 4; 3; 5; 2; 4; 5; 4; 3; 4; 3; 3; 4; 4; 2; 2; 5; 5; 4; 5; 2; 3; 4; 4; 3; 4; 5; 2; 5; 5; 4; 3; 3; 4; 2; 4; 4; 5; 4; 3; 5; 3; 5; 4; 4; 5; 4; 4; 5; 4; 5; 5; 5.

Iată numărul X - notaeste discret variabilă aleatorie, iar lista rezultată de evaluări estedate statistice (observabile). .

    aranjați unitățile de observație în ordinea crescătoare a valorii caracteristice studiate:

2; 2; 2; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5.

2) determinați toate valorile posibile ale atributului x i, ordonați-le în ordine crescătoare:

În acest exemplu, toate estimările pot fi împărțite în patru grupe cu următoarele valori: 2; 3; 4; 5.

Se numește valoarea unei variabile aleatoare corespunzătoare unui anumit grup de date observate valoarea atributului, opțiune (opțiune) și desemnează x i .

Se numește un număr care arată de câte ori apare valoarea corespunzătoare a unei caracteristici într-un număr de observații frecvența valorii atributului si denota f i .

Pentru exemplul nostru

apare scorul 2 - de 8 ori,

apare scorul 3 - de 12 ori,

apare scorul 4 - de 23 de ori,

apare scorul 5 - de 17 ori.

Există 60 de evaluări în total.

4) scrieți datele primite într-un tabel de două rânduri (coloane) - x i și f i.

Pe baza acestor date, este posibil să se construiască o serie de variații discrete

Serii de variații discrete – acesta este un tabel în care valorile apărute ale caracteristicii studiate sunt indicate ca valori individuale în ordine crescătoare și frecvențele acestora

  1. Construirea unei serii de variații de interval

Pe lângă discret serie de variații Un mod comun de grupare a datelor este o serie de variații de interval.

O serie de intervale este construită dacă:

    semnul are o natură continuă de schimbare;

    Au fost o mulțime de valori discrete (mai mult de 10)

    frecvențele valorilor discrete sunt foarte mici (nu depășesc 1-3 cu un număr relativ mare de unități de observare);

    multe valori discrete ale unei caracteristici cu aceleași frecvențe.

O serie de variații de interval este o modalitate de grupare a datelor sub forma unui tabel care are două coloane (valorile caracteristicii sub forma unui interval de valori și frecvența fiecărui interval).

Spre deosebire de o serie discretă, valorile caracteristicii unei serii de intervale sunt reprezentate nu de valori individuale, ci de un interval de valori ("de la - la").

Se numește numărul care arată câte unități de observație au căzut în fiecare interval selectat frecvența valorii atributului si denota f i . Suma tuturor frecvențelor unei serii este egală cu numărul de elemente (unități de observație) din populația studiată.

Dacă o unitate are o valoare caracteristică egală cu limita superioară a intervalului, atunci ar trebui să fie atribuită următorului interval.

De exemplu, un copil cu o înălțime de 100 cm va cădea în al 2-lea interval, și nu în primul; iar un copil cu o înălțime de 130 cm va cădea în ultimul interval, și nu în al treilea.

Pe baza acestor date, se poate construi o serie de variații de interval.

Fiecare interval are o limită inferioară (xn), o limită superioară (xw) și o lățime a intervalului ( i).

Limita intervalului este valoarea atributului care se află la granița a două intervale.

inaltimea copiilor (cm)

inaltimea copiilor (cm)

cantitatea de copii

mai mult de 130

Dacă un interval are o limită superioară și inferioară, atunci se numește interval închis. Dacă un interval are doar o limită inferioară sau numai superioară, atunci este - interval deschis. Numai primul sau ultimul interval poate fi deschis. În exemplul de mai sus, ultimul interval este deschis.

Lățimea intervalului (i) – diferența dintre limitele superioare și inferioare.

i = x n - x in

Se presupune că lățimea intervalului deschis este aceeași cu lățimea intervalului închis adiacent.

inaltimea copiilor (cm)

cantitatea de copii

Lățimea intervalului (i)

pentru calcule 130+20=150

20 (deoarece lățimea intervalului închis adiacent este de 20)

Toate seriile de intervale sunt împărțite în serii de intervale cu intervale egale și serii de intervale cu intervale inegale . În rândurile distanțate cu intervale egale, lățimea tuturor intervalelor este aceeași. În serii de intervale cu intervale inegale, lățimea intervalelor este diferită.

În exemplul luat în considerare - o serie de intervale cu intervale inegale.

Cea mai importantă etapă în studiul fenomenelor și proceselor socio-economice este sistematizarea datelor primare și, pe această bază, obținerea unei caracteristici rezumative a întregului obiect folosind indicatori generali, care se realizează prin sintetizarea și gruparea materialului statistic primar.

Rezumat statistic - acesta este un complex de operații secvențiale pentru generalizarea faptelor individuale specifice care formează un set pentru a identifica trăsăturile și modelele tipice inerente fenomenului studiat în ansamblu. Efectuarea unui rezumat statistic include următorii pași :

  • selectarea caracteristicilor de grupare;
  • determinarea ordinii de formare a grupului;
  • dezvoltarea unui sistem de indicatori statistici pentru a caracteriza grupurile și obiectul în ansamblu;
  • dezvoltarea de scheme statistice de tabel pentru a prezenta rezultatele rezumate.

Gruparea statistică se numeşte împărţirea unităţilor populaţiei studiate în grupe omogene în funcţie de anumite caracteristici esenţiale pentru acestea. Grupările sunt cele mai importante metoda statistica generalizarea datelor statistice, baza pentru calculul corect al indicatorilor statistici.

Distinge următoarele tipuri grupări: tipologice, structurale, analitice. Toate aceste grupări sunt unite prin faptul că unitățile obiectului sunt împărțite în grupuri după o anumită caracteristică.

Caracteristica de grupare este o caracteristică prin care unitățile unei populații sunt împărțite în grupuri separate. Din alegerea corecta caracteristica de grupare depinde de concluzii cercetare statistică. Ca bază pentru grupare, este necesar să se utilizeze caracteristici semnificative, bazate teoretic (cantitative sau calitative).

Caracteristicile cantitative ale grupării au o expresie numerică (volumul tranzacționării, vârsta persoanei, venitul familiei etc.) și semne calitative de grupare reflectă starea unei unități de populație (sex, Statusul familiei, apartenența la industrie a întreprinderii, forma ei de proprietate etc.).

După ce a fost stabilită baza grupării, trebuie decisă problema numărului de grupuri în care ar trebui să fie împărțită populația studiată. Numărul de grupuri depinde de obiectivele studiului și de tipul de indicator care stă la baza grupării, de volumul populației și de gradul de variație al caracteristicii.

De exemplu, gruparea întreprinderilor după tipul de proprietate ia în considerare proprietatea municipală, federală și federală. Dacă gruparea este efectuată pe o bază cantitativă, atunci este necesar să se inverseze Atentie speciala asupra numărului de unităţi ale obiectului studiat şi gradului de variabilitate a caracteristicii de grupare.

Odată ce numărul de grupuri a fost determinat, trebuie determinate intervalele de grupare. Interval - acestea sunt valorile unei caracteristici diferite care se află în anumite limite. Fiecare interval are propria sa valoare, limite superioare și inferioare sau cel puțin una dintre ele.

Limita inferioară a intervalului se numește cea mai mică valoare a caracteristicii din interval și Limita superioară - cea mai mare valoare a caracteristicii din interval. Valoarea intervalului este diferența dintre limitele superioare și inferioare.

Intervalele de grupare, în funcție de mărimea lor, sunt: ​​egale și inegale. Dacă variația unei caracteristici se manifestă în limite relativ înguste și distribuția este uniformă, atunci un grup este construit la intervale egale. Valoarea intervalului egal este determinată de următoarea formulă :

unde Xmax, Xmin sunt valorile maxime și minime ale caracteristicii în agregat; n - numărul de grupuri.

Cea mai simplă grupare în care fiecare grup selectat este caracterizat de un indicator reprezintă o serie de distribuție.

Serii statistice distributie - aceasta este o distribuție ordonată a unităților de populație în grupuri după o anumită caracteristică. În funcție de caracteristica care stă la baza formării seriei de distribuție, se disting serii de distribuție atributive și variaționale.

Atributiv se numesc serii de distributie construite in functie de caracteristici calitative, adica caracteristici care nu au o expresie numerica (distributie pe tip de munca, pe gen, pe profesie etc.). Serii de distribuţie atributivă caracterizează componenţa populaţiei după anumite caracteristici esenţiale. Preluate pe mai multe perioade, aceste date fac posibilă studierea modificărilor de structură.

Serii variaționale se numesc serii de distribuţie construite pe o bază cantitativă. Orice serie de variații constă din două elemente: opțiuni și frecvențe. Opțiuni sunt valorile individuale ale unei caracteristici pe care aceasta le ia într-o serie de variații, adică sens specific trăsătură variabilă.

Frecvențele se numesc numerele de variante individuale sau fiecare grup al unei serii de variații, adică acestea sunt numere care arată cât de des apar anumite variante în seria de distribuție. Suma tuturor frecvențelor determină dimensiunea întregii populații, volumul acesteia. Frecvențele se numesc frecvente exprimate in fractii de unitate sau ca procent din total. În consecință, suma frecvențelor este egală cu 1 sau 100%.

În funcție de natura variației caracteristicii, se disting trei forme ale seriei de variații: serie clasificată, serie discretăși serii de intervale.

Serii de variații clasificate - aceasta este distribuția unităților individuale ale populației în ordine crescătoare sau descrescătoare a caracteristicii studiate. Clasificarea vă permite să împărțiți cu ușurință datele cantitative în grupuri, să le detectați imediat pe cele mai mici și cea mai mare valoare caracteristic, evidențiați valorile care se repetă cel mai adesea.

Serii de variații discrete caracterizează distribuția unităților populației după o caracteristică discretă care ia doar valori întregi. De exemplu, categoria tarifară, numărul de copii din familie, numărul de angajați în întreprindere etc.

Dacă o caracteristică are o schimbare continuă, care în anumite limite poate lua orice valoare ("de la - la"), atunci pentru această caracteristică este necesar să se construiască serie de variații de interval . De exemplu, valoarea venitului, vechimea în muncă, costul activelor fixe ale întreprinderii etc.

Exemple de rezolvare a problemelor pe tema „Rezumat statistic și grupare”

Problema 1 . Există informații despre numărul de cărți primite de studenți prin abonamente în ultimul an universitar.

Construiți serii de distribuție a variațiilor clasificate și discrete, desemnând elementele seriei.

Soluţie

Acest set reprezintă multe opțiuni pentru numărul de cărți primite de elevi. Să numărăm numărul de astfel de opțiuni și să le aranjam sub forma unor serii de distribuție variațională clasificată și variațională.

Problema 2 . Există date despre costul activelor fixe pentru 50 de întreprinderi, mii de ruble.

Construiți o serie de distribuție, evidențiind 5 grupuri de întreprinderi (la intervale egale).

Soluţie

Pentru a rezolva, alegem cel mai mare și cea mai mică valoare valoarea mijloacelor fixe ale întreprinderilor. Acestea sunt 30,0 și 10,2 mii de ruble.

Să aflăm dimensiunea intervalului: h = (30,0-10,2):5= 3,96 mii ruble.

Apoi, primul grup va include întreprinderi ale căror active fixe se ridică la 10,2 mii de ruble. până la 10,2+3,96=14,16 mii de ruble. Vor fi astfel de întreprinderi 9. Al doilea grup va include întreprinderi ale căror active fixe se ridică la 14,16 mii de ruble. până la 14,16+3,96=18,12 mii de ruble. Astfel de întreprinderi vor fi 16. În mod similar, vom găsi numărul de întreprinderi incluse în grupa a treia, a patra și a cincea.

Am plasat seria de distribuție rezultată în tabel.

Problema 3 . Următoarele date au fost obținute pentru o serie de întreprinderi din industria ușoară:

Grupați întreprinderile după numărul de muncitori, formând 6 grupe la intervale egale. Calculați pentru fiecare grup:

1. numărul de întreprinderi
2. numărul de muncitori
3. volumul de produse produse pe an
4. producția reală medie per lucrător
5. volumul mijloacelor fixe
6. dimensiunea medie a mijloacelor fixe ale unei întreprinderi
7. valoarea medie a produselor produse de o întreprindere

Prezentați rezultatele calculului în tabele. A trage concluzii.

Soluţie

Pentru a rezolva, vom selecta cele mai mari și cele mai mici valori ale numărului mediu de lucrători la întreprindere. Acestea sunt 43 și 256.

Să aflăm dimensiunea intervalului: h = (256-43):6 = 35,5

Apoi, prima grupă va include întreprinderile al căror număr mediu de lucrători este de la 43 la 43 + 35,5 = 78,5 persoane. Vor fi astfel de întreprinderi 5. A doua grupă va include întreprinderile al căror număr mediu de muncitori va fi de la 78,5 la 78,5+35,5=114 persoane. Astfel de întreprinderi vor fi 12. În mod similar, vom găsi numărul de întreprinderi incluse în grupa a treia, a patra, a cincea și a șasea.

Amplasăm seria de distribuție rezultată într-un tabel și calculăm indicatorii necesari pentru fiecare grup:

Concluzie : După cum se poate observa din tabel, al doilea grup de întreprinderi este cel mai numeros. Include 12 întreprinderi. Cele mai mici grupuri sunt a cincea și a șasea grupă (două întreprinderi fiecare). Acestea sunt cele mai mari întreprinderi (din punct de vedere al numărului de lucrători).

Întrucât al doilea grup este cel mai mare, volumul de produse produse pe an de întreprinderile din acest grup și volumul mijloacelor fixe sunt semnificativ mai mari decât altele. În același timp, producția reală medie per lucrător la întreprinderile din acest grup nu este cea mai mare. Întreprinderile din al patrulea grup conduc aici. Acest grup reprezintă, de asemenea, un volum destul de mare de active fixe.

În concluzie, observăm că mărimea medie a activelor imobilizate și cantitatea medie de producție produsă de o întreprindere sunt direct proporționale cu dimensiunea întreprinderii (din punct de vedere al numărului de lucrători).

Cel mai simplu mod de a rezuma materialul statistic este de a construi serii. Rezultatul rezumat al unui studiu statistic poate fi serii de distribuție. O serie de distribuție în statistică este o distribuție ordonată a unităților populației în grupuri în funcție de oricare caracteristică: calitativă sau cantitativă. Dacă o serie este construită pe o bază calitativă, atunci se numește atributiv, iar dacă pe o bază cantitativă, atunci se numește variațional.

O serie de variații este caracterizată de două elemente: varianta (X) și frecvența (f). O variantă este o valoare separată a unei caracteristici a unei unități individuale sau a unui grup de populație. Un număr care arată de câte ori apare o anumită valoare de atribut se numește frecvență. Dacă frecvența este exprimată ca număr relativ, atunci se numește frecvență. O serie de variații poate fi intervalală, când se definesc limitele „de la” și „până la” sau poate fi discretă, când caracteristica studiată este caracterizată de un anumit număr.

Să ne uităm la construcția serii de variații folosind exemple.

Exemplu. și există date despre categoriile tarifare a 60 de lucrători într-unul din atelierele fabricii.

Distribuiți muncitorii în funcție de categoria tarifară, construiți o serie de variații.

Pentru a face acest lucru, notăm toate valorile caracteristicii în ordine crescătoare și numărăm numărul de lucrători din fiecare grup.

Tabelul 1.4

Distribuția lucrătorilor pe categorii

Rang muncitor (X)

Numărul de muncitori

persoana (f)

în % din total (în special)

Am primit o serie variațională discretă în care caracteristica studiată (rangul muncitorului) este reprezentată de un anumit număr. Pentru claritate, serii de variații sunt reprezentate grafic. Pe baza acestei serii de distribuție a fost construită o suprafață de distribuție.

Orez. 1.1. Poligon de repartizare a muncitorilor pe categorii tarifare

Vom lua în considerare construcția unei serii de intervale cu intervale egale folosind următorul exemplu.

Exemplu. Sunt cunoscute date despre valoarea capitalului fix a 50 de companii în milioane de ruble. Este necesar să se arate distribuția firmelor în funcție de costul capitalului fix.

Pentru a arăta distribuția firmelor în funcție de costul capitalului fix, rezolvăm mai întâi problema numărului de grupuri pe care dorim să le evidențiem. Să presupunem că am decis să identificăm 5 grupuri de întreprinderi. Apoi determinăm dimensiunea intervalului în grup. Pentru a face acest lucru, folosim formula

După exemplul nostru.

Prin adăugarea valorii intervalului la valoarea minimă a atributului, obținem grupuri de firme după costul capitalului fix.

Unitate având inteles dublu, aparține grupului în care acționează ca limită superioară (adică valoarea atributului 17 va merge la primul grup, 24 la al doilea etc.).

Să numărăm numărul de fabrici din fiecare grup.

Tabelul 1.5

Distribuția firmelor după valoarea capitalului fix (milioane de ruble)

Costul capitalului fix
în milioane de ruble (X)

Numărul de firme
(frecvență) (f)

Frecvențele acumulate
(cumulativ)

Conform acestei distribuții, s-a obținut o serie de intervale variaționale, din care rezultă că 36 de firme au capital fix în valoare de la 10 la 24 de milioane de ruble. etc.

Serii de distribuție a intervalelor pot fi reprezentate grafic sub forma unei histograme.

Rezultatele prelucrării datelor sunt prezentate în tabele statistice. Tabelele statistice conțin propriul subiect și predicat.

Subiectul este totalitatea sau o parte din totalitatea care este caracterizată.

Predicatele sunt indicatori care caracterizează subiectul.

Se disting tabele: simple și de grup, combinaționale, cu dezvoltare simplă și complexă a predicatului.

Un tabel simplu din subiect conține o listă de unități individuale.

Dacă subiectul conține o grupare de unități, atunci un astfel de tabel se numește tabel de grup. De exemplu, un grup de întreprinderi după numărul de lucrători, grupuri de populație după sex.

Subiectul tabelului de combinare conține gruparea în funcție de două sau mai multe caracteristici. De exemplu, populația este împărțită pe gen în grupuri după educație, vârstă etc.

Tabelele combinate conțin informații care permit identificarea și caracterizarea relației dintre un număr de indicatori și modelul modificărilor acestora atât în ​​spațiu, cât și în timp. Pentru a clarifica tabelul atunci când îi dezvoltați subiectul, limitați-vă la două sau trei caracteristici, formând un număr limitat de grupuri pentru fiecare dintre ele.

Predicatul din tabele poate fi dezvoltat în diferite moduri. Cu o dezvoltare simplă a predicatului, toți indicatorii săi sunt localizați independent unul de celălalt.

Odată cu dezvoltarea complexă a predicatului, indicatorii sunt combinați între ei.

La construirea oricărui tabel, trebuie să pornești de la scopurile studiului și conținutul materialului prelucrat.

Pe lângă tabele, statisticile folosesc și grafice și diagrame. Grafic – datele statistice sunt reprezentate folosind forme geometrice. Diagramele sunt împărțite în diagrame liniare și cu bare, dar pot exista diagrame figurate (desene și simboluri), diagrame circulare (un cerc este luat ca dimensiune a întregii populații, iar zonele sectoarelor individuale afișează greutatea specifică sau proporția acesteia). componente), diagrame radiale (construite pe baza ordonatelor polare). Cartograma este o combinație hartă de contur sau un plan de amplasament cu o diagramă.

Serii de distribuție statistică– aceasta este o distribuție ordonată a unităților de populație în grupuri în funcție de o anumită caracteristică variabilă.
În funcție de caracteristica care stă la baza formării seriei de distribuție, există serii de distribuţie atributivă şi variaţională.

Prezența unei caracteristici comune stă la baza formării unei populații statistice, care reprezintă rezultatele unei descrieri sau măsurători aspecte comune obiecte de cercetare.

Subiectul de studiu în statistică este schimbarea (variantă) caracteristici sau caracteristici statistice.

Tipuri de caracteristici statistice.

Seriile de distribuție sunt numite atributive construit după criterii de calitate. Atributiv– acesta este un semn care are un nume (de exemplu, profesie: croitoreasă, profesor etc.).
Seria de distribuție este de obicei prezentată sub formă de tabele. În tabel 2.8 prezintă seria de distribuție a atributelor.
Tabelul 2.8 - Distribuția tipurilor de asistență juridică oferite de avocați cetățenilor uneia dintre regiunile Federației Ruse.

Seria de variații– acestea sunt valorile caracteristicii (sau intervalele de valori) și frecvențele acestora.
Serii de variații sunt serii de distribuție, construit pe o bază cantitativă. Orice serie de variații constă din două elemente: opțiuni și frecvențe.
Variantele sunt considerate a fi valorile individuale ale unei caracteristici pe care aceasta le ia într-o serie de variații.
Frecvențele sunt numerele de variante individuale sau fiecare grup al unei serii de variații, adică Acestea sunt numere care arată cât de des apar anumite opțiuni într-o serie de distribuție. Suma tuturor frecvențelor determină dimensiunea întregii populații, volumul acesteia.
Frecvențele sunt frecvențe exprimate ca fracții dintr-o unitate sau ca procent din total. În consecință, suma frecvențelor este egală cu 1 sau 100%. Seria de variații permite estimarea formei legii de distribuție pe baza datelor reale.

În funcție de natura variației trăsăturii, există serie de variații discrete și interval.
Un exemplu de serie de variații discrete este dat în tabel. 2.9.
Tabelul 2.9 - Distribuția familiilor după numărul de camere ocupate în apartamente individuale în 1989 în Federația Rusă.

Prima coloană a tabelului prezintă opțiuni pentru o serie de variații discrete, a doua coloană conține frecvențele seriei de variații, iar a treia conține indicatori de frecvență.

Seria de variații

ÎN populatie se cercetează o anumită trăsătură cantitativă. Din el se extrage aleatoriu o mostră de volum n, adică numărul elementelor eșantionului este egal cu n. În prima etapă a procesării statistice, variind mostre, adică ordonarea numerelor x 1 , x 2 , …, x n Ascendent. Fiecare valoare observată x i numit opțiune. Frecvență m i este numărul de observații ale valorii x iîn probă. Frecvență relativă (frecvență) w i este raportul de frecvență m i la dimensiunea eșantionului n: .
Când se studiază serii de variații, se folosesc și conceptele de frecvență acumulată și frecvență acumulată. Lăsa X oarecare număr. Apoi număr de opțiuni, ale căror valori sunt mai mici X, se numește frecvență acumulată: pentru x i n se numeste frecventa acumulata w i max.
O caracteristică se numește variabilă discretă dacă valorile sale individuale (variantele) diferă unele de altele printr-o anumită valoare finită (de obicei un număr întreg). Seria de variații a unei astfel de caracteristici se numește serie de variații discrete.

Tabelul 1. Vedere generală a unei serii de frecvență de variație discretă

Valori caracteristicex i x 1 x 2 x n
Frecvențelem i m 1 m 2 m n

O caracteristică se numește variabilă continuu dacă valorile sale diferă unele de altele printr-o cantitate arbitrar mică, de exemplu. un semn poate lua orice valoare într-un anumit interval. O serie de variații continue pentru o astfel de caracteristică se numește interval.

Tabelul 2. Vedere generală a seriei de variație a intervalului de frecvențe

Tabelul 3. Imagini grafice ale seriei de variații

RândPoligon sau histogramăFuncția de distribuție empirică
Discret
Interval
Prin revizuirea rezultatelor observațiilor, se determină câte valori variante se încadrează în fiecare interval specific. Se presupune că fiecare interval aparține unuia dintre capetele sale: fie în toate cazurile stânga (mai des), fie în toate cazurile dreapta, iar frecvențele sau frecvențele arată numărul de opțiuni conținute în limitele specificate. Diferențele a i – a i +1 se numesc intervale parțiale. Pentru a simplifica calculele ulterioare, seria de variații de interval poate fi înlocuită cu una condițional discretă. În acest caz, valoarea medie i-intervalul este luat ca optiune x i, și frecvența intervalului corespunzătoare m i– pentru frecvența acestui interval.
Pentru reprezentarea grafică a seriilor de variații, cele mai frecvent utilizate sunt poligonul, histograma, curba cumulativă și funcția de distribuție empirică.

În tabel 2.3 (Gruparea populației ruse după venitul mediu pe cap de locuitor în aprilie 1994) este prezentată serie de variații de interval.
Este convenabil să analizați seria de distribuție folosind o imagine grafică, ceea ce vă permite să judecați forma distribuției. O reprezentare vizuală a naturii modificărilor în frecvențele seriei de variații este dată de poligon și histogramă.
Poligonul este utilizat atunci când descrie serii de variații discrete.
Să reprezentăm, de exemplu, grafic distribuția fondului de locuințe pe tip de apartament (Tabelul 2.10).
Tabel 2.10 - Distribuția fondului de locuințe din mediul urban pe tip de apartament (cifre condiționate).


Orez. Zona de distribuție a locuințelor


Pe axele ordonatelor pot fi reprezentate nu numai valorile frecvenței, ci și frecvențele seriei de variații.
Histograma este utilizată pentru a descrie o serie de variații de interval. La construirea unei histograme, valorile intervalelor sunt reprezentate pe axa absciselor, iar frecvențele sunt reprezentate prin dreptunghiuri construite pe intervalele corespunzătoare. Înălțimea coloanelor în cazul intervalelor egale ar trebui să fie proporțională cu frecvențele. O histogramă este un grafic în care o serie este reprezentată ca bare adiacente una cu cealaltă.
Să descriem grafic seria de distribuție a intervalelor prezentată în tabel. 2.11.
Tabelul 2.11 - Distribuția familiilor în funcție de dimensiunea spațiului de locuit per persoană (cifre condiționate).
N p/p Grupuri de familii în funcție de dimensiunea spațiului de locuit per persoană Numărul de familii cu o anumită dimensiune a spațiului de locuit Numărul cumulat de familii
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
TOTAL 115 ----


Orez. 2.2. Histograma distribuției familiilor după mărimea spațiului de locuit per persoană


Folosind datele seriei acumulate (Tabelul 2.11), construim distribuție cumulată.


Orez. 2.3. Distribuția cumulativă a familiilor în funcție de dimensiunea spațiului de locuit per persoană


Reprezentarea unei serii de variații sub formă de cumulat este eficientă în special pentru serii de variații ale căror frecvențe sunt exprimate ca fracții sau procente din suma frecvențelor seriei.
Dacă schimbăm axele atunci când reprezentăm grafic o serie de variații sub formă de cumul, atunci obținem ogiva. În fig. 2.4 prezintă o ogivă construită pe baza datelor din tabel. 2.11.
O histogramă poate fi convertită într-un poligon de distribuție prin găsirea punctelor medii ale laturilor dreptunghiurilor și apoi conectând aceste puncte cu linii drepte. Poligonul de distribuție rezultat este prezentat în Fig. 2.2 cu o linie punctată.
Când se construiește o histogramă a distribuției unei serii de variații cu intervale inegale, nu frecvențele sunt reprezentate de-a lungul axei ordonatelor, ci densitatea distribuției caracteristicii în intervalele corespunzătoare.
Densitatea de distribuție este frecvența calculată pe unitatea de lățime a intervalului, adică câte unități sunt în fiecare grupă pe unitatea de valoare a intervalului. Un exemplu de calcul al densității de distribuție este prezentat în tabel. 2.12.
Tabel 2.12 - Distribuția întreprinderilor după numărul de angajați (cifre condiționate)
N p/p Grupuri de întreprinderi după numărul de angajați, oameni. Numărul de întreprinderi Dimensiunea intervalului, oameni. Densitatea de distribuție
A 1 2 3=1/2
1 Până la 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
TOTAL 147 ---- ----

Poate fi folosit și pentru a reprezenta grafic serii de variații curba cumulativă. Folosind un cumulat (curbă sumă), este descrisă o serie de frecvențe acumulate. Frecvențele cumulate sunt determinate prin însumarea secvențială a frecvențelor între grupuri și arată câte unități din populație au valori ale atributelor nu mai mari decât valoarea luată în considerare.


Orez. 2.4. Ogiva repartizării familiilor după mărimea spațiului de locuit per persoană

Atunci când se construiesc cumulate ale unei serii de variații de interval, variantele seriei sunt reprezentate grafic de-a lungul axei absciselor, iar frecvențele acumulate sunt reprezentate de-a lungul axei ordonatelor.

Studii profesionale superioare

„ACADEMIA RUSĂ DE ECONOMIE NAȚIONALĂ ȘI

FUNCȚIA PUBLICĂ SUB PREȘEDINTE

FEDERAȚIA RUSĂ"

(filiala Kaluga)

Departamentul de Științe ale Naturii și Matematică

TEST

La disciplina „Statistică”

Student___Mayboroda Galina Yurievna______

Departamentul de corespondență facultatea de stat și administrația municipală grup G-12-B

Profesor ____________________ Hamer G.V.

Candidat la Științe Pedagogice, conferențiar

Kaluga-2013

Sarcina 1.

Sarcina 1.1. 4

Problema 1.2. 16

Problema 1.3. 24

Problema 1.4. 33

Sarcina 2.

Sarcina 2.1. 43

Problema 2.2. 48

Problema 2.3. 53

Problema 2.4. 58

Sarcina 3.

Sarcina 3.1. 63

Problema 3.2. 68

Problema 3.3. 73

Problema 3.4. 79

Sarcina 4.

Problema 4.1. 85

Problema 4.2. 88

Problema 4.3. 90

Problema 4.4. 93

Lista surselor utilizate. 96

Sarcina 1.

Sarcina 1.1.

Următoarele date sunt disponibile despre producția de produse și valoarea profitului întreprinderilor regionale (Tabelul 1).

tabelul 1

Date despre producția și valoarea profitului de către întreprinderi

Întreprinderea nr. Produs, milioane de ruble. Profit, milioane de ruble Întreprinderea nr. Produs, milioane de ruble. Profit, milioane de ruble
63,0 6,7 56,0 7,2
48,0 6,2 81,0 9,6
39,0 6,5 55,0 6,3
28,0 3,0 76,0 9,1
72,0 8,2 54,0 6,0
61,0 7,6 53,0 6,4
47,0 5,9 68,0 8,5
37,0 4,2 52,0 6,5
25,0 2,8 44,0 5,0
60,0 7,9 51,0 6,4
46,0 5,5 50,0 5,8
34,0 3,8 65,0 6,7
21,0 2,1 49,0 6,1
58,0 8,0 42,0 4,8
45,0 5,7 32,0 4,6

Conform datelor originale:

1. Construiți o serie statistică de distribuție a întreprinderilor după producție, formând cinci grupe cu intervale egale.

Construiți grafice de serie de distribuție: poligon, histogramă, cumulat. Determinați grafic valoarea modului și a medianei.

2. Calculați caracteristicile seriei de distribuție a întreprinderilor după producție: medie aritmetică, dispersie, abatere standard, coeficient de variație.

Trage o concluzie.

3. Utilizând metoda grupării analitice, stabiliți prezența și natura corelației dintre costul produselor fabricate și valoarea profitului pe întreprindere.

4. Măsurați proximitatea corelației dintre costul de producție și valoarea profitului folosind un raport de corelație empiric.

Trageți concluzii generale.

Soluţie:

Să construim o serie de distribuție statistică

Pentru a construi o serie de variații de interval care caracterizează distribuția întreprinderilor după volumul de producție, este necesar să se calculeze valoarea și limitele intervalelor seriei.

Când se construiește o serie cu intervale egale, dimensiunea intervalului h determinat de formula:

x maxȘi x min– cele mai mari și mai mici valori ale atributului în populația întreprinderilor studiate;

k- numărul de grupuri de serii de intervale.

Numărul de grupuri k specificate în condiția sarcinii. k= 5.

x max= 81 de milioane de ruble, x min= 21 de milioane de ruble.

Calculul dimensiunii intervalului:

milioane de ruble

Prin adăugarea secvenţială a valorii intervalului h = 12 milioane de ruble. până la limita inferioară a intervalului, obținem următoarele grupuri:

Grupa 1: 21 – 33 de milioane de ruble.

Grupa 2: 33 – 45 milioane de ruble;

Grupa 3: 45 – 57 milioane de ruble.

Grupa 4: 57 – 69 milioane de ruble.

Grupa 5: 69 – 81 milioane de ruble.

Pentru a construi o serie de intervale, este necesar să se numără numărul de întreprinderi incluse în fiecare grup ( grupuri de frecvență).

Procesul de grupare a întreprinderilor după volumul de producție este prezentat în tabelul auxiliar 2. Coloana 4 a acestui tabel este necesară pentru construirea unei grupări analitice (punctul 3 al sarcinii).

masa 2

Tabel pentru construirea serii de distribuție a intervalelor și

grup analitic

Grupuri de întreprinderi după volumul producției, milioane de ruble. Întreprinderea nr. Produs, milioane de ruble. Profit, milioane de ruble
21-33 21,0 2,1
25,0 2,8
28,0 3,0
32,0 4,6
Total 106,0 12,5
33-45 34,0 3,8
37,0 4,2
39,0 6,5
42,0 4,8
44,0 5,0
Total 196,0 24,3
45-57 45,0 5,7
46,0 5,5
47,0 5,9
48,0 6,2
49,0 6,1
50,0 5,8
51,0 6,4
52,0 6,5
53,0 6,4
54,0 6,0
55,0 6,3
56,0 7,2
Total 606,0 74,0
57-69 58,0 8,0
60,0 7,9
61,0 7,6
63,0 6,7
65,0 6,7
68,0 8,5
Total 375,0 45,4
69-81 72,0 8,2
76,0 9,1
81,0 9,6
Total 229,0 26,9
Total 183,1

Pe baza liniilor totale de grup „Total” din Tabelul 3 se formează tabelul final 3, reprezentând o serie de intervale de distribuție a întreprinderilor pe volumul producției.

Tabelul 3

Seria de distribuție a întreprinderilor pe volumul producției

Concluzie. Gruparea construită arată că distribuția întreprinderilor după volumul producției nu este uniformă. Cele mai comune sunt întreprinderile cu un volum de producție de 45 până la 57 de milioane de ruble. (12 întreprinderi). Cele mai puțin comune sunt întreprinderile cu un volum de producție de 69 până la 81 de milioane de ruble. (3 întreprinderi).

Să reprezentăm graficele seriilor de distribuție.

Poligon folosit mai des pentru a descrie serii discrete. Pentru a construi un poligon într-un sistem de coordonate dreptunghiular, valorile argumentului sunt trasate pe axa x, adică opțiunile (pentru seria de variații de interval, mijlocul intervalului este luat ca argument) și valorile frecvenței sunt pe axa ordonatelor. Apoi, punctele sunt construite în acest sistem de coordonate, ale cărui coordonate sunt perechi de numere corespunzătoare din seria de variații. Punctele rezultate sunt conectate secvenţial prin segmente de linie dreaptă. Poligonul este prezentat în figura 1.

diagramă cu bare – diagramă cu bare. Vă permite să evaluați simetria distribuției. Histograma este prezentată în figura 2.

Figura 1 – Poligon de distribuție a întreprinderilor pe volum

lansarea produsului

Modă

Figura 2 – Histograma distribuției întreprinderilor pe volum

lansarea produsului

Modă– valoarea atributului care apare cel mai des în populaţia studiată.

Pentru o serie de intervale, modul poate fi determinat grafic din histogramă (Figura 2). Pentru aceasta, este selectat cel mai înalt dreptunghi, care în acest caz este modal (45 - 57 milioane de ruble). Vârful din dreapta al dreptunghiului modal este apoi conectat la colțul din dreapta sus al dreptunghiului anterior. Și vârful din stânga dreptunghiului modal - cu colțul din stânga sus al dreptunghiului următor. Apoi, din punctul de intersecție a acestora, o perpendiculară este coborâtă pe axa absciselor. Abscisa punctului de intersecție al acestor linii va fi modul de distribuție.

Milion freca.

Concluzie.În setul de întreprinderi luate în considerare, cele mai comune sunt întreprinderile cu o producție de 52 de milioane de ruble.

Se cumulează – curbă întreruptă. Este construit folosind frecvențele acumulate (calculate în Tabelul 4). Cumulul începe de la limita inferioară a primului interval (21 de milioane de ruble), frecvența acumulată se depune la limita superioară a intervalului. Cumulul este prezentat în Figura 3.

Median

Figura 3 - Distribuția cumulativă a întreprinderilor după volum

lansarea produsului

Median Eu– aceasta este valoarea atributului care se încadrează la mijlocul seriei clasate. Există același număr de unități de populație de ambele părți ale mediei.

Într-o serie de intervale, mediana poate fi determinată grafic folosind o curbă cumulată. Pentru a determina mediana dintr-un punct de pe scara de frecvență acumulată corespunzător la 50% (30:2 = 15), trageți o linie dreaptă paralelă cu axa absciselor până când se intersectează cu cumulul. Apoi, din punctul de intersecție a dreptei indicate cu cumulul, se coboară o perpendiculară pe axa absciselor. Abscisa punctului de intersecție este mediana.

Milion freca.

Concluzie.În setul de întreprinderi luate în considerare, jumătate dintre întreprinderi au un volum de producție de cel mult 52 de milioane de ruble, iar cealaltă jumătate - nu mai puțin de 52 de milioane de ruble.


Informații conexe.