Când se proiectează observarea eșantionului, apare întrebarea cu privire la dimensiunea necesară a eșantionului. Acest număr poate fi determinat pe baza erorii admisibile în timpul observării eșantionului, pe baza probabilității pe baza căreia amploarea erorii stabilite poate fi garantată și, în sfârșit, pe baza metodei de selecție.

Formulele pentru dimensiunea necesară a eșantionului pentru diferite metode de eșantionare pot fi derivate din relațiile corespunzătoare utilizate la calcularea erorilor maxime de eșantionare. Iată cele mai frecvent utilizate expresii pentru dimensiunea necesară a eșantionului în practică:

· eșantionare reală aleatorie și mecanică:

(reselectare)

(selecție nerepetitivă)

mostră tipică:

(reselectare)

(selecție nerepetitivă)

eșantionare în serie:

(reselectare)

(selecție nerepetitivă)

Mai mult, în funcție de scopurile studiului, varianțele și erorile de eșantionare pot fi calculate pentru valoarea medie sau proporția caracteristicii.

Să ne uităm la exemple de determinare a mărimii eșantionului necesar când în diverse moduri formarea populaţiei eşantionului.

Exemplul 5. La 100 agentii de turismÎn oraș, este planificată să se efectueze un studiu al numărului mediu lunar de vouchere vândute folosind o metodă de selecție mecanică. Care ar trebui să fie dimensiunea eșantionului astfel încât cu o probabilitate de 0,683 eroarea să nu depășească 3 călătorii, dacă conform sondajului de testare varianța este 225.

Soluţie. Să calculăm dimensiunea necesară a eșantionului:

Agenții

Exemplul 6. Pentru a determina ponderea angajaților băncilor comerciale din regiune cu vârsta peste 40 de ani, se propune organizarea unui eșantion tipic proporțional cu numărul de angajați bărbați și femei cu selecție mecanică în cadrul grupelor. Numărul total de angajați ai băncii este de 12 mii de persoane, inclusiv 7 mii de bărbați și 5 mii de femei.

Pe baza anchetelor anterioare, se știe că media variațiilor în interiorul grupului este 1600. Determinați dimensiunea necesară a eșantionului cu o probabilitate de 0,997 și o eroare de 5%.

Soluţie. Să calculăm dimensiunea totală a unui eșantion tipic:

oameni

Să calculăm acum volumul grupurilor tipice individuale:

oameni

oameni

Astfel, dimensiunea necesară a eșantionului de angajați ai băncii este de 550 de persoane, incl. 319 bărbați și 231 femei.

Exemplul 7.ÎN societate pe actiuni 200 de echipe de muncitori. Este planificată efectuarea unui sondaj prin sondaj pentru a determina proporția lucrătorilor cu boli profesionale. Se știe că varianța inter-serială a proporției este de 225. Cu o probabilitate de 0,954, se calculează numărul necesar de echipe pentru chestionarea lucrătorilor dacă eroarea de eșantionare nu trebuie să depășească 5%.

Soluţie. Vom calcula numărul necesar de echipe pe baza formulei pentru volumul de eșantionare nerepetitivă în serie:

brigăzi

3. Determinarea dimensiunii eșantionului necesar

Foarte important are o definiție a mărimii optime a eșantionului, care cu o anumită probabilitate va asigura acuratețea specificată a rezultatelor observației. Pe măsură ce dimensiunea eșantionului crește, eroarea de eșantionare scade. Dar din moment ce unitățile selectate pentru sondaj sunt adesea distruse, normele de selectare a unităților din eșantion trebuie să fie optime. Mărimea optimă a eșantionului poate fi obținută din formulele de eroare de eșantionare.

Tabelul 8.4

Formule pentru determinarea mărimii optime a eșantionului

Metoda de selecție

Pentru medie

Repetată în mod corespunzător aleatoriu

Aleatoriu și mecanic nerepetitiv

Tipologic nerepetitiv

Serial nerepetitiv cu serii egale

Formulele arată că, pe măsură ce eroarea estimată de eșantionare crește, dimensiunea necesară a eșantionului scade semnificativ.

Pentru a calcula dimensiunea eșantionului, trebuie să cunoașteți varianța. Poate fi împrumutat din anchetele anterioare ale aceleiași populații sau similare sau poate fi efectuată o anchetă specială prin eșantion la scară mică.

Exemplul 2 : La întreprindere, 100 de lucrători din 1000 au fost intervievați într-un eșantion aleator nerepetitiv și s-au obținut următoarele date privind veniturile lor pentru luna octombrie (Tabelul 8.5).

Tabelul 8.5

Distribuția lucrătorilor după venitul mediu lunar

Defini:

1) venitul mediu lunar al angajaților unei întreprinderi date, garantând un rezultat cu o probabilitate de 0,997;

2) ponderea lucrătorilor întreprinderii cu un venit lunar de 19 mii de ruble. și mai mare, garantând un rezultat cu o probabilitate de 0,954;

3) dimensiunea eșantionului necesară la determinarea venitului mediu lunar al angajaților întreprinderii, astfel încât, cu o probabilitate de 0,954, eroarea maximă de eșantionare să nu depășească 200 de ruble.

Soluţie:

1) Să determinăm venitul mediu lunar al angajaților acestei întreprinderi, garantând rezultatul cu o probabilitate de 0,997.

n= 100 de persoane

N= 1000 de persoane

Soluţie: pentru a determina intervalul venitului mediu lunar al angajaților unei întreprinderi date în populația generală, este necesar să se cunoască valoarea erorii maxime de eșantionare și venitul mediu lunar al lucrătorilor conform datelor sondajului eșantion .


tși eroarea medie de eșantionare .

Deoarece P= 0,997, atunci (conform Tabelului 8.2) t= 3.

S-a făcut o selecție aleatorie nerepetitivă, conform tabelului. 8.3, alegeți formula pentru calcularea erorii medii de eșantionare pentru medie:

, Unde
– varianța eșantionului.

Mărimea venitului mediu lunar al lucrătorilor pe baza datelor sondajului eșantion va fi determinată folosind formula medie aritmetică ponderată:
.

Vom efectua calcule suplimentare în următorul tabel:

Venit lunar

Număr de muncitori, oameni

Mijlocul intervalului

mii de ruble.

mii de ruble.

știind tȘi
Să determinăm valoarea erorii maxime de eșantionare:

Mie freca.

Atunci intervalul venitului mediu lunar al lucrătorilor acestei întreprinderi va fi următorul:

;

.

Răspuns: venitul mediu lunar al angajaților acestei întreprinderi cu o probabilitate de 0,997 este în intervalul de 18,08 mii de ruble. până la 18,92 mii de ruble.

2) Să determinăm ponderea lucrătorilor întreprinderii care au un venit lunar de 19 mii de ruble. și mai mare, garantând un rezultat cu o probabilitate de 0,954.

n= 100 de persoane

N= 1000 de persoane

Soluţie: pentru a determina intervalul cotei lucrătorilor cu un venit lunar de 19 mii de ruble. iar mai sus este necesar să se cunoască valoarea erorii maxime de prelevare a cotei
și ponderea lucrătorilor cu astfel de venit mediu lunar conform datelor eșantionului W.

Eroarea maximă de eșantionare este determinată de formulă
. Depinde de valoarea coeficientului de încredere tși eroarea medie de eșantionare.

Deoarece P= 0,954, atunci (conform Tabelului 8.2) t= 2.

S-a făcut o selecție aleatorie nerepetitivă, conform tabelului. 8.3, alegeți formula pentru calcularea erorii medii de eșantionare pentru cotă:

, Unde W– ponderea lucrătorilor întreprinderii cu un venit mediu lunar de 19 mii de ruble. și mai mare în eșantion.

Proporția eșantionului este determinată de raportul dintre numărul de unități care posedă caracteristica studiată m La numărul total unități de probă n, sau
.

Atunci eroarea medie a fracțiunii este

știind tși determinați valoarea erorii maxime de eșantionare pentru cotă:

Apoi, intervalul cotei lucrătorilor cu un venit lunar de 19 mii de ruble. și mai mare în populația generală va fi astfel:

.

Răspuns: ponderea lucrătorilor întreprinderii cu un venit lunar de 19 mii de ruble. și mai mare, cu o probabilitate de 0,954 variind de la 19,4% la 36,6%.

    Să determinăm dimensiunea eșantionului necesară atunci când determinăm venitul mediu lunar al angajaților întreprinderii, astfel încât, cu o probabilitate de 0,954, eroarea maximă de eșantionare să nu depășească 200 de ruble.

N= 1000 de persoane

Soluţie: dimensiunea eșantionului necesară pentru a determina venitul mediu lunar este determinată de formula (conform Tabelului 8.4):

După condițiile problemei, știm: cu probabilitatea P = 0,954 t= 2 (vezi tabelul 8.2) ;

0,2 mii de ruble;
(pe baza datelor din eșantionul anterior).

oameni

Răspuns: pentru ca eroarea maximă de eșantionare să nu depășească 200 de ruble cu o probabilitate de 0,954, trebuie examinate 189 de persoane.

4.5. Determinarea dimensiunii eșantionului

Procedura planului de eșantionare include soluție secvențială următoarele trei sarcini:

Definirea obiectului de cercetare;

Determinarea structurii de eșantionare;

Determinarea dimensiunii eșantionului.

De obicei, obiect al cercetării de marketing este un ansamblu de obiecte de observație, care pot fi consumatori, angajați ai companiei, intermediari etc. Dacă această populație este atât de mică încât echipa de cercetare dispune de resursele necesare de muncă, financiare și de timp pentru a stabili contactul cu fiecare dintre elementele sale, atunci este foarte posibil să se efectueze un studiu continuu al întregii populații. În acest caz, după ce ați determinat obiectul cercetării, puteți trece la următoarea procedură (alegerea unei metode de colectare a datelor, a instrumentului de cercetare și a metodei de comunicare cu publicul).

Cu toate acestea, în practică, adesea nu este posibil sau recomandabil să se efectueze un studiu cuprinzător al întregii populații. Pot exista următoarele motive pentru aceasta:

Incapacitatea de a stabili contactul cu unele elemente ale totalitatii;

Costuri nerezonabil de mari pentru realizarea unui studiu continuu sau prezența unor restricții financiare care nu permit efectuarea unui studiu complet;

Timpul scurt alocat cercetării se datorează pierderii de relevanță a informațiilor în timp sau din alte motive și nu permite colectarea, sistematizarea și analiza unor date extinse pentru întreaga populație.

Prin urmare, populațiile mari și dispersate sunt adesea studiate folosind un eșantion, care, după cum se știe, este înțeles ca o parte a populației destinată să reprezinte populația în ansamblu.

De acuratețea cu care un eșantion reflectă populația în ansamblu depinde structura și dimensiunea eșantionului.

Există două abordări pentru proiectarea eșantionării- probabilistice şi deterministe.

Abordare probabilistică a proiectării eșantionării presupune că orice element al populației poate fi selectat cu o anumită probabilitate (diferită de zero). Exista tipuri diferite eșantioane bazate pe teoria probabilității (tipic, imbricat etc.). Cea mai simplă și mai comună în practică este eșantionarea aleatorie simplă, în care fiecare element al populației are o probabilitate egală de a fi selectat pentru cercetare.

Eșantionarea probabilă este mai precisă și permite cercetătorului să evalueze gradul de fiabilitate al datelor pe care le-a colectat, deși este mai complexă și mai costisitoare decât eșantionarea deterministă.

Abordare deterministă la cadrul de eșantionare presupune că selecția elementelor populației se face prin metode bazate fie pe considerente de comoditate, fie pe decizia cercetătorului, fie pe grupuri contingente.

din motive de comoditate, constă în selectarea oricăror elemente ale populaţiei pe baza uşurinţei stabilirii contactului cu acestea. Imperfecțiunea acestei metode se datorează probabil reprezentativității scăzute a probei rezultate, deoarece elementele populației care sunt convenabile pentru cercetător pot să nu fie reprezentanți suficient de reprezentativi ai populației din cauza selecției lor nealeatoare și nerezonabile.

Cu toate acestea, pe de altă parte, simplitatea, economia și eficiența cercetării efectuate prin această metodă au făcut ca aceasta să fie folosită destul de răspândită în practică și, mai ales, în cadrul cercetărilor preliminare menite să clarifice principalele probleme.

Bazat pe metoda de eșantionare pe decizia cercetătorului, constă în selectarea unor elemente ale populației, care, în opinia sa, sunt reprezentanții ei caracteristici. Această metodă este mai avansată decât cea anterioară, deoarece se bazează pe o orientare către reprezentanți caracteristici ai populației studiate, deși selectate pe baza ideilor subiective ale cercetătorilor despre aceasta.

Metoda de eșantionare bazată pe standarde contingente, consta in selectarea elementelor caracteristice ale populatiei in concordanta cu caracteristicile obtinute anterior ale populatiei in ansamblu. Aceste caracteristici pot fi obținute prin efectuarea de cercetări preliminare și, spre deosebire de metoda anterioară, nu sunt subiective. De aceea aceasta metoda este mai avansat, vă permite să obțineți populații de eșantion nu mai puțin reprezentative decât eșantioanele probabile la costuri semnificativ mai mici pentru realizarea sondajului.

După ce a ales structura eșantionului (abordarea formării acesteia, tipul de eșantionare probabilistică sau deterministă), cercetătorul va trebui să determine volumul, i.e. numărul de elemente din populația eșantionului.

Marime de mostra determină fiabilitatea informaţiei obţinute în urma cercetărilor sale, precum şi a costurilor necesare efectuării cercetării. Mărimea eșantionului depinde pe nivelul de omogenitate sau varietate a obiectelor studiate.

Cu cât dimensiunea eșantionului este mai mare, cu atât este mai mare acuratețea acestuia și costurile de realizare a anchetei sale sunt mai mari. Cu o abordare probabilistică a structurii eșantionului, volumul acestuia poate fi determinat folosind formule statistice binecunoscute, bazate pe cerințele specificate pentru acuratețea acestuia.

În practică, sunt utilizate mai multe abordări pentru a determina dimensiunea eșantionului:

1. Abordare liberă pe baza aplicării „regula de bază”. De exemplu, se acceptă fără dovezi că pentru a obține rezultate exacte, eșantionul trebuie să fie de 5% din populație. Această abordare este simplă și ușor de implementat, dar nu este posibil să se determine acuratețea rezultatelor obținute. Cu o populație suficient de mare, poate fi și destul de scumpă.

Mărimea eșantionului poate fi stabilită pe baza anumitor condiții pre-acordate. De exemplu, clientul cercetării de marketing știe că atunci când studiază opinia publică, eșantionul este de obicei de 1000-1200 de persoane, așa că recomandă cercetătorului să rămână la această cifră. Dacă pe o anumită piață se efectuează cercetări anuale, atunci se folosește un eșantion de aceeași dimensiune în fiecare an. Spre deosebire de prima abordare, aici, la determinarea mărimii eșantionului, se folosește o logică binecunoscută, care, totuși, este foarte vulnerabilă.

De exemplu, atunci când se efectuează anumite studii, poate fi necesară o acuratețe mai mică decât atunci când se studiază opinia publică, iar dimensiunea populației poate fi de multe ori mai mică decât atunci când se studiază opinia publică. Astfel, această abordare nu ține cont de circumstanțele actuale și poate fi destul de costisitoare.

În unele cazuri, costul efectuării unui sondaj este folosit ca argument principal în determinarea mărimii eșantionului. Astfel, bugetul cercetărilor de marketing prevede costurile de realizare a anumitor sondaje, care nu pot fi depășite. Evident, nu se ține cont de valoarea informațiilor primite. Cu toate acestea, în unele cazuri, un eșantion mic poate da rezultate destul de precise.

Pare rezonabil să luăm în considerare costurile nu în termeni absoluti, ci în raport cu utilitatea informațiilor obținute în urma anchetelor efectuate. Clientul și cercetătorul ar trebui să ia în considerare diferite dimensiuni ale eșantionului și metode de colectare a datelor, costuri și alți factori

2. Mărimea eșantionului de la nivelul intervalului de încredere al erorii admisibile, care, după cum sa menționat deja, este determinată de acuratețea oportună a generalizărilor finale: de la crescut la indicativ. Totuși, aici ne referim la așa-numitul erori aleatorii asociate cu natura oricăror erori statistice. Ele sunt calculate ca erori în reprezentativitatea eșantioanelor probabile.

V.I. Paniotto oferă următoarele calcule pentru un eșantion reprezentativ cu ipoteza unei erori de 5 procente (Tabelul 4.2).

Tabelul 4.2

Exemplu de tabel de calcul

Pentru o populație mai mare de 100.000, dimensiunea eșantionului este de 400 de unități. Dacă avem în vedere populații generale de 5 mii sau mai mult, atunci, conform calculelor aceluiași autor, putem indica amploarea erorii efective de eșantionare în funcție de volumul acesteia, ceea ce este foarte important pentru noi, având în vedere că magnitudinea erorii admisibile depinde de scopul studiului și nu trebuie să fie aproape de nivelul de 5 procente.

Tabelul 4.3

Tabel de calcul

Alături de erorile aleatorii, sunt posibile erorile sistematice. Ele depind de organizarea anchetei prin sondaj. Acestea sunt diverse distorsiuni de eșantionare către unul dintre polii parametrului eșantionului.

3. Pe baza dimensiunii eșantionului analize statistice . Această abordare se bazează pe determinarea dimensiunii minime a eșantionului pe baza anumitor cerințe pentru fiabilitatea și validitatea rezultatelor obținute. Se folosește și la analizarea rezultatelor obținute pentru subgrupele individuale formate în cadrul eșantionului pe gen, vârstă, nivel de studii etc. Cerințele privind fiabilitatea și acuratețea rezultatelor pentru subgrupuri individuale dictează anumite cerințe pentru dimensiunea eșantionului în ansamblu.

Cea mai bazată teoretic și cea mai corectă abordare pentru determinarea dimensiunii eșantionului se bazează pe calcularea intervalelor credibile. Conceptul de variație caracterizează cantitatea de diferență (asemănarea) răspunsurilor respondenților la o anumită întrebare. Într-un sens mai strict, variația valorilor unei caracteristici în agregat este diferența dintre valorile sale între diferite unități ale unei populații date în aceeași perioadă sau moment în timp. Rezultatele răspunsurilor la sondaj sunt de obicei prezentate sub forma unei curbe de distribuție (Figura 4.1). Când asemănarea răspunsurilor este mare, vorbim de variație scăzută (curba de distribuție îngustă), iar când asemănarea răspunsurilor este scăzută, vorbim de variație mare (curba de distribuție largă).

Ca măsură a variației, se ia de obicei abaterea standard, care caracterizează distanța medie de la rata medie răspunsurile fiecărui respondent la o anumită întrebare.

Mică variație

Variație mare

Orez. 4.1. Curbe de variație și distribuție

Deoarece toate deciziile de marketing sunt luate în condiții de incertitudine, este recomandabil să se țină cont de această circumstanță atunci când se determină dimensiunea eșantionului. Deoarece determinarea valorilor studiate pentru o populație într-o manieră restrânsă se realizează pe baza statisticilor eșantionului, este necesar să se stabilească intervalul (intervalul de încredere) în care se așteaptă ca estimările pentru populația în ansamblu. căderea și eroarea în determinarea lor.

Un interval de încredere este un interval ale cărui puncte extreme corespund unui anumit procent din anumite răspunsuri la o întrebare. Intervalul de încredere este strâns legat de abaterea standard a caracteristicii studiate în populație: cu cât este mai mare, cu atât intervalul de încredere trebuie să fie mai larg pentru a include un anumit procent de răspunsuri.

Un interval de încredere de 95% sau 99% este standard atunci când se efectuează cercetări de piață. Nicio companie nu efectuează cercetări de marketing folosind mai multe mostre. ȘI statistici matematice face posibilă obținerea unor informații despre distribuția eșantionării, având doar date despre variația unui singur eșantion.

Un indicator al gradului în care estimarea adevărată pentru populația în ansamblu diferă de estimarea așteptată pentru un eșantion tipic este eroarea pătratică medie. În plus, cu cât dimensiunea eșantionului este mai mare, cu atât eroarea este mai mică. O valoare mare a variației determină valoare ridicata erori si invers.

Când este pornit intrebare pusa Există doar două opțiuni de răspuns, exprimate ca procent (se folosește o măsură procentuală), dimensiunea eșantionului este determinată de următoarea formulă:

unde n este dimensiunea eșantionului; z – abaterea normalizată, determinată pe baza nivelului de încredere selectat; p – variația găsită pentru eșantion; g – (100-r); e – eroare admisibilă.

La determinarea indicelui de variație pentru o anumită populație, este în primul rând recomandabil să se efectueze o analiză calitativă preliminară a populației studiate, în primul rând, pentru a stabili asemănarea unităților populației din punct de vedere demografic, social și alte aspecte de interes pentru populație. cercetător. Este posibil să se efectueze un studiu pilot, folosind rezultatele unor studii similare efectuate în trecut. Atunci când se utilizează măsura procentuală a variabilității, se ține cont de faptul că variabilitatea maximă este atinsă pentru p = 50%, care este cel mai rău caz. Mai mult, acest indicator nu afectează radical dimensiunea eșantionului. Se ține cont și de opinia clientului de cercetare cu privire la dimensiunea eșantionului.

Este posibil să se determine dimensiunea eșantionului folosind mai degrabă medii decât procente.

unde s este abaterea standard.

În practică, dacă eșantionul este nou format și nu au fost efectuate anchete similare, atunci s este necunoscut. În acest caz, este recomandabil să setați eroarea e în fracțiuni din abaterea standard. Formula de calcul este transformată și dobândește următoarea vedere:

Unde .

Mai sus se vorbea foarte mult despre agregate dimensiuni mari. Cu toate acestea, în unele cazuri, agregatele nu sunt mari. De obicei, dacă eșantionul este mai mic de cinci procente din populație, atunci populația este considerată mare și calculele sunt efectuate conform regulilor de mai sus. Dacă dimensiunea eșantionului depășește 5% din populație, atunci aceasta din urmă este considerată mică și se introduce un factor de corecție în formulele de mai sus.

Mărimea eșantionului în acest caz este determinată după cum urmează:

,

Lucrare practică nr. 8. „Determinarea mărimii eșantionului necesar”

„Determinarea dimensiunii eșantionului necesar”

Cel mai răspândit tip de observație necontinuă este observația selectivă, în care nu sunt examinate toate unitățile populației studiate, ci doar o parte dintre ele selectate într-un anumit mod.

Se numește întregul set de obiecte (observații) de studiat populatia generala. Populația sau selecția eșantionului este o parte din populația generală selectată pentru studiul proprietăților care asigură reprezentativitatea.

Selecția din populație se realizează în așa fel încât, pe baza eșantionului, să se poată obține o idee destul de exactă a parametrilor principali ai populației în ansamblu. în care despre care vorbim atât despre o estimare punctuală, care ia valoarea corespunzătoare a mediei, cotei etc., obținute în urma eșantionului, cât și despre o estimare pe interval, adică. despre limitele în care se poate afla, cu o anumită probabilitate, valoarea parametrului dorit în populație. Principala cerință pe care trebuie să o îndeplinească o populație eșantion este cerința reprezentativității sale, adică. reprezentativitate.

În statistică, rezultatele observării continue sunt uneori evaluate ca caracteristici ale eșantionului. Această interpretare a datelor obținute are loc în cazurile în care numărul de unități chestionate este mic și nu există o încredere fermă că caracteristicile studiate nu pot lua alte valori decât cele identificate ca urmare a observației. Atunci când se efectuează experimente, numărul de valori poate fi infinit de mare, prin urmare, atunci când se formulează concluzii bazate pe un număr limitat, este necesar să se ia în considerare datele obținute ca caracteristici ale eșantionului.

La extinderea rezultatelor unui sondaj prin sondaj la populația generală, trebuie avut în vedere faptul că poate exista o discrepanță între caracteristicile populației generale și ale populației eșantionate din cauza faptului că nu întreaga populație este chestionată, ci doar o o parte din ea.

Eroare observatie statistica Se ia în considerare valoarea abaterii dintre valorile calculate și cele reale ale caracteristicilor obiectelor studiate.

Metoda de eșantionare asigură economii semnificative de resurse materiale și financiare la efectuarea observației statistice, ceea ce face posibilă extinderea programului de anchetă și creșterea eficienței acestuia. Al doilea avantaj este fiabilitatea ridicată a datelor obținute, deoarece cu o dimensiune relativ mică a eșantionului este posibil să se organizeze un control eficient asupra calității informațiilor colectate. Astfel, este redusă probabilitatea ca erori de înregistrare să apară și să nu fie detectate în etapa de verificare a informațiilor primare. Și, în sfârșit, într-o serie de cazuri în care observarea continuă este asociată cu distrugerea sau deteriorarea unităților chestionate (de exemplu, la verificarea calității produselor alimentare aflate în vânzare), este posibilă doar o anchetă prin sondaj.

Acuratețea estimărilor obținute prin metoda de eșantionare depinde nu de proporția unităților chestionate, ci de numărul acestora.

Etapele principale ale observării probelor;

1) definirea scopurilor, obiectivelor și întocmirea unui program de observare;

2) prelevarea de probe;

3) colectarea datelor pe baza programului elaborat;

4) analiza rezultatelor obţinute şi calculul principalelor caracteristici ale populaţiei eşantionului;

5) calculul erorii de eșantionare și distribuția rezultatelor acesteia către populația generală.

Distinge tipuri de eșantionare:

1) Aleatoriu(aleatorie propriu-zisă);

2) mecanic(de exemplu, la fiecare 10, 20 etc.);

3) tipic (stratificat), Când populatieîmpărțit pe grupe și în fiecare grupă sunt examinate mai multe obiecte));

4) serial (cuibărit), când întreaga serie este selectată aleatoriu.

Cel mai simplu mod de a forma o populație eșantion este selecție de fapt aleatorie. Baza teoretica Metoda de eșantionare, dezvoltată inițial în legătură cu eșantionarea aleatorie în sine, este folosită și pentru a determina erorile de eșantionare în alte metode de observare.

De fapt, selecția aleatoare poate fi repetată sau nerepetitivă. La repetateÎn eșantionare, fiecare unitate aleasă aleatoriu din populația generală revine la această populație după observație și poate fi reexaminată. În practică, această metodă de selecție este rară. Mult mai frecventă este aleatoria reală irepetabil selecție, în care unitățile chestionate nu sunt returnate populației generale și nu pot fi sondate din nou. La selecția repetată, probabilitatea de a fi inclus în eșantion pentru fiecare unitate a populației rămâne neschimbată. La eșantionarea nerepetitivă, se modifică, dar pentru toate unitățile care rămân în populație după selectarea mai multor unități din aceasta, probabilitatea de a fi incluse în eșantion este aceeași.

Una dintre componentele principale ale unui studiu bine conceput este definirea eșantionului și ceea ce este un eșantion reprezentativ. Este ca exemplul tortului. La urma urmei, nu trebuie să mănânci întregul desert pentru a-i înțelege gustul? O mică parte este suficientă.

Deci, tortul este populatie (adică toți respondenții care sunt eligibili pentru sondaj). Poate fi exprimat geografic, de exemplu, numai locuitorii regiunii Moscova. Sex - numai femei. Sau au restricții de vârstă - rușii de peste 65 de ani.

Calcularea populației este dificilă: trebuie să aveți date din recensământul populației sau din sondajele de evaluare preliminară. Prin urmare, de obicei populația generală este „estimată”, iar din numărul rezultat se calculează populația eșantionului sau probă.

Ce este un eșantion reprezentativ?

Probă– acesta este un număr clar definit de respondenți. Structura sa ar trebui să coincidă cât mai mult cu structura populației generale în ceea ce privește principalele caracteristici ale selecției.

De exemplu, dacă respondenții potențiali sunt întreaga populație a Rusiei, unde 54% sunt femei și 46% sunt bărbați, atunci eșantionul ar trebui să conțină exact același procent. Dacă parametrii coincid, atunci eșantionul poate fi numit reprezentativ. Aceasta înseamnă că inexactitățile și erorile din studiu sunt reduse la minimum.

Mărimea eșantionului este determinată ținând cont de cerințele de acuratețe și economie. Aceste cerințe sunt invers proporționale între ele: cu cât dimensiunea eșantionului este mai mare, cu atât rezultatul este mai precis. În plus, cu cât este mai mare acuratețea, cu atât sunt necesare mai multe costuri pentru realizarea studiului. Și invers, cu cât eșantionul este mai mic, cu atât costă mai puține costuri, cu atât sunt reproduse mai puțin precis și mai aleatoriu proprietățile populației generale.

Prin urmare, pentru a calcula volumul de alegere, sociologii au inventat o formulă și au creat calculator special:

Probabilitatea de încredereȘi eroare de încredere

Ce înseamnă termenii " probabilitatea de încredere" Și " eroare de încredere"? Probabilitatea de încredere este un indicator al preciziei măsurării. Și eroarea de încredere este posibilă eroare rezultatele cercetării. De exemplu, cu o populație de peste 500,00 de persoane (să spunem că locuiește în Novokuznetsk), eșantionul va fi de 384 de persoane cu probabilitatea de încredere 95% și marja de eroare 5% SAU (cu un interval de încredere de 95±5%).

Ce rezultă din asta? La efectuarea a 100 de studii cu un astfel de eșantion (384 de persoane), în 95 la sută din cazuri răspunsurile obținute, conform legilor statisticii, se vor situa în ±5% față de cel inițial. Și vom obține un eșantion reprezentativ cu o probabilitate minimă de eroare statistică.

După ce dimensiunea eșantionului a fost calculată, puteți vedea dacă există un număr suficient de respondenți în versiunea demo a Chestionar Panel. Puteți afla mai multe despre cum să efectuați un sondaj de grup.

Estimarea pe intervale a probabilității evenimentului. Formule pentru calcularea dimensiunii eșantionului folosind o metodă de eșantionare pur aleatorie.

Pentru a determina probabilitățile evenimentelor care ne interesează, folosim o metodă de eșantionare: conducem n experimente independente, în fiecare eveniment A poate apărea (sau nu) (probabilitate R apariția evenimentului A în fiecare experiment este constantă). Apoi frecvența relativă p* a apariției evenimentelor Aîntr-o serie de n teste este luată ca o estimare punctuală a probabilității p producerea unui eveniment Aîntr-un proces separat. În acest caz, se numește valoarea p* cotă de eșantion aparițiile evenimentului A, și p - acțiuni generale .

Datorită corolarului teoremei limitei centrale (teorema Moivre-Laplace), frecvența relativă a unui eveniment cu o dimensiune mare a eșantionului poate fi considerată normal distribuită cu parametrii M(p*)=p și

Prin urmare, pentru n>30, un interval de încredere pentru cota generală poate fi construit folosind formulele:


unde u cr se găsește din tabelele funcției Laplace, ținând cont de probabilitatea de încredere dată γ: 2Ф(u cr)=γ.

Cu o dimensiune mică a eșantionului n≤30, eroarea maximă ε este determinată din tabelul de distribuție Student:
unde tcr =t(k; α) și numărul de grade de libertate k=n-1 probabilitate α=1-γ (zonă cu două fețe).

Formulele sunt valabile dacă selecția a fost efectuată în mod aleatoriu, repetat (populația generală este infinită), în caz contrar este necesar să se facă o ajustare pentru nerepetarea selecției (tabel).

Eroare medie de eșantionare pentru cota generală

PopulațiaInfinitVolumul final N
Tipul de selecțieSe repetăRepetabil
Eroare medie de eșantionare

Formule pentru calcularea dimensiunii eșantionului folosind o metodă de eșantionare pur aleatorie

Metoda de selecțieFormule pentru determinarea mărimii eșantionului
pentru mediepentru împărțire
Se repetă
Repetabil
Fracția de unități w = . Precizia ε = . Probabilitatea γ =

Probleme generale de cotare

La întrebarea „Intervalul de încredere acoperă valoarea p0 dată?” - se poate răspunde prin verificarea ipotezei statistice H 0:p=p 0 . Se presupune că experimentele sunt efectuate conform schemei de testare Bernoulli (independent, probabilitate p producerea unui eveniment A este constantă). După volum de probă n determinaţi frecvenţa relativă p * de apariţie a evenimentului A: unde m- numărul de apariții ale evenimentului Aîntr-o serie de n teste. Pentru a testa ipoteza H 0, se folosesc statistici care, cu o dimensiune a eșantionului suficient de mare, au o distribuție normală standard (Tabelul 1).
Tabelul 1 - Ipoteze despre cota generală

Ipoteză

H0:p=p0H0:p1 =p2
IpotezeCircuitul de testare BernoulliCircuitul de testare Bernoulli
Estimări de probă
Statistici K
Distribuția statisticilor K Normal standard N(0,1)

Exemplul nr. 1. Folosind eșantionarea repetă aleatorie, conducerea companiei a efectuat un sondaj prin sondaj pe 900 dintre angajații săi. Printre respondenți au fost 270 de femei. Construiți un interval de încredere cu o probabilitate de 0,95 care să acopere proporția reală a femeilor din întreaga echipă a companiei.
Soluţie. Conform condiției, proporția femeilor în eșantion este (frecvența relativă a femeilor în rândul tuturor respondenților). Deoarece selecția se repetă și dimensiunea eșantionului este mare (n=900), eroarea maximă de eșantionare este determinată de formula

Valoarea lui u cr se găsește din tabelul funcției Laplace din relația 2Ф(u cr) = γ, i.e. Funcția Laplace (Anexa 1) ia valoarea 0,475 la u cr =1,96. Prin urmare, eroarea marginală și intervalul de încredere dorit
(p – ε, p + ε) = (0,3 – 0,18; 0,3 + 0,18) = (0,12; 0,48)
Deci, cu o probabilitate de 0,95, putem garanta că proporția femeilor în întreaga echipă a companiei este în intervalul de la 0,12 la 0,48.

Exemplul nr. 2. Proprietarul parcării consideră ziua „norocoasă” dacă parcarea este plină mai mult de 80%. În cursul anului au fost efectuate 40 de verificări ale parcării, dintre care 24 au fost „reușite”. Cu o probabilitate de 0,98, găsiți un interval de încredere pentru estimarea proporției reale a zilelor „norocoase” din timpul anului.
Soluţie. Proporția eșantionului de zile „norocoase” este
Folosind tabelul funcției Laplace, găsim valoarea u cr pentru un dat
probabilitatea de încredere
Ф(2,23) = 0,49, ucr = 2,33.
Considerând că selecția nu este repetitivă (adică nu au fost efectuate două verificări în aceeași zi), vom găsi eroarea de limitare:
unde n=40, N = 365 (zile). De aici
și interval de încredere pentru ponderea generală: (p – ε, p + ε) = (0,6 – 0,17; 0,6 + 0,17) = (0,43; 0,77)
Cu o probabilitate de 0,98, ne putem aștepta ca proporția zilelor „norocoase” din timpul anului să fie în intervalul de la 0,43 la 0,77.

Exemplul nr. 3. După ce am verificat 2500 de produse în lot, am constatat că 400 de produse premium, dar n–m nu este. Câte produse trebuie verificate pentru a determina cu o încredere de 95% proporția celei mai înalte note cu o precizie de 0,01?
Căutăm o soluție folosind formula pentru determinarea dimensiunii eșantionului pentru re-selectare.

Ф(t) = γ/2 = 0,95/2 = 0,475 și această valoare conform tabelului Laplace corespunde lui t=1,96
Proporția eșantionului w = 0,16; eroare de eșantionare ε = 0,01

Exemplul nr. 4. Un lot de produse este acceptat dacă probabilitatea ca produsul să respecte standardul este de cel puțin 0,97. Dintre cele 200 de produse alese aleatoriu din lotul testat, s-a constatat că 193 îndeplinesc standardul. Este posibil să acceptăm lotul la nivelul de semnificație α=0,02?
Soluţie. Să formulăm ipotezele principale și alternative.
H 0:p=p 0 =0,97 - cotă generală necunoscută p egală cu valoarea specificată p 0 =0,97. În raport cu condiția - probabilitatea ca o parte din lotul inspectat să respecte standardul este egală cu 0,97; acestea. Se poate accepta lotul de produse.
H 1:p<0,97 - вероятность того, что деталь из проверяемой партии окажется соответствующей стандарту, меньше 0.97; т.е. партию изделий нельзя принять. При такой альтернативной гипотезе критическая область будет левосторонней.
Valoare statistică observată K(tabel) calculați pentru valorile date p 0 =0,97, n=200, m=193


Găsim valoarea critică din tabelul funcției Laplace din egalitate


Conform condiției, α = 0,02, deci F(Kcr) = 0,48 și Kcr = 2,05. Regiunea critică este pe partea stângă, adică. este intervalul (-∞;-K kp)= (-∞;-2,05). Valoarea observată K obs = -0,415 nu aparține regiunii critice, prin urmare, la acest nivel de semnificație nu există niciun motiv pentru a respinge ipoteza principală. Puteți accepta un lot de produse.

Exemplul nr. 5. Două fabrici produc același tip de piese. Pentru evaluarea calității acestora s-au prelevat probe din produsele acestor fabrici și s-au obținut următoarele rezultate. Dintre cele 200 de produse selectate de la prima fabrică, 20 erau defecte, iar dintre cele 300 de produse de la a doua fabrică, 15 erau defecte.
La un nivel de semnificație de 0,025, aflați dacă există o diferență semnificativă în calitatea pieselor fabricate de aceste fabrici.

Conform condiției, α = 0,025, deci F(Kcr) = 0,4875 și Kcr = 2,24. Cu o alternativă cu două fețe, intervalul de valori acceptabile are forma (-2,24; 2,24). Valoarea observată K obs =2,15 se încadrează în acest interval, adică. la acest nivel de semnificaţie nu există niciun motiv pentru a respinge ipoteza principală. Fabricile produc produse de aceeași calitate.

Fiecare profesie are propriul său set de întrebări preferate. Pentru cercetătorii de piață, problema mărimii eșantionului este cu siguranță în fruntea listei. De obicei este formulat astfel:

  • Am dori să comandăm un studiu asupra vizitatorilor centrelor comerciale din Moscova. Ce mostră avem nevoie?
  • Publicul nostru țintă este de aproximativ 300.000 de persoane. Câte persoane trebuie să chestionăm pentru a fi reprezentativi? Ce se întâmplă dacă publicul țintă este de 3 milioane?
  • Trebuie să evaluăm potențialul de vânzare a apartamentelor din Sankt Petersburg către locuitorii orașelor din nordul Rusiei. Ce mostră ar trebui să fac?
Mărimea eșantionului este cu adevărat importantă deoarece determină costul cercetărilor viitoare, ca să nu mai vorbim de calitatea rezultatelor și concluziilor rezultate. În acest articol, vom acoperi cum să calculăm dimensiunea optimă a eșantionului pentru un sondaj de masă. Materialul nostru va fi util tuturor celor care, într-un fel sau altul, se confruntă cu nevoia de a efectua singuri cercetări de marketing sau de a le comanda de la o agenție specializată.

Principala concepție greșită despre dimensiunea eșantionului

Mulți oameni cred că, cu cât grupul țintă este mai mare, cu atât dimensiunea eșantionului ar trebui să fie mai mare. Prin urmare, se presupune că, pentru a afla părerea locuitorilor unui oraș mic, este suficient să intervievezi 200-300 de oameni, dar pentru a afla părerea despre Rusia în ansamblu, 5000 nu vor fi suficiente.

Între timp, acest stereotip nu are nimic de-a face cu realitatea. Mărimea eșantionului nu depinde de mărimea grupului țintă (în limbajul statistic se numește „populația generală”) și este determinată de doi factori complet diferiți. Singura excepție de la această regulă sunt cazurile în care populația este foarte mică, de exemplu, 1-2 mii de oameni, dar astfel de situații sunt rare în practica efectivă a cercetării de marketing.

Doi factori care determină dimensiunea eșantionului

Mărimea eșantionului unui sondaj în masă depinde de doi factori:

  1. Precizia datelor care trebuie obținute la ieșire este aceeași „eroare statistică”. Pentru un eșantion de 100 de respondenți va fi în plus sau minus 10%, iar pentru un eșantion de 1000 de respondenți va fi în plus sau minus 3,1%. Mai multe detalii despre asta mai jos.
  2. Numărul și dimensiunea subgrupurilor în care eșantionul trebuie împărțit în timpul analizei. De exemplu, dacă se face un studiu electoral, atunci ne va interesa în principal nucleul alegătorilor activi. De regulă, ponderea „nucleului” depășește rar 20-25% din populația totală. Prin urmare, dimensiunea eșantionului ar trebui calculată astfel încât un sfert din volumul său total să permită o analiză statistică completă.
Contrar credinței populare, calitatea unui eșantion este determinată nu de mărimea sa, ci de reprezentativitatea sa. Reprezentativitatea este corespondența dintre eșantion și populație asupra parametrilor cheie. Cel mai adesea, indicatori socio-demografici ușor de măsurat sunt utilizați ca astfel de „puncte de referință”: gen, vârstă, educație, ocupație și locul de reședință.

Două tipuri de erori de eșantionare

Orice observație selectivă (adică atunci când nu intervievăm pe toată lumea, ci facem o selecție aleatorie din populația generală) este asociată cu eroarea datelor. Această eroare este de obicei numită „eroare de eșantionare”. Poate fi de două tipuri:

  1. Sistematic– este asociat cu erori de proiectare a eșantionării. Evaluarea dimensiunii, direcției și gradului de deplasare a acestuia este foarte dificilă, cel mai adesea imposibilă. De exemplu, dacă respondenților li se pun întrebări din partea reprezentanților claselor sociale marginalizate, acest lucru va afecta dorința de a participa la studiu din partea reprezentanților grupurilor mai bogate ale populației. Ca rezultat, acest lucru va duce la o eroare sistematică și o distorsiune a datelor extrem de dificil de evaluat.
  2. Aleatoriu– este legat de acțiunea legilor statisticii. Mărimea sa este ușor de calculat folosind formulele statisticii matematice și teoria probabilității. Ele vă permit să trageți concluzii informate despre intervalul de încredere al unui semn. De exemplu, dacă eroarea statistică este de plus sau minus 10%, iar valoarea indicatorului rezultat se dovedește a fi 25%, atunci intervalul de încredere este de la 15% la 35%.

Scopul cercetătorului este de a colecta date într-un mod care să minimizeze prejudecățile de eșantionare. Atunci va fi posibilă reducerea erorii statistice doar la o eroare aleatorie, care poate fi calculată folosind formule.

Cum se calculează dimensiunea erorii de eșantionare aleatorie

Eroarea de eșantionare aleatorie depinde nu numai de dimensiunea eșantionului, ci și de dispersie, adică de gradul de omogenitate al datelor. Cu cât datele sunt mai omogene (adică, cu cât este mai mică răspândirea valorilor obținute sau dispersia), cu atât eroarea de eșantionare este mai mică.

Există o formulă pentru calcularea erorii de eșantionare aleatoare, dar pentru comoditate, vă recomandăm să utilizați calculatoare online, de exemplu, acesta. Vă permite să efectuați cu ușurință două tipuri de calcule:

  • calculați valoarea erorii statistice pe baza mărimii eșantionului și a varianței estimate;
  • determinați dimensiunea eșantionului necesară pentru a obține o estimare a gradului de precizie dorit.
Iată cum arată fereastra sa de lucru:

Parametrul de încredere (unul dintre câmpurile din calculator) este de obicei setat la 95%. Aceasta înseamnă că în 95% din cazuri distribuția caracteristicii în populație se va încadra în intervalul de încredere calculat (adică valoarea caracteristicii în sine în eșantion plus sau minus dimensiunea erorii statistice). Mai puțin folosită este o valoare a fiabilității de 97% sau 99% - aceasta, respectiv, înseamnă că o astfel de lovitură va avea loc în 97% sau 99% din cazuri. În acest caz, fiabilitatea eșantionului crește, dar dimensiunea eșantionului crește.

Cea mai dificilă parte a determinării dimensiunii eșantionului este compromisul dintre acuratețea necesară și costul colectării datelor. Acest proces este complicat de faptul că cvadruplicarea dimensiunii eșantionului are ca rezultat doar o dublare a preciziei (corespunzător rădăcinii pătrate a creșterii eșantionului).

Caz: determinarea mărimii eșantionului pentru a evalua potențialul pieței de vânzări de imobile metropolitane către cumpărători din regiuni

În noiembrie-decembrie 2016, am efectuat un studiu al cererii de apartamente în clădiri noi din Moscova și Sankt Petersburg de la rezidenții din diferite orașe ale Rusiei. Studiul a inclus trei metode de colectare a datelor: un sondaj reprezentativ în masă a populației cu vârsta cuprinsă între 20 și 60 de ani (realizat folosind tehnologia CATI), precum și o serie de interviuri cu experți cu agenți imobiliari și interviuri aprofundate cu potențialii cumpărători de apartamente.

Studiul a acoperit 33 de orașe caracterizate de cererea crescută pentru bunuri imobiliare din Sankt Petersburg și Moscova. Eșantionul planificat al studiului, calculat folosind formule, a fost de 21.500 de respondenți. Această dimensiune este semnificativ mai mare decât dimensiunea eșantionului „standard” utilizată în cercetarea de marketing. Care este motivul pentru o dimensiune atât de mare a eșantionului?

Chestia este că clientul avea nevoie de estimări separat pentru fiecare oraș, și nu doar „pentru întreaga țară”. De fapt, nu lucrăm cu 1 eșantion, ci cu 33 de mostre separate pentru fiecare oraș. Ponderea persoanelor interesate să cumpere un apartament în Sankt Petersburg sau Moscova a fost determinată de experți a fi de 5% din numărul locuitorilor orașelor chestionate.

În funcție de importanța orașului pentru client, managerul de proiect din cadrul Agenției a determinat eroarea statistică admisibilă în care ar trebui să se încadreze rezultatele finale. Am folosit o macrocomandă specială în MS Excel pentru aceasta, dar aceste calcule pot fi efectuate și folosind un calculator de eșantionare. Ca urmare, dimensiunea eșantionului a variat de la 500 la 1.000 de respondenți pentru fiecare dintre orașele din studiu, care a dat un total de 21.500 de persoane.

  1. Determinați structura grupului țintă. Intenționați să analizați subgrupuri individuale sau va fi suficientă analiza eșantionului în ansamblu?
  2. Determinați exactitatea dorită a datelor. De exemplu, dacă trebuie să estimați dinamica cotei de piață pe parcursul unui an, introduceți valoarea aproximativă a cotei într-un calculator special și „jucați” cu diferite dimensiuni ale eșantionului.
  3. Găsiți un echilibru între costul colectării datelor (direct proporțional cu dimensiunea eșantionului) și acuratețea necesară.

În practică, decizia privind dimensiunea eșantionului este un compromis între ipoteza acurateței rezultatelor sondajului și fezabilitatea implementării lor practice (adică, pe baza costurilor de desfășurare a anchetei).

În practică, sunt utilizate mai multe abordări pentru a determina dimensiunea eșantionului. Să acordăm atenție celor mai simple dintre ele. Prima dintre acestea se numește abordare aleatorie și se bazează pe aplicarea „regula de bază”.

De exemplu, se acceptă fără dovezi că pentru a obține rezultate exacte, eșantionul trebuie să fie de 5% din populație. Această abordare este simplă și ușor de implementat, dar nu permite obținerea unor rezultate precise. Avantajul său este costul relativ scăzut. În a doua abordare, dimensiunea eșantionului poate fi setată pe baza unor condiții pre-specificate. Clientul cercetării de marketing, de exemplu, știe că atunci când studiază opinia publică, eșantionul este de obicei de 1000 - 1200 de persoane, așa că recomandă cercetătorului să rămână la această cifră.

A treia abordare înseamnă că, în unele cazuri, principalul aspect în determinarea mărimii eșantionului poate fi costul efectuării anchetei. Deși nu se ține cont de valoarea și fiabilitatea informațiilor primite.

În a patra abordare, dimensiunea eșantionului este determinată pe baza analizei statistice. Această abordare presupune determinarea dimensiunii minime a eșantionului, ținând cont de cerințele de fiabilitate și validitate a rezultatelor obținute.

A cincea abordare este considerată cea mai bazată teoretic și cea mai corectă abordare în determinarea mărimii eșantionului. Se bazează pe calculul unui interval de încredere.

Un interval de încredere este un interval ale cărui puncte extreme caracterizează procentul anumitor răspunsuri la o întrebare. Acest concept de aluat este asociat cu conceptul de „deviația standard a caracteristicii rezultate în populația generală”. Cu cât este mai mare, cu atât intervalul de încredere trebuie să fie mai larg pentru a include, de exemplu, 9,5% din răspunsuri.

Din proprietățile curbei de distribuție normală rezultă că punctele finale ale intervalului de încredere, egale cu, de exemplu, 9,5%, sunt definite ca produsul dintre: 1,96 (deviația normalizată) și abaterea standard.

Numerele 1,96 și 2,58 (pentru intervalul de încredere de 99%) sunt desemnate z.

Există tabele „Valoarea integralei de probabilitate”, care fac posibilă determinarea valorilor z pentru diferite intervale de încredere. Un interval de încredere de 95% sau 99% este standard atunci când se efectuează cercetări de marketing.

De exemplu, a fost realizat un studiu privind numărul de vizite ale proprietarilor de mașini la atelierele de service pe an. Intervalul de încredere pentru numărul mediu de vizite a fost calculat a fi de 5 până la 7 vizite la nivelul de încredere de 99%. Aceasta înseamnă că, dacă devine posibil să se efectueze independent studii eșantion de 100 de ori, atunci pentru 99 de studii eșantion, numărul mediu de vizite va scădea în intervalul de la 5 la 7 vizite. Cu alte cuvinte, 99% dintre proprietarii de mașini se vor încadra în intervalul de încredere.

Să presupunem că a fost efectuat un studiu pe până la 50 de eșantioane independente. Scorurile medii pentru aceste probe au format o curbă de distribuție normală numită distribuția eșantionului.

Scorul mediu pentru populație în ansamblu este egal cu scorul mediu al curbei de distribuție. Conceptul de „distribuție de eșantionare” este de asemenea considerat unul dintre conceptele de bază ale conceptului teoretic care stă la baza definiției eșantionului V.

Desigur, nicio companie nu este capabilă să formeze 10, 20, 50 de mostre independente. În mod obișnuit, este utilizată o singură probă.

Statistica matematică vă permite să obțineți unele informații despre distribuția eșantionării, având date exacte despre variația unui singur eșantion.

Un indicator al gradului în care o estimare adevărată pentru populație în ansamblu diferă de cea așteptată pentru un eșantion tipic este eroare pătratică medie. De exemplu, se studiază opinia consumatorilor despre un produs nou, iar clientul acestui studiu a indicat că ar fi mulțumit de acuratețea rezultatelor obținute, egală cu plus sau minus 5%.

Să presupunem că 30% din eșantion este în favoarea noului produs. Aceasta înseamnă că intervalul de estimări posibile pentru întreaga populație este de 25 - 35%. În plus, cu cât dimensiunea eșantionului este mai mare, cu atât eroarea este mai mică. O valoare mare de variație determină o valoare mare de eroare și invers.

Să determinăm dimensiunea eșantionului pe baza calculului intervalului de încredere. Informațiile inițiale necesare pentru implementarea acestei abordări sunt:

· cantitatea de variație pe care se crede că o are o populație;

· acuratețea dorită;

· nivelul de fiabilitate pe care trebuie să-l satisfacă rezultatele sondajului.

Când există doar două răspunsuri posibile la o întrebare dată, exprimate ca procent (se folosește o măsură procentuală), dimensiunea eșantionului este determinată de următoarea formulă:

unde n este dimensiunea eșantionului;

z - abaterea normalizată, determinată pe baza nivelului de încredere selectat (Tabelul 7);

p - variația găsită pentru eșantion;

e - eroare admisibilă.

Tabelul 7

Valoarea abaterii normalizate a scorului z de la valoarea medie

în funcţie de probabilitatea de încredere (a) a rezultatului obţinut

De exemplu, o companie producătoare de anvelope efectuează un sondaj asupra șoferilor care folosesc anvelope radiale.

Prin urmare, la întrebarea: „Folosiți anvelope radiale?” Sunt posibile doar 2 răspunsuri: „Da” sau „Nu”. Dacă presupunem că populația de pasionați de mașini are un coeficient de variație scăzut, asta înseamnă că aproape toți cei chestionați folosesc anvelope radiale. În acest caz, se poate forma o dimensiune a eșantionului destul de mică. În formula (1), produsul pg exprimă variația inerentă populației. De exemplu, să presupunem că 90% dintre unitățile din populație folosesc anvelope radiale. Aceasta înseamnă că pg = 900. Dacă presupunem că coeficientul de variație este mai mare (p = 70%), atunci pg = 2100. Cea mai mare variație se realizează atunci când jumătate din populație (50%) folosește anvelope radiale, iar celelalte nu face. În acest caz, produsul atinge o valoare egală cu 2500.

Atunci când efectuați un sondaj, este important să indicați acuratețea estimărilor obținute. De exemplu, s-a constatat că 44% dintre respondenți folosesc anvelope radiale. Rezultatele măsurătorilor trebuie prezentate sub forma: procentul șoferilor care folosesc anvelope radiale este de 44 plus sau minus %. Valoarea erorii admisibile este stabilită în comun în prealabil de către clientul de cercetare și antreprenor.

Nivelul de încredere în cercetarea de marketing este de obicei evaluat pe baza a două valori: 95% sau 99%. Prima valoare corespunde valorii z = 1,96; al doilea - z = 2,58. Dacă este selectat un nivel de încredere de 99%, atunci aceasta înseamnă următorul lucru: suntem 99% încrezători (cu alte cuvinte, nivelul de încredere este 0,99) că procentul membrilor populației care se încadrează în intervalul plus - minus e% este egal. la procentul de membri ai eșantionului, care se încadrează în același interval de eroare. Presupunând o variație de 50%, o precizie de 10% la un nivel de încredere de 95%, calculăm dimensiunea eșantionului:

n = 1,962 (50 x 50) / 102 = 96.

Cu un nivel de încredere de 99% și e = ±3%, n = 1067.

La determinarea indicelui de variație pentru o anumită populație, este recomandabil să se efectueze o analiză calitativă preliminară a populației studiate și să se stabilească asemănarea unităților populației din punct de vedere demografic, social și alte aspecte de interes pentru cercetător. Este posibil să se determine dimensiunea eșantionului folosind mai degrabă medii decât procente. Să presupunem că nivelul de încredere este ales să fie de 95% (z = 1,96), abaterea standard (S) este calculată a fi 100, iar precizia dorită (bias) este ±10. Atunci dimensiunea eșantionului va fi

În realitate, în practică, dacă eșantionul este format din nou și nu au fost efectuate anchete similare, S este necunoscut.

În acest caz, este recomandabil să setați eroarea e în fracțiuni din abaterea standard. Formula de calcul este transformată și ia următoarea formă:

Am vorbit mai ales despre agregatele de dimensiuni foarte mari care caracterizează piețele bunurilor de larg consum. Dar în unele cazuri agregatele nu sunt atât de mari, de exemplu pe piețele anumitor tipuri de produse industriale.

De obicei, dacă eșantionul este mai mic de 5% din populație, atunci populația este considerată mare, iar calculele sunt efectuate conform regulilor de mai sus.

Dacă V din eșantion depășește 5% din populație, atunci aceasta din urmă este considerată mică și se introduce un factor de corecție în formulele de mai sus. Mărimea eșantionului în acest caz este determinată după cum urmează:

unde n1 este dimensiunea eșantionului pentru o populație mică,

n este dimensiunea eșantionului (fie pentru măsuri procentuale, fie pentru medii), calculată folosind formulele de mai sus,

N este volumul populației generale.

De exemplu, se studiază opinia membrilor unei populații formate din 1000 de companii cu privire la construcția unei fabrici chimice în limitele orașului Tomsk. Din cauza lipsei de informații despre variație, se presupune cel mai rău caz: 50:50. Cercetătorul a decis să folosească un nivel de încredere de 95%. Clientul studiului a indicat că ar fi mulțumit de acuratețea rezultatelor plus sau minus 5%. În acest caz, se utilizează următoarea formulă pentru măsura procentuală:

Această abordare a formării eșantionului V, cu anumite rezerve, poate fi utilizată și la calcularea mărimii grupului și a grupului de experți.

Formulele de calcul ale eșantionului date se bazează pe presupunerea că toate regulile de eșantionare au fost respectate, iar singura eroare este eroarea datorată dimensiunii sale.

F. Kotler Management marketing / Transl. din engleza - a 9-a ed. internaţională. - Sankt Petersburg: Peter Kom., 1998. - P.174

F. Kotler şi alţii. Bazele marketingului. -M; Sankt Petersburg, 1999. P - 370.