Vom verifica semnificația ecuației de regresie pe baza

Testul F al lui Fisher:

Valoarea testului Fisher F poate fi găsită în tabelul Analiza varianței protocolului Excel. Valoarea tabelată a testului F cu o probabilitate de încredere de α = 0,95 și numărul de grade de libertate egal cu v1 = k = 2 și v2 = n – k – 1 = 50 – 2 – 1 = 47 este 0,051.

Deoarece Fcal > Ftable, ecuația de regresie trebuie considerată semnificativă, adică poate fi folosită pentru analiză și prognoză.

Semnificația coeficienților modelului rezultat poate fi evaluată folosind rezultatele raportului Excel în trei moduri.

Coeficientul ecuației de regresie este considerat semnificativ dacă:

1) valoarea observată a statisticilor t a lui Student pentru acest coeficient este mai mare decât valoarea critică (tabelară) a statisticilor t a lui Student (pentru un anumit nivel de semnificație, de exemplu α = 0,05, și numărul de grade de libertate df = n – k – 1, unde n este numărul de observații, iar k este numărul de factori din model);

2) Valoarea P a statisticii t a lui Student pentru acest coeficient este mai mică decât nivelul de semnificație, de exemplu, α = 0,05;

3) interval de încredere deoarece acest coeficient, calculat cu un anumit nivel de încredere (de exemplu, 95%), nu conține un zero în sine, adică limitele inferioare de 95% și superioare de 95% ale intervalului de încredere au aceleași semne.

Semnificația coeficienților A1 Și A2 Să verificăm folosind a doua și a treia metodă:

Valoarea P ( A1 ) = 0,00 < 0,01 < 0,05.

Valoarea P ( A2 ) = 0,00 < 0,01 < 0,05.

Prin urmare, coeficienții A1 Și A2 semnificativă la nivelul de 1% și cu atât mai mult la nivelul de semnificație de 5%. Limitele inferioare și superioare de 95% ale intervalului de încredere au aceleași semne, prin urmare coeficienții A1 Și A2 semnificativ.

Determinarea variabilei explicative din care

Dispersia perturbărilor aleatorii poate depinde.

Verificarea îndeplinirii condiţiei de homoscedasticitate

Reziduuri conform testului Goldfeld–Quandt

Când se testează ipoteza MCO conform căreia reziduurile sunt homoscedastice într-un model de regresie multiplă, trebuie mai întâi să se determine în raport cu care dintre factori dispersia reziduurilor este cel mai perturbată. Acest lucru se poate face prin examinarea vizuală a graficelor reziduale reprezentate pentru fiecare dintre factorii incluși în model. Variabila explicativă de care depinde mai mult varianța perturbațiilor aleatoare va fi ordonată prin creșterea valorilor reale la verificarea testului Goldfeld–Quandt. Graficele pot fi obținute cu ușurință în raport, care este generat prin utilizarea instrumentului de regresie din pachetul de analiză a datelor).

Grafice ale reziduurilor pentru fiecare factor al modelului cu doi factori

Din graficele prezentate reiese că dispersia soldurilor este cel mai perturbată în raport cu factorul Creanțe pe termen scurt.

Să verificăm prezența homoscedasticității în reziduurile modelului cu doi factori bazat pe testul Goldfeld–Quandt.

    Să ordonăm variabilele Y și X2 în ordinea crescătoare a factorului X4 (în Excel, puteți folosi comanda Date – Sort Ascending X4):

    Date sortate în ordine crescătoare X4:

  1. Să scoatem din mijlocul mulțimii ordonate C = 1/4 · n = 1/4 · 50 = 12,5 (12) valori. Ca rezultat, obținem două populații cu valori mici și, respectiv, mari ale lui X4.

    Pentru fiecare set efectuam urmatoarele calcule:

Sumă

111234876536,511

966570797682,068

455748832843,413

232578961097,877

834043911651,192

193722998259,505

1246409153509,290

31419681912489,100

2172804245053,280

768665257272,099

2732445494273,330

163253156450,331

18379855056009,900

10336693841766,000

Sumă

69977593738424,600

Ecuații pentru populații

Y = -27275,746 + 0,126X2 + 1,817X4

Y = 61439,511 + 0,228X2 + 0,140X4

Rezultatele acestui tabel au fost obținute folosind instrumentul de regresie pentru fiecare dintre populațiile rezultate pe rând.

4. Aflați raportul dintre sumele de pătrate reziduale rezultate

(numeratorul trebuie sa aiba o suma mai mare):

5. Concluzionăm că reziduurile sunt homoscedastice folosind testul F Fisher cu un nivel de semnificație de α = 0,05 și două grade identice de libertate k1 = k2 = == 17

unde p este numărul de parametri ai ecuației de regresie:

Ftable (0,05; 17; 17) = 9,28.

Deoarece Ftabel > R, homoscedasticitatea în reziduurile regresiei cu doi factori este confirmată.

Pentru a testa semnificația, se analizează raportul dintre coeficientul de regresie și abaterea sa standard. Acest raport este o distribuție Student, adică pentru a determina semnificația folosim testul t:

- RMS din dispersia reziduală;

- suma abaterilor de la valoarea medie

Dacă t ras. >t fila. , atunci coeficientul b i este semnificativ.

Intervalul de încredere este determinat de formula:

PROCEDURA DE EFECTUAREA LUCRĂRII

    Preluați datele inițiale conform opțiunii de lucru (după numărul de student în jurnal). Este specificat un obiect de control static cu două intrări X 1 , X 2 si o iesire Y. A fost efectuat un experiment pasiv la unitate și a fost obținut un eșantion de 30 de puncte care conține valorile X 1 , X 2 Și Y pentru fiecare experiment.

    Deschideți un fișier nou în Excel 2007. Introduceți informațiile inițiale în coloanele tabelului original - valorile variabilelor de intrare X 1 , X 2 și variabila de ieșire Y.

    Pregătiți două coloane suplimentare pentru introducerea valorilor calculate Yși resturi.

    Apelați programul „Regresie”: Date / Analiza datelor / Regresie.

Orez. 1. Caseta de dialog Analiza datelor.

    Introduceți adresele datelor sursă în caseta de dialog „Regresie”:

    interval de intrare Y, interval de intrare X (2 coloane),

    setați nivelul de fiabilitate la 95%,

    în opțiunea „Interval de ieșire”, indicați celula din stânga sus a locului în care sunt scoase datele de analiză de regresie (prima celulă de pe a doua pagină a foii de lucru),

    activați opțiunile „Remainings” și „Remaining Graph”,

    apăsați butonul OK pentru a începe analiza regresiei.

Orez. 2. Caseta de dialog Regresie.

    Excel va afișa 4 tabele și 2 grafice ale dependenței reziduurilor de variabile X1Și X2.

    Formatați tabelul „Ieșirea totalurilor” - extindeți coloana cu numele datelor de ieșire, faceți 3 cifre semnificative după punctul zecimal din a doua coloană.

    Formatați tabelul „Analiza variațiilor” - faceți numărul de cifre semnificative după zecimale mai ușor de citit și de înțeles, scurtați numele variabilelor și ajustați lățimea coloanelor.

    Formatați tabelul de coeficienți de ecuație - scurtați numele variabilelor și ajustați lățimea coloanelor dacă este necesar, faceți numărul de cifre semnificative mai ușor de citit și de înțeles, eliminați ultimele 2 coloane (valori și aspectul tabelului).

    Transferați datele din tabelul „Ieșire rămasă” în coloanele pregătite ale tabelului sursă, apoi ștergeți tabelul „Ieșire rămasă” (opțiunea „inserare specială”).

    Introduceți estimările coeficienților obținute în tabelul sursă.

    Trageți tabelele cu rezultate în partea de sus a paginii.

    Construiți diagrame sub tabele Yexp, Ycalculși erori de prognoză (reziduale).

    Formatați diagramele reziduale. Folosind graficele rezultate, evaluați corectitudinea modelului pe baza intrărilor X1, X2.

    Tipăriți rezultatele analizei de regresie.

    Înțelegeți rezultatele analizei de regresie.

    Întocmește un raport de lucru.

EXEMPLU DE PERFORMANȚĂ A LUCRĂRII

Metoda de realizare a analizei de regresie în EXCEL este prezentată în figurile 3-5.

Orez. 3. Exemplu de analiză de regresie în pachetul EXCEL.


Fig.4. Loturi reziduale variabile X1, X2

Orez. 5. Diagrame Yexp,Ycalculși erori de prognoză (reziduale).

Conform analizei de regresie, putem spune:

1. Ecuația de regresie obținută folosind Excel are forma:

    Coeficient de determinare:

Variația rezultatului cu 46,5% se explică prin variația factorilor.

    Testul general F testează ipoteza despre semnificația statistică a unei ecuații de regresie. Analiza se realizează prin compararea valorilor reale și tabelate ale testului Fisher F.

Deoarece valoarea reală depășește tabelul
, apoi concluzionăm că ecuația de regresie rezultată este semnificativă statistic.

    Coeficient corelație multiplă:

    b 0 :

fila t. (29, 0,975)=2,05

b 0 :

Interval de încredere:

    Determinați intervalul de încredere pentru coeficient b 1 :

Verificarea semnificației coeficientului b 1 :

t dis. >t fila. , coeficientul b 1 este semnificativ

Interval de încredere:

    Determinați intervalul de încredere pentru coeficient b 2 :

Test de semnificație pentru coeficient b 2 :

Determinați intervalul de încredere:

OPȚIUNI DE SARCINI

Tabelul 2. Opțiuni de activitate

Opțiunea nr.

Semn efectiv Y i

Y 1

Y 1

Y 1

Y 1

Y 1

Y 1

Y 1

Y 1

Y 1

Y 1

Y 2

Y 2

Y 2

Y 2

Y 2

Factorul nr. X i

Factorul nr. X i

Continuarea tabelului 1

Opțiunea nr.

Semn efectiv Y i

Y 2

Y 2

Y 2

Y 2

Y 2

Y 3

Y 3

Y 3

Y 3

Y 3

Y 3

Y 3

Y 3

Y 3

Y 3

Factorul nr. X i

Factorul nr. X i

Tabelul 3. Date inițiale

Y 1

Y 2

Y 3

X 1

X 2

X 3

X 4

X 5

ÎNTREBĂRI PENTRU AUTOCONTROL

    Probleme de analiză de regresie.

    Condiții preliminare pentru analiza de regresie.

    Ecuația de bază a analizei varianței.

    Ce arată raportul F al lui Fisher?

    Cum se determină valoarea tabelului criteriului lui Fisher?

    Ce arată coeficientul de determinare?

    Cum se determină semnificația coeficienților de regresie?

    Cum se determină intervalul de încredere al coeficienților de regresie?

    Cum se determină valoarea t-test calculată?

    Cum se determină valoarea tabelului testului t?

    Formulați ideea principală a analizei varianței; pentru rezolvarea a ce probleme este cea mai eficientă?

    Care sunt premisele teoretice de bază ale analizei varianței?

    Descompuneți suma totală a abaterilor pătrate în componente în ANOVA.

    Cum se obține estimări ale varianței din sumele abaterilor pătrate?

    Cum se obțin numărul necesar de grade de libertate?

    Cum se determină eroarea standard?

    Explicați proiectarea analizei cu doi factori a varianței.

    Prin ce este diferită clasificarea încrucișată de clasificarea ierarhică?

    Care este diferența dintre datele echilibrate?

Raportul este întocmit în editor de text Cuvânt pe hârtie A4 GOST 6656-76 (210x297 mm) și conține:

    Denumirea lucrării de laborator.

    Scopul lucrării.

  1. Rezultatele calculului.

TIMP PERMIS PENTRU FINALIZARE

LUCRĂRI DE LABORATOR

Pregătire pentru muncă – 0,5 academic. ore.

Finalizarea lucrărilor – 0,5 academice. ore.

Calcule computerizate – 0,5 academic. ore.

Proiectarea lucrării – 0,5 academic. ore.

Literatură

    Identificarea obiectelor de control. / A. D. Semenov, D. V. Artamonov, A. V. Bryukhachev. Tutorial. - Penza: PSU, 2003. - 211 p.

    Bazele analize statistice. Workshop despre metode statistice și cercetare operațională folosind pachetele STATISTIC și EXCEL. / Vukolov E.A. Tutorial. - M.: FORUM, 2008. - 464 p.

    Fundamentele teoriei identificării obiectelor de control. / A.A. Ignatiev, S.A. Ignatiev. Tutorial. - Saratov: SSTU, 2008. - 44 p.

    Teoria probabilității și statistică matematică în exemple și probleme folosind EXCEL. / G.V. Gorelova, I.A. Katsko. - Rostov n/d: Phoenix, 2006.- 475 p.

    Scopul 2

    Concepte de bază 2

    Comanda de lucru 6

    Exemplu de lucru 9

    Întrebări pentru autocontrol 13

    Timpul alocat pentru finalizarea lucrărilor 14

    Teste finale în econometrie

    1. Semnificația parametrilor ecuației de regresie se evaluează pe baza:

    A) t - Testul elevului;

    b) Testul F Fisher-Snedecor;

    c) eroare pătratică medie;

    d) eroarea medie de aproximare.

    2. Coeficientul de regresie din ecuația care caracterizează relația dintre volumul produselor vândute (milioane de ruble) și profitul întreprinderilor din industria auto pentru anul (milioane de ruble) înseamnă că, odată cu creșterea volumului de produse vândute de către 1 milioane de ruble profitul crește cu:

    d) 0,5 milioane. freca.;

    c) 500 mii. freca.;

    D) 1,5 milioane de ruble.

    3. Raportul de corelație (indicele de corelație) măsoară gradul de apropiere a conexiunii dintre X șiY:

    a) numai cu o formă neliniară de dependenţă;

    B) pentru orice formă de dependență;

    c) numai pentru dependenţa liniară.

    4. După direcția de comunicare există:

    a) moderată;

    B) drept;

    c) drept.

    5. Pe baza a 17 observații, a fost construită o ecuație de regresie:
    .
    Pentru a verifica semnificația ecuației, am calculatvaloare observatăt- statistici: 3,9. Concluzie:

    A) Ecuația este semnificativă la a = 0,05;

    b) Ecuația este nesemnificativă la a = 0,01;

    c) Ecuația este nesemnificativă la a = 0,05.

    6. Care sunt consecințele încălcării ipotezei MCO „ așteptarea matematică a reziduurilor de regresie este zero”?

    A) Estimări părtinitoare ale coeficienților de regresie;

    b) Estimări eficiente, dar inconsecvente ale coeficienților de regresie;

    c) Estimări ineficiente ale coeficienților de regresie;

    d) Estimări inconsistente ale coeficienților de regresie.

    7. Care dintre următoarele afirmații este adevărată dacă reziduurile sunt heteroscedastice?

    A) Concluziile bazate pe statisticile t și F sunt nesigure;

    d) Estimările parametrilor ecuației de regresie sunt părtinitoare.

    8. Pe ce se bazează testul? corelație de rang Spearman?

    A) Utilizarea t – statistici;

    c) În uz ;

    9. Pe ce se bazează testul White?

    b) Utilizarea statisticilor F;

    B) În uz ;

    d) Despre analiza grafică a reziduurilor.

    10. Ce metodă poate fi folosită pentru a elimina autocorelația?

    11. Cum se numește încălcarea ipotezei variației constante a reziduurilor?

    a) Multicoliniaritate;

    b) Autocorelarea;

    B) Heteroscedasticitate;

    d) Homoscedasticitatea.

    12. Variabilele fictive sunt introduse în:

    a) numai în modele liniare;

    b) numai în regresie multiplă neliniară;

    c) numai în modele neliniare;

    D) atât modele liniare cât și neliniare reduse la formă liniară.

    13. Dacă în matricea coeficienţilor de corelaţie perechi există
    , atunci aceasta indică:

    A) Despre prezența multicoliniarității;

    b) Despre absenţa multicolinearităţii;

    c) Despre prezența autocorelației;

    d) Despre absenţa heteroscedasticităţii.

    14. Ce măsură nu poate fi folosită pentru a scăpa de multicoliniaritate?

    a) Creșterea dimensiunii eșantionului;

    D) Transformarea componentei aleatoare.

    15. Dacă
    iar rangul matricei A este mai mic decât (K-1), atunci ecuația este:

    a) supraidentificat;

    B) neidentificat;

    c) identificate cu precizie.

    16. Ecuația de regresie are forma:

    A)
    ;

    b)
    ;

    V)
    .

    17.Care este problema identificării modelului?

    A) obținerea parametrilor definiți unic ai modelului specificati printr-un sistem de ecuații simultane;

    b) selectarea și implementarea metodelor de estimare statistică a parametrilor modelului necunoscuți folosind date statistice inițiale;

    c) verificarea adecvării modelului.

    18. Ce metodă este folosită pentru a estima parametrii unei ecuații supraidentificate?

    B) DMNK, CMNK;

    19. Dacă o variabilă calitativă arekvalori alternative, atunci următoarele sunt utilizate în modelare:

    A) (k-1) variabilă inactivă;

    b) variabile kdummy;

    c) (k+1) variabilă inactivă.

    20. Analiza apropierii și direcției legăturilor dintre două caracteristici se realizează pe baza:

    A) coeficient de corelație de pereche;

    b) coeficientul de determinare;

    c) coeficient de corelaţie multiplă.

    21. Într-o ecuație liniară X = A 0 +a 1 coeficientul de regresie x arată:

    a) apropierea de comunicare;

    b) proporția de varianță „Y” dependentă de „X”;

    C) cât de mult se va schimba în medie „Y” atunci când „X” se schimbă cu o unitate;

    d) eroarea coeficientului de corelare.

    22. Ce indicator este utilizat pentru a determina partea de variație datorată modificărilor valorii factorului studiat?

    a) coeficientul de variație;

    b) coeficientul de corelare;

    B) coeficientul de determinare;

    d) coeficientul de elasticitate.

    23. Coeficientul de elasticitate arată:

    A) cu câte% se va schimba valoarea lui y când x se va modifica cu 1%;

    b) cu câte unități de măsură ale sale se va modifica valoarea lui y atunci când x se modifică cu 1%;

    c) cu ce % se va schimba valoarea lui y atunci când x se schimbă la unitate. dimensiunea acestuia.

    24. Ce metode pot fi folosite pentru a detecta heteroschedasticitatea?

    A) testul Golfeld-Quandt;

    B) Testul de corelare a rangului lui Spearman;

    c) Testul Durbin-Watson.

    25. Pe ce se bazează testul Holfeld-Quandt?

    a) Utilizarea t-statisticilor;

    B) Utilizarea F – statistici;

    c) În uz ;

    d) Despre analiza grafică a reziduurilor.

    26. Ce metode nu pot fi folosite pentru a elimina autocorelarea reziduurilor?

    a) Metoda celor mai mici pătrate generalizate;

    B) Metoda celor mai mici pătrate ponderate;

    C) Metoda maximei probabilități;

    D) Metoda celor mai mici pătrate în două etape.

    27. Cum se numește încălcarea ipotezei de independență a reziduurilor?

    a) Multicoliniaritate;

    B) Autocorelație;

    c) Heteroscedasticitate;

    d) Homoscedasticitatea.

    28. Ce metodă poate fi folosită pentru a elimina heteroscedasticitatea?

    A) Metoda celor mai mici pătrate generalizate;

    b) Metoda celor mai mici pătrate ponderate;

    c) Metoda maximei probabilități;

    d) Metoda celor mai mici pătrate în două etape.

    30. Dacă conformt-criteriu, majoritatea coeficienților de regresie sunt semnificativi statistic, iar modelul în ansambluF- criteriul este nesemnificativ, aceasta poate indica:

    a) Multicoliniaritate;

    B) Despre autocorelarea reziduurilor;

    c) Despre heteroschedasticitatea reziduurilor;

    d) Această opțiune este imposibilă.

    31. Este posibil să scapi de multicolinearitate folosind transformarea variabilă?

    a) Această măsură este eficientă numai dacă dimensiunea eșantionului este mărită;

    32. Utilizând ce metodă se pot găsi estimări ale parametrului unei ecuații de regresie liniară:

    A) metoda celor mai mici pătrate;

    b) analiza de corelaţie şi regresie;

    c) analiza varianţei.

    33. A fost construită o ecuație de regresie liniară multiplă cu variabile fictive. Pentru a verifica semnificația coeficienților individuali, utilizați distributie:

    a) Normal;

    b) Testul elevului;

    c) Pearson;

    d) Fischer-Snedecor.

    34. Dacă
    iar rangul matricei A este mai mare decât (K-1), atunci ecuația este:

    A) supraidentificat;

    b) neidentificate;

    c) identificate cu precizie.

    35. Pentru a estima parametrii unui sistem de ecuații precis identificat, se utilizează următoarele:

    a) DMNK, CMNK;

    b) DMNK, MNK, CMNK;

    36. Criteriul Chow se bazează pe aplicarea:

    A) F - statistici;

    b) t - statistici;

    c) Criteriile Durbin-Watson.

    37. Variabilele fictive pot lua următoarele valori:

    d) orice valori.

    39. Pe baza a 20 de observații, a fost construită o ecuație de regresie:
    .
    Pentru a verifica semnificația ecuației, s-a calculat valoarea statisticii:4.2. Concluzii:

    a) Ecuația este semnificativă la a=0,05;

    b) Ecuația este nesemnificativă la a=0,05;

    c) Ecuația este nesemnificativă la a=0,01.

    40. Care dintre următoarele afirmații nu este adevărată când reziduurile sunt heteroscedastice?

    a) Concluziile bazate pe statisticile t și F sunt nesigure;

    b) Heteroscedasticitatea se manifestă printr-o valoare scăzută a statisticii Durbin-Watson;

    c) Cu heteroschedasticitate, estimările rămân eficiente;

    d) Estimările sunt părtinitoare.

    41. Testul Chow se bazează pe comparație:

    A) variații;

    b) coeficienţii de determinare;

    c) așteptări matematice;

    d) medie.

    42. Dacă la testul Chow
    atunci se consideră:

    A) că împărțirea în subintervale este recomandabilă din punctul de vedere al îmbunătățirii calității modelului;

    b) modelul este nesemnificativ statistic;

    c) modelul este semnificativ statistic;

    d) că nu are rost să împărțim proba în părți.

    43. Variabilele fictive sunt variabile:

    a) calitate înaltă;

    b) aleatoriu;

    B) cantitativ;

    d) logic.

    44. Care dintre următoarele metode nu poate fi utilizată pentru a detecta autocorelarea?

    a) metoda seriei;

    b) testul Durbin-Watson;

    c) Testul de corelare a rangului lui Spearman;

    D) Testul lui White.

    45. Cel mai simplu formă structurală modelul are forma:

    A)

    b)

    V)

    G)
    .

    46. ​​​​Ce măsuri pot fi folosite pentru a scăpa de multicoliniaritate?

    a) Creșterea dimensiunii eșantionului;

    b) Excluderea variabilelor foarte corelate cu altele;

    c) modificarea specificației modelului;

    d) Transformarea componentei aleatoare.

    47. Dacă
    iar rangul matricei A este (K-1), atunci ecuația este:

    a) supraidentificat;

    b) neidentificate;

    B) identificat cu precizie;

    48. Modelul este considerat identificat dacă:

    a) între ecuaţiile modelului există cel puţin una normală;

    B) fiecare ecuație a sistemului este identificabilă;

    c) printre ecuaţiile model există cel puţin una neidentificată;

    d) printre ecuaţiile model există cel puţin una supraidentificată.

    49. Ce metodă este folosită pentru a estima parametrii unei ecuații neidentificate?

    a) DMNK, CMNK;

    b) DMNK, MNK;

    C) parametrii unei astfel de ecuații nu pot fi estimați.

    50. La intersecția dintre ce domenii de cunoaștere a apărut econometria:

    A) teoria economică; statistici economice si matematice;

    b) teoria economică, statistica matematică și teoria probabilității;

    c) statistică economică şi matematică, teoria probabilităţilor.

    51. Într-o ecuație de regresie liniară multiplă, intervalele de încredere pentru coeficienții de regresie sunt construite folosind distribuția:

    a) Normal;

    B) Student;

    c) Pearson;

    d) Fischer-Snedecor.

    52. Pe baza a 16 observații, a fost construită o ecuație de regresie liniară pereche. Pentrutestarea semnificaţiei coeficientului de regresie calculatt pentru 6l =2.5.

    a) Coeficientul este nesemnificativ la a=0,05;

    b) Coeficientul este semnificativ la a=0,05;

    c) Coeficientul este semnificativ la a=0,01.

    53. Se ştie că între cantităţiXȘiYexistăconexiune pozitivă. În ce măsurăeste găsit coeficientul de corelație de pereche?

    a) de la -1 la 0;

    b) de la 0 la 1;

    B) de la –1 la 1.

    54. Coeficientul de corelație multiplă este 0,9. Ce procentvarianţa trăsăturii rezultate se explică prin influenţa tuturorsemne factoriale?

    55. Care dintre următoarele metode nu poate fi utilizată pentru a detecta heteroscedasticitatea?

    A) testul Golfeld-Quandt;

    b) Testul de corelare a rangului lui Spearman;

    c) metoda seriei.

    56. Forma redusă a modelului este:

    a) un sistem de funcţii neliniare ale variabilelor exogene din cele endogene;

    B) sistem funcții liniare variabile endogene de la cele exogene;

    c) un sistem de funcţii liniare ale variabilelor exogene din cele endogene;

    d) un sistem de ecuaţii normale.

    57. În ce limite se modifică coeficientul de corelație parțială calculat folosind formule recursive?

    a) de la - la + ;

    b) de la 0 la 1;

    c) de la 0 la + ;

    D) de la –1 la +1.

    58. În ce limite se modifică coeficientul de corelație parțială calculat prin coeficientul de determinare?

    a) de la - la + ;

    B) de la 0 la 1;

    c) de la 0 la + ;

    d) de la –1 la +1.

    59. Variabile exogene:

    a) variabile dependente;

    B) variabile independente;

    61. La adăugarea unui alt factor explicativ la ecuația de regresie, coeficientul de corelație multiplă este:

    a) va scadea;

    b) va crește;

    c) își va păstra sensul.

    62. A fost construită o ecuație de regresie hiperbolică:Y= A+ b/ X. PentruPentru a verifica semnificația ecuației, se utilizează distribuția:

    a) Normal;

    B) Student;

    c) Pearson;

    d) Fischer-Snedecor.

    63. Pentru ce tipuri de sisteme se pot găsi parametrii ecuațiilor econometrice individuale folosind metoda tradițională a celor mai mici pătrate?

    a) un sistem de ecuații normale;

    B) un sistem de ecuații independente;

    C) un sistem de ecuaţii recursive;

    D) un sistem de ecuații interdependente.

    64. Variabile endogene:

    A) variabile dependente;

    b) variabile independente;

    c) datate în momente anterioare.

    65. În ce limite se modifică coeficientul de determinare?

    a) de la 0 la + ;

    b) de la - la + ;

    B) de la 0 la +1;

    d) de la -l la +1.

    66. A fost construită o ecuație de regresie liniară multiplă. Pentru a verifica semnificația coeficienților individuali, utilizați distributie:

    a) Normal;

    b) Testul elevului;

    c) Pearson;

    D) Fischer-Snedecor.

    67. La adăugarea unui alt factor explicativ la ecuația de regresie, coeficientul de determinare:

    a) va scadea;

    B) va crește;

    c) își va păstra sensul;

    d) nu va scadea.

    68. Esența metodei celor mai mici pătrate este aceea că:

    A) estimarea se determină din condiția minimizării sumei abaterilor pătrate a datelor eșantionului de la estimarea determinată;

    b) estimarea se determină din condiția minimizării sumei abaterilor datelor eșantionului de la estimarea determinată;

    c) estimarea se determină din condiția minimizării sumei abaterilor pătrate ale mediei eșantionului de la varianța eșantionului.

    69. Cărei clasă de regresii neliniare aparține parabola:

    73. Cărei clase de regresii neliniare aparține curba exponențială:

    74. Cărei clase de regresii neliniare îi aparține o funcție de forma ŷ?
    :

    A) regresii care sunt neliniare în raport cu variabilele incluse în analiză, dar liniare în raport cu parametrii estimați;

    b) regresii neliniare asupra parametrilor estimaţi.

    78. Cărei clase de regresii neliniare îi aparține o funcție de forma ŷ?
    :

    a) regresii care sunt neliniare în raport cu variabilele incluse în analiză, dar liniare în raport cu parametrii estimați;

    B) regresii neliniare asupra parametrilor estimaţi.

    79. În ecuația de regresie sub forma unei hiperbole ŷ
    dacă valoarea
    b >0 , Acea:

    A) cu o creștere a caracteristicii factorului X valorile atributelor rezultate la scade incet, si cu x→∞ valoarea medie la va fi egal A;

    b) apoi valoarea semnului rezultant la crește odată cu creșterea lentă pe măsură ce trăsătura factorului crește X, și la x→∞

    81. Coeficientul de elasticitate este determinat de formula

    A) Funcția liniară;

    b) Parabole;

    c) Hiperbole;

    d) Curba exponenţială;

    e) Puterea.

    82. Coeficientul de elasticitate este determinat de formula
    pentru un model de regresie sub forma:

    a) Funcția liniară;

    B) Parabole;

    c) Hiperbole;

    d) Curba exponenţială;

    e) Puterea.

    86. Ecuația
    numit:

    A) tendință liniară;

    b) tendinta parabolica;

    c) trend hiperbolic;

    d) tendinţă exponenţială.

    89. Ecuația
    numit:

    a) tendință liniară;

    b) tendinta parabolica;

    c) trend hiperbolic;

    D) tendință exponențială.

    90. Tipuri de sisteme numit:

    A) un sistem de ecuații independente;

    b) un sistem de ecuaţii recursive;

    c) un sistem de ecuații interdependente (articulate, simultane).

    93. Econometria poate fi definită ca:

    A) este o disciplină științifică independentă care combină un set de rezultate teoretice, tehnici, metode și modele menite să ofere, pe baza teoriei economice, a statisticii economice și a instrumentelor matematice și statistice, o expresie cantitativă specifică tiparelor generale (calitative) determinat de teoria economică;

    B) știința măsurătorilor economice;

    B) analiza statistică a datelor economice.

    94. Sarcinile econometriei includ:

    A) prognoza indicatorilor economici și socio-economici care caracterizează starea și dezvoltarea sistemului analizat;

    B) simularea scenariilor posibile de dezvoltare socio-economică a sistemului pentru a identifica modul în care modificările planificate ale anumitor parametri controlabili vor afecta caracteristicile de ieşire;

    c) testarea ipotezelor folosind date statistice.

    95. Relațiile se disting prin natura lor:

    A) funcționale și corelaționale;

    b) funcţional, curbiliniu şi rectiliniu;

    c) corelaţie şi inversă;

    d) statistice şi directe.

    96. În legătură directă cu o creștere a caracteristicii unui factor:

    a) semnul efectiv scade;

    b) semnul rezultat nu se modifică;

    C) semnul efectiv crește.

    97. Ce metode sunt folosite pentru a identifica prezența, natura și direcția relațiilor în statistică?

    a) valori medii;

    B) compararea serii paralele;

    C) metoda grupării analitice;

    d) valori relative;

    D) metoda grafica.

    98. Ce metodă este folosită pentru a identifica forma de influență a unui factor asupra altuia?

    a) analiza corelației;

    B) analiza regresiei;

    c) analiza indicilor;

    d) analiza varianţei.

    99. Ce metodă este folosită pentru a cuantifica puterea influenței unui factor asupra altuia:

    A) analiza corelației;

    b) analiza regresiei;

    c) metoda mediilor;

    d) analiza varianţei.

    100. Ce indicatori există în ceea ce privește valoarea lor variind de la minus la plus unu:

    a) coeficientul de determinare;

    b) relaţia de corelaţie;

    B) coeficientul de corelație liniară.

    101. Coeficientul de regresie pentru un model cu un singur factor arată:

    A) cu câte unități se schimbă funcția când argumentul se schimbă cu o unitate;

    b) cu ce procent se modifică funcția pe unitate de modificare în argument.

    102. Coeficientul de elasticitate arată:

    a) cu ce procent se modifică funcția cu o modificare a argumentului cu o unitate de măsură a acesteia;

    B) cu ce procent se modifică funcția cu o modificare a argumentului cu 1%;

    c) cu câte unități de măsură se modifică funcția cu o modificare a argumentului cu 1%.

    105. Valoarea indicelui de corelare egală cu 0,087 indică:

    A) despre dependența lor slabă;

    b) despre o relație puternică;

    c) despre erorile de calcul.

    107. Valoarea coeficientului de corelație de pereche egală cu 1,12 indică:

    a) despre dependența lor slabă;

    b) despre o relație puternică;

    C) despre erorile de calcul.

    109. Care dintre următoarele numere pot fi valorile coeficientului de corelație de pereche:

    111. Care dintre următoarele numere pot fi valorile coeficientului de corelație multiplă:

    115. Marcați forma corectă a ecuației de regresie liniară:

    Ay
    ;

    de
    ;

    c) ŷ
    ;

    D) ŷ
    .

    După evaluarea parametrilor AȘi b, am obținut o ecuație de regresie prin care putem estima valorile y conform valorilor date X. Este firesc să credem că valorile calculate ale variabilei dependente nu vor coincide cu valorile reale, deoarece linia de regresie descrie relația doar în medie, în general. Semnificațiile individuale sunt împrăștiate în jurul lui. Astfel, fiabilitatea valorilor calculate obținute din ecuația de regresie este determinată în mare măsură de împrăștierea valorilor observate în jurul liniei de regresie. În practică, de regulă, varianța erorii este necunoscută și este estimată din observații simultan cu parametrii de regresie AȘi b. Este destul de logic să presupunem că estimarea este legată de suma pătratelor reziduurilor de regresie. Mărimea este un eșantion de estimare a dispersiei perturbațiilor conținute în modelul teoretic . Se poate demonstra că pentru modelul de regresie pereche

    unde este abaterea valorii reale a variabilei dependente de la valoarea ei calculată.

    Dacă , atunci pentru toate observațiile valorile reale ale variabilei dependente coincid cu valorile calculate (teoretice) . Grafic, aceasta înseamnă că linia de regresie teoretică (o linie construită folosind funcția) trece prin toate punctele câmpului de corelare, ceea ce este posibil doar cu o conexiune strict funcțională. Prin urmare, semnul efectiv la se datorează în întregime influenţei factorului X.

    De obicei, în practică există o oarecare împrăștiere a punctelor câmpului de corelație în raport cu linia de regresie teoretică, adică abateri ale datelor empirice de la cele teoretice. Această împrăștiere se datorează atât influenței factorului X, adică regresie y De X, (o astfel de varianță se numește explicată, deoarece este explicată prin ecuația de regresie), și prin acțiunea altor motive (variație inexplicabilă, aleatorie). Mărimea acestor abateri stă la baza calculării indicatorilor de calitate ai ecuației.

    Conform principiului de bază al analizei varianței, suma totală a abaterilor pătrate ale variabilei dependente y din valoarea medie poate fi descompusă în două componente: explicată prin ecuația de regresie și neexplicată:

    ,

    unde sunt valorile y, calculat conform ecuației.

    Să găsim raportul dintre suma abaterilor pătrate explicate prin ecuația de regresie și suma totală a pătratelor:

    , Unde

    . (7.6)

    Raportul porțiunii de varianță explicată de ecuația de regresie la varianta totala caracteristica efectivă se numește coeficient de determinare. Valoarea nu poate depăși unitatea și această valoare maximă va fi atinsă doar la , adică. când fiecare abatere este zero și, prin urmare, toate punctele de pe diagrama de dispersie se află exact pe o linie dreaptă.

    Coeficientul de determinare caracterizează ponderea varianței explicată prin regresie în varianța totală a variabilei dependente . În consecință, valoarea caracterizează ponderea de variație (dispersie) y, neexplicat de ecuația de regresie și, prin urmare, cauzat de influența altor factori neluați în considerare în model. Cu cât este mai aproape de unitate, cu atât calitatea modelului este mai mare.



    Cu regresia liniară pereche, coeficientul de determinare este egal cu pătratul perechii coeficient liniar corelații: .

    Rădăcina acestui coeficient de determinare este coeficientul de corelație multiplă (indicele) sau raportul de corelație teoretic.

    Pentru a afla dacă valoarea coeficientului de determinare obținut la estimarea regresiei reflectă într-adevăr relația reală dintre yȘi X verificați semnificația ecuației construite ca întreg și a parametrilor individuali. Testarea semnificației unei ecuații de regresie vă permite să știți dacă ecuația de regresie este potrivită pentru uz practic, de exemplu, pentru prognoză sau nu.

    În același timp, este înaintată ipoteza principală despre nesemnificația ecuației în ansamblu, care se reduce formal la ipoteza că parametrii de regresie sunt egali cu zero, sau, ceea ce este același, că coeficientul de determinare este egal. la zero: . O ipoteză alternativă despre semnificația ecuației este ipoteza că parametrii de regresie nu sunt egali cu zero sau că coeficientul de determinare nu este egal cu zero: .

    Pentru a testa semnificația modelului de regresie, utilizați F- Criteriul lui Fisher, calculat ca raportul dintre suma pătratelor (pe o variabilă independentă) și suma reziduală a pătratelor (pe un grad de libertate):

    , (7.7)

    Unde k– numărul de variabile independente.

    După împărțirea numărătorului și numitorului relației (7.7) la suma totală a abaterilor pătrate ale variabilei dependente, F- criteriul poate fi exprimat în mod echivalent pe baza coeficientului:

    .

    Dacă ipoteza nulă este adevărată, atunci varianța explicată de ecuația de regresie și varianța neexplicată (reziduală) nu diferă una de cealaltă.

    Valoarea estimată F- se compară criteriul cu valoarea critică, care depinde de numărul de variabile independente k, și asupra numărului de grade de libertate (n-k-1). Valoarea tabelului (critică). F- criteriul este valoarea maximă a raportului varianțelor care poate apărea dacă acestea diverge aleatoriu pentru un anumit nivel de probabilitate al ipotezei nule. Dacă valoarea calculată F- criteriul este mai mare decât cel tabelar la un anumit nivel de semnificație, atunci se respinge ipoteza nulă despre absența unei relații și se trage o concluzie despre semnificația acestei relații, i.e. modelul este considerat semnificativ.

    Pentru un model de regresie pereche

    .

    În regresia liniară, semnificația nu numai a ecuației în ansamblu, ci și a coeficienților ei individuali este de obicei evaluată. Pentru a face acest lucru, se determină eroarea standard a fiecărui parametru. Erorile standard ale coeficienților de regresie ai parametrilor sunt determinate de formulele:

    , (7.8)

    (7.9)

    Erorile standard ale coeficienților de regresie sau abaterile standard calculate folosind formulele (7.8,7.9), de regulă, sunt date în rezultatele calculării modelului de regresie în pachete statistice.

    Pe baza erorilor pătratice medii ale coeficienților de regresie, se verifică semnificația acestor coeficienți folosind schema uzuală de testare a ipotezelor statistice.

    Ipoteza principală este că coeficientul de regresie „adevărat” diferă nesemnificativ de zero. O ipoteză alternativă în acest caz este ipoteza opusă, adică că parametrul de regresie „adevărat” nu este egal cu zero. Această ipoteză este testată folosind t- statistici care au t-distribuirea elevilor:

    Apoi valorile calculate t- statisticile sunt comparate cu valorile critice t- statistici determinate din tabelele de distribuție Student. Valoarea critică este determinată în funcție de nivelul de semnificație α și numărul de grade de libertate, care este egal cu (n-k-1), n- numărul de observații, k- numărul de variabile independente. În cazul regresiei liniare în perechi, numărul de grade de libertate este (P- 2). Valoarea critică poate fi calculată și pe un computer utilizând funcția încorporată STUDARCOVER în pachetul Excel.

    Dacă valoarea calculată t- statistica este mai mult decât critică, atunci ipoteza principală este respinsă și se crede că cu probabilitate (1-α) coeficientul de regresie „adevărat” este semnificativ diferit de zero, ceea ce este confirmarea statistică a existenței unei dependențe liniare a variabilelor corespunzătoare.

    Dacă valoarea calculată t- statistica este mai puțin decât critică, atunci nu există niciun motiv pentru a respinge ipoteza principală, adică coeficientul de regresie „adevărat” nu diferă semnificativ de zero la nivelul de semnificație α . În acest caz, factorul corespunzător acestui coeficient ar trebui exclus din model.

    Semnificația coeficientului de regresie poate fi stabilită prin construirea unui interval de încredere. Interval de încredere pentru parametrii de regresie AȘi b definit după cum urmează:

    ,

    ,

    unde se determină din tabelul de distribuție Student pentru nivelul de semnificație α și numărul de grade de libertate (P- 2) pentru regresia pereche.

    Deoarece coeficienții de regresie din studiile econometrice au o interpretare economică clară, intervalele de încredere nu trebuie să conțină zero. Valoarea adevărată a unui coeficient de regresie nu poate conține simultan valori pozitive și negative, inclusiv zero, altfel obținem rezultate contradictorii la interpretarea economică a coeficienților, ceea ce nu poate fi cazul. Astfel, coeficientul este semnificativ dacă intervalul de încredere rezultat nu acoperă zero.

    Exemplul 7.4. Conform exemplului 7.1:

    a) Construiți o baie de aburi model liniar regresia dependenței profitului din vânzări de prețul de vânzare folosind software procesarea datelor.

    b) Evaluați semnificația ecuației de regresie în ansamblu folosind F- criteriul Fisher la a=0,05.

    c) Evaluați semnificația coeficienților modelului de regresie folosind t-Testul elevului la a=0,05Și α=0,1.

    Pentru a efectua analiza de regresie folosim un software standard de birou. Programul EXCEL. Vom construi un model de regresie folosind instrumentul REGRESSION al setărilor PACHET DE ANALIZĂ (Fig. 7.5), care este lansat după cum urmează:

    Serviciu Analiza datelorREGRESIUNEOK.

    Fig.7.5. Folosind instrumentul REGRESIUNE

    În caseta de dialog REGRESIUNE, în câmpul Interval de intrare Y, trebuie să introduceți adresa intervalului de celule care conține variabila dependentă. În câmpul Interval de introducere X, trebuie să introduceți adresele unuia sau mai multor intervale care conțin valorile variabilelor independente. Caseta de selectare Etichete din prima linie este setată la activ dacă sunt selectate și antetele coloanei. În fig. 7.6. arată formularul de ecran pentru calcularea unui model de regresie folosind instrumentul REGRESIUNE.

    Orez. 7.6. Construirea unui model de regresie pe perechi folosind

    Instrument REGRESIUNE

    Ca rezultat al instrumentului REGRESIUNE, este generat următorul protocol de analiză de regresie (Fig. 7.7).

    Orez. 7.7. Protocolul analizei regresiei

    Ecuația pentru dependența profitului din vânzări de prețul de vânzare are forma:

    Vom evalua semnificația ecuației de regresie folosind F- Testul lui Fisher. Sens F- Vom lua criteriul Fisher din tabelul „Analiza varianței” din protocolul EXCEL (Fig. 7.7.). Valoarea estimată F- criteriul 53.372. Valoarea tabelului F- criteriu la nivel de semnificație a=0,05și numărul de grade de libertate este 4.964. Deoarece , atunci ecuația este considerată semnificativă.

    Valori calculate t Testele t ale lui Student pentru coeficienții ecuației de regresie sunt prezentate în tabelul cu rezultate (Fig. 7.7). Valoarea tabelului t-Testul studentului la nivel de semnificație a=0,05 iar 10 grade de libertate este 2,228. Pentru coeficientul de regresie A, deci coeficientul A nesemnificativ. Pentru coeficientul de regresie b, prin urmare, coeficientul b semnificativ

    Analiza regresiei este o metodă de cercetare statistică care vă permite să arătați dependența unui anumit parametru de una sau mai multe variabile independente. În era pre-computer, utilizarea sa era destul de dificilă, mai ales când era vorba de volume mari de date. Astăzi, după ce ați învățat cum să construiți regresia în Excel, puteți rezolva probleme statistice complexe în doar câteva minute. Mai jos sunt exemple concrete din domeniul economiei.

    Tipuri de regresie

    Acest concept în sine a fost introdus în matematică în 1886. Are loc regresia:

    • liniar;
    • parabolic;
    • potolit;
    • exponențial;
    • hiperbolic;
    • demonstrativ;
    • logaritmică.

    Exemplul 1

    Să luăm în considerare problema determinării dependenței numărului de membri ai echipei care renunță la salariul mediu la 6 întreprinderi industriale.

    Sarcină. La șase întreprinderi am analizat media lunară salariile si numarul de angajati plecati din cauza după plac. În formă tabelară avem:

    Numărul de persoane care au renunțat

    Salariu

    30.000 de ruble

    35.000 de ruble

    40.000 de ruble

    45.000 de ruble

    50.000 de ruble

    55.000 de ruble

    60.000 de ruble

    Pentru sarcina de a determina dependența numărului de lucrători care renunță la salariul mediu la 6 întreprinderi, modelul de regresie are forma ecuației Y = a 0 + a 1 x 1 +...+a k x k, unde x i sunt variabilele care influențează, a i sunt coeficienții de regresie și k este numărul de factori.

    Pentru această problemă, Y este indicatorul renunțării angajaților, iar factorul de influență este salariul, pe care îl notăm cu X.

    Folosind capacitățile procesorului de foi de calcul Excel

    Analiza de regresie în Excel trebuie să fie precedată de aplicarea funcțiilor încorporate la datele tabelare existente. Cu toate acestea, în aceste scopuri este mai bine să utilizați extensia foarte utilă „Analysis Pack”. Pentru a-l activa aveți nevoie de:

    • din fila „Fișier” accesați secțiunea „Opțiuni”;
    • în fereastra care se deschide, selectați linia „Suplimente”;
    • faceți clic pe butonul „Go” situat mai jos, în dreapta liniei „Management”;
    • bifați caseta de lângă numele „Pachet de analiză” și confirmați acțiunile făcând clic pe „Ok”.

    Dacă totul este făcut corect, butonul necesar va apărea în partea dreaptă a filei „Date”, situată deasupra foii de lucru Excel.

    în Excel

    Acum că avem la îndemână toate instrumentele virtuale necesare pentru a efectua calcule econometrice, putem începe să ne rezolvăm problema. Pentru aceasta:

    • Faceți clic pe butonul „Analiza datelor”;
    • în fereastra care se deschide, faceți clic pe butonul „Regresie”;
    • în fila care apare, introduceți intervalul de valori pentru Y (numărul de angajați care demisionează) și pentru X (salariile acestora);
    • Confirmăm acțiunile noastre apăsând butonul „Ok”.

    Ca rezultat, programul se va completa automat frunză nouă procesor de foi de calcul cu date de analiză de regresie. Notă! Excel vă permite să setați manual locația pe care o preferați în acest scop. De exemplu, aceasta ar putea fi aceeași foaie în care se află valorile Y și X sau chiar un nou registru de lucru special conceput pentru a stoca astfel de date.

    Analiza rezultatelor regresiei pentru R-pătrat

    În Excel, datele obținute în timpul procesării datelor din exemplul luat în considerare au forma:

    În primul rând, ar trebui să acordați atenție valorii R pătrat. Reprezintă coeficientul de determinare. ÎN în acest exemplu R-pătrat = 0,755 (75,5%), adică parametrii calculați ai modelului explică dependența dintre parametrii considerați cu 75,5%. Cu cât valoarea coeficientului de determinare este mai mare, cu atât modelul selectat este considerat mai aplicabil pentru sarcina specifica. Se consideră că se descrie corect situația reală când valoarea R-pătratului este peste 0,8. Dacă R-pătrat<0,5, то такой анализа регрессии в Excel нельзя считать резонным.

    Analiza cotelor

    Numărul 64,1428 arată care va fi valoarea lui Y dacă toate variabilele xi din modelul pe care îl luăm în considerare sunt resetate la zero. Cu alte cuvinte, se poate susține că valoarea parametrului analizat este influențată și de alți factori care nu sunt descriși într-un anumit model.

    Următorul coeficient -0,16285, situat în celula B18, arată ponderea influenței variabilei X asupra Y. Aceasta înseamnă că salariul mediu lunar al angajaților din cadrul modelului luat în considerare afectează numărul de renunțați cu o pondere de -0,16285, adică. gradul de influență a acestuia este complet mic. Semnul „-” indică faptul că coeficientul este negativ. Acest lucru este evident, deoarece toată lumea știe că, cu cât salariul la întreprindere este mai mare, cu atât mai puține persoane își exprimă dorința de a rezilia contractul de muncă sau de a renunța.

    Regresie multiplă

    Acest termen se referă la o ecuație de relație cu mai multe variabile independente de forma:

    y=f(x 1 +x 2 +…x m) + ε, unde y este caracteristica rezultantă (variabilă dependentă), iar x 1, x 2,…x m sunt caracteristici factoriale (variabile independente).

    Estimarea parametrilor

    Pentru regresia multiplă (MR), se efectuează folosind metoda celor mai mici pătrate (OLS). Pentru ecuații liniare de forma Y = a + b 1 x 1 +…+b m x m + ε construim un sistem de ecuații normale (vezi mai jos)

    Pentru a înțelege principiul metodei, luați în considerare un caz cu doi factori. Atunci avem o situație descrisă de formula

    De aici obținem:

    unde σ este varianța caracteristicii corespunzătoare reflectate în indice.

    OLS este aplicabilă ecuației MR pe o scară standardizată. În acest caz, obținem ecuația:

    în care t y, t x 1, … t xm sunt variabile standardizate, pentru care valorile medii sunt egale cu 0; β i sunt coeficienții de regresie standardizați, iar abaterea standard este 1.

    Vă rugăm să rețineți că toate β i în acest caz sunt specificate ca normalizate și centralizate, prin urmare compararea lor între ele este considerată corectă și acceptabilă. În plus, se obișnuiește să se elimine factorii prin eliminarea celor cu cele mai mici valori βi.

    Problemă folosind ecuația de regresie liniară

    Să presupunem că avem un tabel cu dinamica prețurilor pentru un anumit produs N în ultimele 8 luni. Este necesar să luați o decizie cu privire la oportunitatea achiziționării unui lot la un preț de 1850 de ruble/t.

    numărul lunii

    numele lunii

    pretul produsului N

    1750 de ruble pe tonă

    1755 de ruble pe tonă

    1767 ruble pe tonă

    1760 de ruble pe tonă

    1770 de ruble pe tonă

    1790 de ruble pe tonă

    1810 ruble pe tonă

    1840 de ruble pe tonă

    Pentru a rezolva această problemă în procesorul de foi de calcul Excel, trebuie să utilizați instrumentul „Analiza datelor”, deja cunoscut din exemplul prezentat mai sus. Apoi, selectați secțiunea „Regresie” și setați parametrii. Trebuie reținut că în câmpul „Interval de intrare Y” trebuie introdus un interval de valori pentru variabila dependentă (în acest caz, prețurile pentru mărfuri în anumite luni ale anului), iar în „Intervalul de intrare X” - pentru variabila independentă (numărul lunii). Confirmați acțiunea făcând clic pe „Ok”. Pe o foaie nouă (dacă este indicat) obținem date pentru regresie.

    Utilizându-le, construim o ecuație liniară de forma y=ax+b, unde parametrii a și b sunt coeficienții liniei cu numele numărului lunii și coeficienții și liniile „Y-intersection” din foaia cu rezultatele analizei de regresie. Astfel, ecuația de regresie liniară (LR) pentru sarcina 3 este scrisă ca:

    Prețul produsului N = 11,714* număr lunar + 1727,54.

    sau în notație algebrică

    y = 11,714 x + 1727,54

    Analiza rezultatelor

    Pentru a decide dacă ecuația de regresie liniară rezultată este adecvată, se folosesc coeficienții de corelație multiplă (MCC) și de determinare, precum și testul Fisher și testul t Student. În foaia de calcul Excel cu rezultate de regresie, acestea sunt numite multiple R, R-pătrat, F-statistic și, respectiv, t-statistic.

    KMC R face posibilă evaluarea gradului de apropiere a relației probabilistice dintre variabilele independente și dependente. Valoarea sa ridicată indică o legătură destul de puternică între variabilele „Numărul lunii” și „Prețul produsului N în ruble pe 1 tonă”. Cu toate acestea, natura acestei relații rămâne necunoscută.

    Pătratul coeficientului de determinare R2 (RI) este o caracteristică numerică a proporției dispersiei totale și arată dispersia a cărei parte a datelor experimentale, adică. valorile variabilei dependente corespund ecuației de regresie liniară. În problema luată în considerare, această valoare este egală cu 84,8%, adică datele statistice sunt descrise cu un grad ridicat de acuratețe de către SD-ul rezultat.

    F-statisticile, numite și testul lui Fisher, sunt folosite pentru a evalua semnificația unei relații liniare, infirmând sau confirmând ipoteza existenței acesteia.

    (Testul Studentului) ajută la evaluarea semnificației coeficientului cu un termen necunoscut sau liber al relației liniare. Dacă valoarea testului t > tcr, atunci ipoteza despre nesemnificația termenului liber al ecuației liniare este respinsă.

    În problema luată în considerare pentru termenul liber, folosind instrumentele Excel, s-a obținut că t = 169,20903 și p = 2,89E-12, adică avem probabilitate zero ca ipoteza corectă despre nesemnificația termenului liber să fie respinsă. . Pentru coeficientul necunoscutului t=5,79405 și p=0,001158. Cu alte cuvinte, probabilitatea ca ipoteza corectă despre nesemnificația coeficientului pentru o necunoscută să fie respinsă este de 0,12%.

    Astfel, se poate susține că ecuația de regresie liniară rezultată este adecvată.

    Problema fezabilității achiziționării unui bloc de acțiuni

    Regresia multiplă în Excel este efectuată folosind același instrument de analiză a datelor. Să luăm în considerare o problemă specifică de aplicare.

    Conducerea companiei NNN trebuie să decidă oportunitatea achiziționării unui pachet de 20% din MMM JSC. Costul pachetului (SP) este de 70 de milioane de dolari SUA. Specialiștii NNN au colectat date despre tranzacții similare. S-a decis evaluarea valorii blocului de acțiuni în funcție de astfel de parametri, exprimați în milioane de dolari SUA, astfel:

    • conturi de plătit (VK);
    • volumul cifrei de afaceri anuale (VO);
    • conturi de încasat (VD);
    • costul mijloacelor fixe (COF).

    În plus, se utilizează parametrul restanțelor salariale ale întreprinderii (V3 P) în mii de dolari SUA.

    Soluție folosind procesorul de foi de calcul Excel

    În primul rând, trebuie să creați un tabel de date sursă. Arata cam asa:

    • apelați fereastra „Analiza datelor”;
    • selectați secțiunea „Regresie”;
    • În caseta „Interval de intrare Y”, introduceți intervalul de valori ale variabilelor dependente din coloana G;
    • faceți clic pe pictograma săgeată roșie din dreapta ferestrei „Input Range X” și evidențiați pe foaie intervalul tuturor valorilor de la coloanele B,C,D,F.

    Marcați elementul „Foaie de lucru nouă” și faceți clic pe „Ok”.

    Obțineți o analiză de regresie pentru o anumită problemă.

    Studiul rezultatelor și concluziilor

    „Colectăm” ecuația de regresie din datele rotunjite prezentate mai sus pe foaia de calcul Excel:

    SP = 0,103*SOF + 0,541*VO - 0,031*VK +0,405*VD +0,691*VZP - 265,844.

    Într-o formă matematică mai familiară, poate fi scrisă astfel:

    y = 0,103*x1 + 0,541*x2 - 0,031*x3 +0,405*x4 +0,691*x5 - 265,844

    Datele pentru MMM JSC sunt prezentate în tabel:

    Înlocuindu-le în ecuația de regresie, obținem o cifră de 64,72 milioane de dolari SUA. Aceasta înseamnă că acțiunile MMM JSC nu merită cumpărate, deoarece valoarea lor de 70 de milioane de dolari SUA este destul de umflată.

    După cum puteți vedea, utilizarea foii de calcul Excel și a ecuației de regresie au făcut posibilă luarea unei decizii informate cu privire la fezabilitatea unei tranzacții foarte specifice.

    Acum știi ce este regresia. Exemplele Excel discutate mai sus vă vor ajuta să rezolvați probleme practice din domeniul econometriei.