Are multe utilizări, deoarece permite reprezentarea aproximativă funcţie dată altele sunt mai simple. LSM poate fi extrem de util în procesarea observațiilor și este utilizat în mod activ pentru a estima unele cantități pe baza rezultatelor măsurătorilor altora care conțin erori aleatorii. În acest articol veți învăța cum să implementați calcule folosind metoda cele mai mici pătrateîn Excel.

Enunțarea problemei folosind un exemplu specific

Să presupunem că există doi indicatori X și Y. Mai mult, Y depinde de X. Deoarece OLS ne interesează din punct de vedere al analizei de regresie (în Excel metodele sale sunt implementate folosind funcții încorporate), ar trebui să trecem imediat la luarea în considerare a unui problemă specifică.

Deci, să fie X spațiul de vânzare cu amănuntul al unui magazin alimentar, măsurat în metri patrati, iar Y este cifra de afaceri anuală, determinată în milioane de ruble.

Este necesar să se facă o prognoză a cifrei de afaceri (Y) va avea magazinul dacă are cutare sau cutare spațiu comercial. Evident, funcția Y = f (X) este în creștere, deoarece hipermarketul vinde mai multe mărfuri decât taraba.

Câteva cuvinte despre corectitudinea datelor inițiale utilizate pentru predicție

Să presupunem că avem un tabel construit folosind date pentru n magazine.

Conform statisticilor matematice, rezultatele vor fi mai mult sau mai puțin corecte dacă se examinează datele pe cel puțin 5-6 obiecte. În plus, rezultatele „anomale” nu pot fi utilizate. În special, un mic butic de elită poate avea o cifră de afaceri de multe ori mai mare decât cifra de afaceri a unui mare puncte de vânzare cu amănuntul Clasa „Masmarket”.

Esența metodei

Datele din tabel pot fi reprezentate pe un plan cartezian sub forma punctelor M 1 (x 1, y 1), ... M n (x n, y n). Acum soluția problemei se va reduce la selectarea unei funcții de aproximare y = f (x), care are un grafic care trece cât mai aproape de punctele M 1, M 2, .. M n.

Desigur, puteți utiliza un polinom de grad înalt, dar această opțiune nu este doar dificil de implementat, ci și pur și simplu incorectă, deoarece nu va reflecta tendința principală care trebuie detectată. Soluția cea mai rezonabilă este căutarea dreptei y = ax + b, care aproximează cel mai bine datele experimentale, sau mai precis, coeficienții a și b.

Evaluarea acurateței

Cu orice aproximare, evaluarea acurateței sale este de o importanță deosebită. Să notăm cu e i diferența (abaterea) dintre valorile funcționale și experimentale pentru punctul x i, adică e i = y i - f (x i).

Evident, pentru a evalua acuratețea aproximării, puteți utiliza suma abaterilor, adică atunci când alegeți o linie dreaptă pentru o reprezentare aproximativă a dependenței lui X de Y, ar trebui să acordați prioritate celei cu cea mai mică valoare a sum e i la toate punctele luate în considerare. Cu toate acestea, nu totul este atât de simplu, deoarece împreună cu abaterile pozitive vor exista și unele negative.

Problema poate fi rezolvată folosind module de abatere sau pătratele acestora. Ultima metodă este cea mai utilizată. Este folosit în multe domenii, inclusiv în analiza de regresie (implementată în Excel folosind două funcții încorporate) și și-a dovedit de mult eficacitatea.

Metoda celor mai mici pătrate

După cum știți, Excel are o funcție încorporată AutoSum care vă permite să calculați valorile tuturor valorilor situate în intervalul selectat. Astfel, nimic nu ne va împiedica să calculăm valoarea expresiei (e 1 2 + e 2 2 + e 3 2 + ... e n 2).

În notație matematică, aceasta arată astfel:

Deoarece a fost luată inițial decizia de a aproxima folosind o linie dreaptă, avem:

Astfel, sarcina de a găsi linia dreaptă care descrie cel mai bine dependența specifică a mărimilor X și Y se rezumă la calcularea minimului unei funcții a două variabile:

Pentru a face acest lucru, trebuie să echivalați derivatele parțiale față de noile variabile a și b la zero și să rezolvați un sistem primitiv format din două ecuații cu 2 necunoscute de forma:

După câteva transformări simple, inclusiv împărțirea cu 2 și manipularea sumelor, obținem:

Rezolvând-o, de exemplu, folosind metoda lui Cramer, obținem un punct staționar cu anumiți coeficienți a * și b *. Acesta este minimul, adică pentru a estima la ce cifra de afaceri va avea magazinul Zona specifica, linia dreaptă y = a * x + b * va face, care este modelul de regresie pentru exemplul în cauză. Desigur, nu vă va permite să găsiți rezultatul exact, dar vă va ajuta să vă faceți o idee dacă achiziționarea unei anumite zone din creditul magazinului va fi rentabilă.

Cum se implementează cele mai mici pătrate în Excel

Excel are o funcție pentru calcularea valorilor folosind cele mai mici pătrate. Are următoarea formă: „TENDINȚA” (valori Y cunoscute; valori X cunoscute; valori X noi; constantă). Să aplicăm formula de calcul OLS în Excel la tabelul nostru.

Pentru a face acest lucru, introduceți semnul „=” în celula în care ar trebui să fie afișat rezultatul calculului folosind metoda celor mai mici pătrate în Excel și selectați funcția „TENDINȚA”. În fereastra care se deschide, completați câmpurile corespunzătoare, evidențiind:

  • intervalul de valori cunoscute pentru Y (în acest caz, date pentru cifra de afaceri comercială);
  • interval x 1 , …x n , adică dimensiunea spațiului comercial cu amănuntul;
  • atât valorile cunoscute, cât și cele necunoscute ale lui x, pentru care trebuie să aflați dimensiunea cifrei de afaceri (pentru informații despre locația lor pe foaia de lucru, consultați mai jos).

În plus, formula conține variabila logică „Const”. Dacă introduceți 1 în câmpul corespunzător, aceasta va însemna că trebuie să efectuați calculele, presupunând că b = 0.

Dacă trebuie să aflați prognoza pentru mai mult de o valoare x, atunci după introducerea formulei nu trebuie să apăsați „Enter”, ci trebuie să introduceți combinația „Shift” + „Control” + „Enter” pe tastatură.

Unele caracteristici

Analiza regresiei poate fi accesibil chiar și pentru manechin. Formula Excel pentru prezicerea valorii unei matrice de variabile necunoscute — TREND — poate fi folosită chiar și de cei care nu au auzit niciodată de cele mai mici pătrate. Este suficient doar să cunoașteți câteva dintre caracteristicile muncii sale. În special:

  • Dacă aranjați intervalul de valori cunoscute ale variabilei y într-un rând sau coloană, atunci fiecare rând (coloană) cu valori cunoscute x va fi tratat de program ca o variabilă separată.
  • Dacă fereastra TREND nu indică un interval cu x cunoscut, atunci dacă funcția este utilizată în programul Excelîl va trata ca o matrice formată din numere întregi, al căror număr corespunde intervalului cu valorile date ale variabilei y.
  • Pentru a scoate o matrice de valori „prevăzute”, expresia pentru calcularea tendinței trebuie introdusă ca formulă matrice.
  • Dacă nu sunt specificate valori noi ale lui x, atunci funcția TREND le consideră egale cu cele cunoscute. Dacă nu sunt specificate, atunci tabloul 1 este luat ca argument; 2; 3; 4;…, care este proporțional cu intervalul cu parametrii deja specificați y.
  • Intervalul care conține noile valori x trebuie să aibă aceleași sau mai multe rânduri sau coloane ca și intervalul care conține valorile y date. Cu alte cuvinte, trebuie să fie proporțional cu variabilele independente.
  • O matrice cu valori x cunoscute poate conține mai multe variabile. Cu toate acestea, dacă despre care vorbim aproximativ unul, atunci este necesar ca intervalele cu valorile date ale lui x și y să fie proporționale. În cazul mai multor variabile, este necesar ca intervalul cu valorile y date să se încadreze într-o coloană sau un rând.

Funcția PREDICTION

Implementat folosind mai multe funcții. Una dintre ele se numește „PREDICȚIE”. Este similar cu „TENDINȚA”, adică oferă rezultatul calculelor folosind metoda celor mai mici pătrate. Cu toate acestea, doar pentru un X, pentru care valoarea lui Y este necunoscută.

Acum cunoașteți formule în Excel pentru manechine care vă permit să preziceți valoarea viitoare a unui anumit indicator în conformitate cu o tendință liniară.

Sarcina este de a găsi coeficienții de dependență liniară la care funcția a două variabile AȘi b ia cea mai mică valoare. Adică dat AȘi b suma abaterilor pătrate a datelor experimentale de la linia dreaptă găsită va fi cea mai mică. Acesta este punctul întreg al metodei celor mai mici pătrate.

Astfel, rezolvarea exemplului se reduce la găsirea extremului unei funcții a două variabile.

Derivarea formulelor pentru găsirea coeficienților. Se compilează și se rezolvă un sistem de două ecuații cu două necunoscute. Găsirea derivatelor parțiale ale unei funcții prin variabile AȘi b, echivalăm aceste derivate cu zero.

Rezolvăm sistemul de ecuații rezultat folosind orice metodă (de exemplu, metoda substituției sau metoda Cramer) și obținem formule pentru găsirea coeficienților folosind metoda celor mai mici pătrate (LSM).

Dat AȘi b funcţie ia cea mai mică valoare.

Aceasta este întreaga metodă a celor mai mici pătrate. Formula pentru găsirea parametrului A conține sumele , , și parametrul n- cantitatea de date experimentale. Vă recomandăm să calculați separat valorile acestor sume. Coeficient b găsit după calcul A.

Domeniul principal de aplicare a unor astfel de polinoame este prelucrarea datelor experimentale (construcția de formule empirice). Faptul este că un polinom de interpolare construit din valorile funcției obținute prin experiment va fi puternic influențat de „zgomotul experimental”; în plus, la interpolare, nodurile de interpolare nu pot fi repetate, adică. Rezultatele experimentelor repetate în aceleași condiții nu pot fi utilizate. Polinomul pătrat mediu netezește zgomotul și vă permite să utilizați rezultatele mai multor experimente.

Integrare și diferențiere numerică. Exemplu.

Integrare numerică– calculul valorii unei integrale definite (de obicei aproximative). Integrarea numerică este înțeleasă ca un set de metode numerice pentru găsirea valorii unei anumite integrale.

Diferențierea numerică– un set de metode pentru calcularea valorii derivatei unei funcții specificate discret.

Integrare

Formularea problemei. Enunțul problemei matematice: trebuie să găsiți valoarea integrala definita

unde a, b sunt finite, f(x) este continuă pe [a, b].

La rezolvarea problemelor practice, se întâmplă adesea ca integrala să fie incomod sau imposibil de luat analitic: poate să nu fie exprimată în functii elementare, integrandul poate fi specificat sub forma unui tabel etc. În astfel de cazuri se folosesc metode de integrare numerică. Metodele de integrare numerică folosesc înlocuirea ariei unui trapez curbiliniu cu o sumă finită a ariilor celor mai simple forme geometrice, care poate fi calculat exact. În acest sens, ei vorbesc despre utilizarea formulelor de cuadratura.

Majoritatea metodelor folosesc o reprezentare a integralei ca o sumă finită (formulă în pătrare):

Formulele de cuadratura se bazează pe ideea de a înlocui graficul integrandului pe segmentul de integrare cu funcții de mai mult. tip simplu, care poate fi ușor integrat analitic și astfel ușor de calculat. Sarcina de a construi formule în cuadratura este implementată cel mai simplu pentru modelele matematice polinomiale.

Se pot distinge trei grupe de metode:

1. Metodă cu împărțirea segmentului de integrare în intervale egale. Împărțirea în intervale se face în prealabil; de obicei intervalele sunt alese egale (pentru a facilita calcularea funcției la sfârșitul intervalelor). Calculați suprafețele și însumați-le (dreptunghi, trapez, metode Simpson).

2. Metode cu partiţionarea segmentului de integrare folosind puncte speciale (metoda Gauss).

3. Calculul integralelor folosind numere aleatoare (metoda Monte Carlo).

Metoda dreptunghiului. Fie ca funcția (figura) să fie integrată numeric pe segment. Împărțiți segmentul la N intervale egale. Aria fiecăruia dintre N trapezele curbate poate fi înlocuită cu aria unui dreptunghi.

Lățimea tuturor dreptunghiurilor este aceeași și egală cu:

Pentru a selecta înălțimea dreptunghiurilor, puteți selecta valoarea funcției de pe marginea din stânga. În acest caz, înălțimea primului dreptunghi va fi f(a), al doilea - f(x 1),..., N-f(N-1).

Dacă luăm valoarea funcției de pe marginea dreaptă pentru a selecta înălțimea dreptunghiului, atunci în acest caz înălțimea primului dreptunghi va fi f(x 1), al doilea - f(x 2), ... , N - f(x N).

După cum puteți vedea, în acest caz, una dintre formule oferă o aproximare a integralei cu un exces, iar a doua cu o deficiență. Există o altă modalitate - de a utiliza valoarea funcției din mijlocul segmentului de integrare pentru aproximare:

Estimarea erorii absolute a metodei dreptunghiului (la mijloc)

Estimarea erorii absolute a metodelor dreptunghiului stâng și drept.

Exemplu. Calculați pentru întregul interval și împărțiți intervalul în patru secțiuni

Soluţie. Calculul analitic al acestei integrale dă I=arctg(1)–arctg(0)=0,7853981634. În cazul nostru:

1)h = 1; xo = 0; x1 = 1;

2) h = 0,25 (1/4); x0 = 0; x1 = 0,25; x2 = 0,5; x3 = 0,75; x4 = 1;

Să calculăm folosind metoda dreptunghiului din stânga:

Să calculăm folosind metoda dreptunghiului drept:

Să calculăm folosind metoda dreptunghiului mediu:

Metoda trapezoidală. Folosind un polinom de gradul I (o linie dreaptă trasată prin două puncte) pentru a interpola rezultă formula trapezoidală. Capetele segmentului de integrare sunt luate ca noduri de interpolare. Astfel, trapezul curbiliniu este înlocuit cu un trapez obișnuit, a cărui zonă poate fi găsită ca produsul dintre jumătate din suma bazelor și înălțimea

În cazul a N segmente de integrare pentru toate nodurile, cu excepția punctelor extreme ale segmentului, valoarea funcției va fi inclusă în suma totală de două ori (deoarece trapezele adiacente au o latură comună)

Formula trapezoidală poate fi obținută luând jumătate din suma formulelor dreptunghiurilor de-a lungul marginilor din dreapta și din stânga segmentului:

Verificarea stabilității soluției. De regulă, cu cât lungimea fiecărui interval este mai scurtă, de exemplu. Cum număr mai mare aceste intervale, cu atât diferența dintre valoarea aproximativă și exactă a integralei este mai mică. Acest lucru este valabil pentru majoritatea funcțiilor. În metoda trapezului, eroarea în calcularea integralei ϭ este aproximativ proporțională cu pătratul pasului de integrare (ϭ ~ h 2).Astfel, pentru a calcula integrala unei anumite funcții în termeni de a, b, este necesar să se calculeze împărțiți segmentul în N 0 intervale și găsiți suma ariilor trapezului. Apoi, trebuie să creșteți numărul de intervale N 1, să calculați din nou suma trapezului și să comparați valoarea rezultată cu rezultatul anterior. Acest lucru ar trebui repetat până la (N i) până când este atinsă precizia specificată a rezultatului (criteriul de convergență).

Pentru metodele dreptunghi și trapez, de obicei la fiecare pas de iterație numărul de intervale crește de 2 ori (N i +1 = 2N i).

Criteriul de convergență:

Principalul avantaj al regulii trapezoidale este simplitatea sa. Cu toate acestea, dacă este necesară o precizie ridicată la calcularea integralei, utilizarea acestei metode poate necesita prea mult cantitate mare iterații.

Eroarea absolută a metodei trapezoidale este estimat ca
.

Exemplu. Calculați o integrală aproximativ definită folosind formula trapezoidală.

a) Împărțirea segmentului de integrare în 3 părți.
b) Împărțirea segmentului de integrare în 5 părți.

Soluţie:
a) După condiție, segmentul de integrare trebuie împărțit în 3 părți, adică.
Să calculăm lungimea fiecărui segment de partiție: .

Prin urmare, formula generala trapezul este redus la o dimensiune plăcută:

In cele din urma:

Permiteți-mi să vă reamintesc că valoarea rezultată este o valoare aproximativă a zonei.

b) Să împărțim segmentul de integrare în 5 părți egale, adică. Prin creșterea numărului de segmente, creștem acuratețea calculelor.

Dacă , atunci formula trapezoidală ia următoarea formă:

Să găsim pasul de partiție:
, adică lungimea fiecărui segment intermediar este de 0,6.

La finalizarea sarcinii, este convenabil să formalizați toate calculele folosind un tabel de calcul:

În prima linie scriem „contor”

Ca urmare:

Ei bine, chiar există o clarificare, și una serioasă!
Dacă pentru 3 segmente de partiție, atunci pentru 5 segmente. Dacă luați un segment și mai mare => va fi și mai precis.

Formula lui Simpson. Formula trapezoidală dă un rezultat care depinde puternic de mărimea pasului h, care afectează acuratețea calculării unei anumite integrale, mai ales în cazurile în care funcția este nemonotonă. Se poate presupune că acuratețea calculelor va crește dacă, în loc de segmente drepte care înlocuiesc fragmente curbilinii ale graficului funcției f(x), vom folosi, de exemplu, fragmente de parabole date prin trei puncte adiacente ale graficului. Această interpretare geometrică stă la baza metodei lui Simpson de calculare a integralei definite. Întregul interval integrare a,b N segmente sunt împărțite, lungimea segmentului va fi, de asemenea, egală cu h=(b-a)/N.

Formula lui Simpson arată astfel:

termenul rămas

Pe măsură ce lungimea segmentelor crește, acuratețea formulei scade, deci pentru a crește precizia, se folosește formula compusă a lui Simpson. Întregul interval de integrare este împărțit în număr par segmente identice N, lungimea segmentului va fi de asemenea egală cu h=(b-a)/N. Formula compusă a lui Simpson este:

În formulă, expresiile dintre paranteze reprezintă sumele valorilor integrandului de la capetele segmentelor interne pare, respectiv.

Restul formulei lui Simpson este proporțional cu puterea a patra a pasului:

Exemplu: Folosind regula lui Simpson, calculați integrala. (Soluție exactă - 0,2)

metoda Gauss

Formula de cuadratura gaussiana. Principiul de bază al formulelor de cuadratura de al doilea tip este vizibil din Figura 1.12: este necesar să se plaseze punctele în acest fel X 0 și X 1 în interiorul segmentului [ A;b], astfel încât aria totală a „triunghiurilor” să fie egală cu aria „segmentului”. Când se utilizează formula Gauss, segmentul original [ A;b] se reduce la segmentul [-1;1] prin înlocuirea variabilei X pe

0.5∙(bA)∙t+ 0.5∙(b + A).

Apoi , Unde .

O astfel de înlocuire este posibilă dacă AȘi b sunt finite, iar funcția f(X) este continuă pe [ A;b]. Formula Gauss la n puncte x i, i=0,1,..,n-1 în interiorul segmentului [ A;b]:

, (1.27)

Unde t iȘi A i pentru diverse n sunt date în cărți de referință. De exemplu, când n=2 A 0 =A 1 =1; la n=3: t 0 =t 2 "0,775, t 1 =0, A 0 =A 2 "0,555, A 1 "0,889.

Formula de cuadratura gaussiana

obţinută cu o funcţie de greutate egală cu unitatea p(x)= 1 și noduri x i, care sunt rădăcinile polinoamelor Legendre

Cote A i ușor de calculat folosind formule

i=0,1,2,...n.

Valorile nodurilor și coeficienților pentru n=2,3,4,5 sunt date în tabel

Ordin Noduri Cote
n=2 x 1=0 x 0 =-x 2=0.7745966692 A 1=8/9 A 0 = A 2=5/9
n=3 x 2 =-x 1=0.3399810436 x 3 =-x 0=0.8611363116 A 1 = A 2=0.6521451549 A 0 = A 3=0.6521451549
n=4 X 2 = 0 X 3 = -X 1 = 0.5384693101 X 4 =-X 0 =0.9061798459 A 0 =0.568888899 A 3 =A 1 =0.4786286705 A 0 =A 4 =0.2869268851
n=5 X 5 = -X 0 =0.9324695142 X 4 = -X 1 =0.6612093865 X 3 = -X 2 =0.2386191861 A 5 =A 0 =0.1713244924 A 4 =A 1 =0.3607615730 A 3 =A 2 =0.4679139346

Exemplu. Calculați valoarea utilizând formula Gauss pentru n=2:

Valoare exacta: .

Algoritmul de calcul al integralei folosind formula Gauss nu implică dublarea numărului de microsegmente, ci creșterea numărului de ordonate cu 1 și compararea valorilor obținute ale integralei. Avantajul formulei Gauss este precizia sa ridicată cu un număr relativ mic de ordonate. Dezavantaje: incomod pentru calcule manuale; este necesar să stocați valorile în memoria computerului t i, A i pentru diverse n.

Eroarea formulei de cuadratura gaussiană pe segment va fi Pentru restul termenului formula va fi și coeficientul α N scade rapid odata cu cresterea N. Aici

Formulele gaussiene oferă o precizie ridicată chiar și cu un număr mic de noduri (de la 4 la 10). În acest caz, în calculele practice, numărul de noduri variază de la câteva sute la câteva mii. De remarcat, de asemenea, că ponderile cuadraturilor gaussiene sunt întotdeauna pozitive, ceea ce asigură stabilitatea algoritmului de calcul al sumelor.

Diferenţiere. Când rezolvați probleme, este adesea necesar să găsiți derivata de o anumită ordine din funcția f(x), dată într-un tabel. În plus, uneori, din cauza complexității expresiei analitice a funcției f(x), diferențierea directă a acesteia este prea dificilă, precum și la rezolvarea numerică. ecuatii diferentiale. În aceste cazuri, se utilizează diferențierea numerică.

După aliniere obținem funcția următorul tip: g (x) = x + 1 3 + 1 .

Putem aproxima aceste date folosind relația liniară y = a x + b calculând parametrii corespunzători. Pentru a face acest lucru, va trebui să aplicăm așa-numita metodă a celor mai mici pătrate. De asemenea, va trebui să faceți un desen pentru a verifica care linie va alinia cel mai bine datele experimentale.

Yandex.RTB R-A-339285-1

Ce este exact MOL (metoda celor mai mici pătrate)

Principalul lucru pe care trebuie să-l facem este să găsim astfel de coeficienți de dependență liniară la care valoarea funcției a două variabile F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 va fi valoarea cel mai mic. Cu alte cuvinte, pentru anumite valori ale lui a și b, suma abaterilor pătrate ale datelor prezentate de la linia dreaptă rezultată va avea o valoare minimă. Acesta este sensul metodei celor mai mici pătrate. Tot ce trebuie să facem pentru a rezolva exemplul este să găsim extremul funcției a două variabile.

Cum se obțin formule pentru calcularea coeficienților

Pentru a obține formule pentru calcularea coeficienților, trebuie să creați și să rezolvați un sistem de ecuații cu două variabile. Pentru a face acest lucru, calculăm derivatele parțiale ale expresiei F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 față de a și b și le echivalăm cu 0.

δ F (a , b) δ a = 0 δ F (a , b) δ b = 0 ⇔ - 2 ∑ i = 1 n (y i - (a x i + b)) x i = 0 - 2 ∑ i = 1 n ( y i - (a x i + b)) = 0 ⇔ a ∑ i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + ∑ i = 1 n b = ∑ i = 1 n y i ⇔ ∑ i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + n b = ∑ i = 1 n y i

Pentru a rezolva un sistem de ecuații, puteți utiliza orice metodă, de exemplu, substituția sau metoda lui Cramer. Ca rezultat, ar trebui să avem formule care să poată fi utilizate pentru a calcula coeficienți folosind metoda celor mai mici pătrate.

n ∑ i = 1 n x i y i - ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - ∑ i = 1 n x i 2 b = ∑ i = 1 n y i - a ∑ i = 1 n x i n

Am calculat valorile variabilelor la care funcția
F (a , b) = ∑ i = 1 n (y i - (a x i + b)) 2 va lua valoarea minimă. În al treilea paragraf vom demonstra de ce este exact așa.

Aceasta este aplicarea metodei celor mai mici pătrate în practică. Formula sa, care este folosită pentru a găsi parametrul a, include ∑ i = 1 n x i, ∑ i = 1 n y i, ∑ i = 1 n x i y i, ∑ i = 1 n x i 2, precum și parametrul
n – denotă cantitatea de date experimentale. Vă sfătuim să calculați fiecare sumă separat. Valoarea coeficientului b se calculează imediat după a.

Să revenim la exemplul inițial.

Exemplul 1

Aici avem n egal cu cinci. Pentru a face mai convenabil calcularea sumelor necesare incluse în formulele coeficientului, să completăm tabelul.

i = 1 i=2 i=3 i=4 i=5 ∑ i = 1 5
x i 0 1 2 4 5 12
y eu 2 , 1 2 , 4 2 , 6 2 , 8 3 12 , 9
x i y i 0 2 , 4 5 , 2 11 , 2 15 33 , 8
x i 2 0 1 4 16 25 46

Soluţie

Al patrulea rând include datele obținute prin înmulțirea valorilor din al doilea rând cu valorile celui de-al treilea pentru fiecare individ i. A cincea linie conține datele din a doua, la pătrat. Ultima coloană arată sumele valorilor rândurilor individuale.

Să folosim metoda celor mai mici pătrate pentru a calcula coeficienții a și b de care avem nevoie. Pentru a face acest lucru, să înlocuim valorile cerute din ultima coloană și calculați sumele:

n ∑ i = 1 n x i y i - ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - ∑ i = 1 n x i 2 b = ∑ i = 1 n y i - a ∑ i = 1 n x i n ⇒ a = 8 5 - 12 12, 9 5 46 - 12 2 b = 12, 9 - a 12 5 ⇒ a ≈ 0, 165 b ≈ 2, 184

Se pare că linia dreaptă de aproximare necesară va arăta ca y = 0, 165 x + 2, 184. Acum trebuie să determinăm care linie va aproxima mai bine datele - g (x) = x + 1 3 + 1 sau 0, 165 x + 2, 184. Să estimăm folosind metoda celor mai mici pătrate.

Pentru a calcula eroarea, trebuie să găsim suma abaterilor pătrate ale datelor din liniile drepte σ 1 = ∑ i = 1 n (y i - (a x i + b i)) 2 și σ 2 = ∑ i = 1 n (y i - g (x i)) 2, valoarea minimă va corespunde unei linii mai potrivite.

σ 1 = ∑ i = 1 n (y i - (a x i + b i)) 2 = = ∑ i = 1 5 (y i - (0, 165 x i + 2, 184)) 2 ≈ 0, 019 σ 2 = ∑ i = 1 n (y i - g (x i)) 2 = = ∑ i = 1 5 (y i - (x i + 1 3 + 1)) 2 ≈ 0,096

Răspuns: deoarece σ 1< σ 2 , то прямой, наилучшим образом аппроксимирующей исходные данные, будет
y = 0,165 x + 2,184.

Metoda celor mai mici pătrate este prezentată clar în ilustrația grafică. Linia roșie marchează linia dreaptă g (x) = x + 1 3 + 1, linia albastră marchează y = 0, 165 x + 2, 184. Datele originale sunt indicate prin puncte roz.

Să explicăm de ce sunt necesare exact aproximări de acest tip.

Ele pot fi utilizate în sarcini care necesită netezirea datelor, precum și în acelea în care datele trebuie interpolate sau extrapolate. De exemplu, în problema discutată mai sus, s-ar putea găsi valoarea mărimii observate y la x = 3 sau la x = 6. Am dedicat un articol separat unor astfel de exemple.

Dovada metodei OLS

Pentru ca funcția să ia o valoare minimă atunci când se calculează a și b, este necesar ca la un punct dat matricea formei pătratice a diferențială a funcției de forma F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 este definit pozitiv. Să vă arătăm cum ar trebui să arate.

Exemplul 2

Avem o diferență de ordinul doi de următoarea formă:

d 2 F (a ; b) = δ 2 F (a ; b) δ a 2 d 2 a + 2 δ 2 F (a ; b) δ a δ b d a d b + δ 2 F (a ; b) δ b 2 d 2 b

Soluţie

δ 2 F (a ; b) δ a 2 = δ δ F (a ; b) δ a δ a = = δ - 2 ∑ i = 1 n (y i - (a x i + b)) x i δ a = 2 ∑ i = 1 n (x i) 2 δ 2 F (a; b) δ a δ b = δ δ F (a; b) δ a δ b = = δ - 2 ∑ i = 1 n (y i - (a x i + b) ) x i δ b = 2 ∑ i = 1 n x i δ 2 F (a ; b) δ b 2 = δ δ F (a ; b) δ b δ b = δ - 2 ∑ i = 1 n (y i - (a x i + b)) δ b = 2 ∑ i = 1 n (1) = 2 n

Cu alte cuvinte, o putem scrie astfel: d 2 F (a ; b) = 2 ∑ i = 1 n (x i) 2 d 2 a + 2 2 ∑ x i i = 1 n d a d b + (2 n) d 2 b.

Am obținut o matrice de forma pătratică M = 2 ∑ i = 1 n (x i) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n .

În acest caz valorile elemente individuale nu se va schimba în funcție de a și b. Este această matrice pozitivă definită? Pentru a răspunde la această întrebare, să verificăm dacă minorii ei unghiulari sunt pozitivi.

Se calculează minorul unghiular de ordinul întâi: 2 ∑ i = 1 n (x i) 2 > 0 . Deoarece punctele x i nu coincid, inegalitatea este strictă. Vom ține cont de acest lucru în calculele ulterioare.

Calculăm minorul unghiular de ordinul doi:

d e t (M) = 2 ∑ i = 1 n (x i) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n = 4 n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2

După aceasta, procedăm la demonstrarea inegalității n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 folosind inducția matematică.

  1. Să verificăm dacă această inegalitate este valabilă pentru un n arbitrar. Să luăm 2 și să calculăm:

2 ∑ i = 1 2 (x i) 2 - ∑ i = 1 2 x i 2 = 2 x 1 2 + x 2 2 - x 1 + x 2 2 = = x 1 2 - 2 x 1 x 2 + x 2 2 = x 1 + x 2 2 > 0

Am obținut o egalitate corectă (dacă valorile x 1 și x 2 nu coincid).

  1. Să presupunem că această inegalitate va fi adevărată pentru n, i.e. n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 – adevărat.
  2. Acum vom demonstra validitatea pentru n + 1, i.e. că (n + 1) ∑ i = 1 n + 1 (x i) 2 - ∑ i = 1 n + 1 x i 2 > 0, dacă n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 .

Noi calculăm:

(n + 1) ∑ i = 1 n + 1 (x i) 2 - ∑ i = 1 n + 1 x i 2 = = (n + 1) ∑ i = 1 n (x i) 2 + x n + 1 2 - ∑ i = 1 n x i + x n + 1 2 = = n ∑ i = 1 n (x i) 2 + n x n + 1 2 + ∑ i = 1 n (x i) 2 + x n + 1 2 - - ∑ i = 1 n x i 2 + 2 x n + 1 ∑ i = 1 n x i + x n + 1 2 = = ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + n x n + 1 2 - x n + 1 ∑ i = 1 n x i + ∑ i = 1 n (x i) 2 = = ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + x n + 1 2 - 2 x n + 1 x 1 + x 1 2 + + x n + 1 2 - 2 x n + 1 x 2 + x 2 2 + . . . + x n + 1 2 - 2 x n + 1 x 1 + x n 2 = = n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + + (x n + 1 - x 1) 2 + (x n + 1) - x 2) 2 + . . . + (x n - 1 - x n) 2 > 0

Expresia cuprinsă între acolade va fi mai mare decât 0 (pe baza a ceea ce am presupus la pasul 2), iar termenii rămași vor fi mai mari decât 0, deoarece toți sunt pătrate de numere. Am dovedit inegalitatea.

Răspuns: a și b găsite se vor potrivi cea mai mică valoare funcțiile F (a , b) = ∑ i = 1 n (y i - (a x i + b)) 2, ceea ce înseamnă că sunt parametrii doriti ai metodei celor mai mici pătrate (LSM).

Dacă observați o eroare în text, vă rugăm să o evidențiați și să apăsați Ctrl+Enter

Care găsește cea mai largă aplicație în diverse domenii ale științei și activitati practice. Aceasta ar putea fi fizică, chimie, biologie, economie, sociologie, psihologie și așa mai departe. Prin voința sorții, de multe ori trebuie să mă ocup de economie și, prin urmare, astăzi vă voi aranja o excursie într-o țară uimitoare numită Econometrie=) ...Cum sa nu-l vrei?! Este foarte bine acolo – trebuie doar să vă hotărâți! ...Dar ceea ce probabil că vrei cu siguranță este să înveți cum să rezolvi problemele metoda celor mai mici pătrate. Și mai ales cititorii harnici vor învăța să le rezolve nu doar cu acuratețe, ci și FOARTE RAPID ;-) Dar mai întâi expunerea generală a problemei+ exemplu însoțitor:

Lasă să intre pe unii domeniul subiectului se studiază indicatorii care au o expresie cantitativă. În același timp, există toate motivele să credem că indicatorul depinde de indicator. Această ipoteză poate fi fie o ipoteză științifică, fie bazată pe elementar bun simț. Să lăsăm totuși știința deoparte și să explorăm zone mai apetisante - și anume, magazinele alimentare. Să notăm prin:

– suprafata comerciala a unui magazin alimentar, mp,
– cifra de afaceri anuală a unui magazin alimentar, milioane de ruble.

Este absolut clar că, cu cât suprafața magazinului este mai mare, cu atât va fi mai mare în majoritatea cazurilor cifra de afaceri a acestuia.

Sa presupunem ca dupa efectuarea observatiilor/experimentelor/calculelor/dansurilor cu tamburina avem la dispozitie date numerice:

Cu magazinele alimentare, cred că totul este clar: - aceasta este zona primului magazin, - cifra de afaceri anuală a acestuia, - zona celui de-al doilea magazin, - cifra de afaceri anuală etc. Apropo, nu este deloc necesar să aveți acces la materiale clasificate - o evaluare destul de precisă a cifrei de afaceri comerciale poate fi obținută prin intermediul statistici matematice. Totuși, să nu ne distragem, cursul de spionaj comercial este deja plătit =)

Datele tabelare pot fi, de asemenea, scrise sub formă de puncte și descrise în forma familiară Sistemul cartezian .

Să răspundem la o întrebare importantă: Câte puncte sunt necesare pentru un studiu calitativ?

Cu cât mai mare cu atât mai bine. Setul minim acceptabil este format din 5-6 puncte. În plus, atunci când cantitatea de date este mică, rezultatele „anomale” nu pot fi incluse în eșantion. Deci, de exemplu, un mic magazin de elită poate câștiga ordine de mărime mai mult decât „colegii săi”, distorsionând astfel model general, care este ceea ce trebuie să găsiți!

Pentru a spune foarte simplu, trebuie să selectăm o funcție, programa care trece cât mai aproape de puncte . Această funcție este numită aproximând (aproximare - aproximare) sau functie teoretica . În general, aici apare imediat un „concurent” evident - un polinom de grad înalt, al cărui grafic trece prin TOATE punctele. Dar această opțiune este complicată și adesea pur și simplu incorectă. (deoarece graficul se va „încerca” tot timpul și reflectă slab tendința principală).

Astfel, funcția căutată trebuie să fie destul de simplă și, în același timp, să reflecte adecvat dependența. După cum ați putea ghici, una dintre metodele pentru găsirea unor astfel de funcții este numită metoda celor mai mici pătrate. În primul rând, să ne uităm la esența sa în vedere generala. Lasă o anumită funcție să aproximeze datele experimentale:


Cum se evaluează acuratețea acestei aproximări? Să calculăm și diferențele (abaterile) dintre valorile experimentale și cele funcționale (studiam desenul). Primul gând care îmi vine în minte este de a estima cât de mare este suma, dar problema este că diferențele pot fi negative (De exemplu, ) iar abaterile ca urmare a unei astfel de însumări se vor anula reciproc. Prin urmare, ca o estimare a preciziei aproximării, se cere să se ia suma module abateri:

sau prăbușit: (în cazul în care cineva nu știe: – aceasta este pictograma sumă și – o variabilă „contor” auxiliară, care ia valori de la 1 la ).

Apropierea punctelor experimentale diverse funcții, vom primi sensuri diferiteși, evident, acolo unde această sumă este mai mică, acea funcție este mai precisă.

O astfel de metodă există și se numește metoda modulului minim. Cu toate acestea, în practică am primit multe distributie mai mare metoda celor mai mici pătrate, în care posibilele valori negative sunt eliminate nu de modul, ci prin pătrarea abaterilor:

, după care eforturile sunt îndreptate spre selectarea unei funcții astfel încât suma abaterilor pătrate era cât se poate de mică. De fapt, de aici provine numele metodei.

Și acum ne întoarcem la altceva punct important: după cum sa menționat mai sus, funcția selectată ar trebui să fie destul de simplă - dar există și multe astfel de funcții: liniar , hiperbolic, exponenţială, logaritmică, pătratică etc. Și, desigur, aici aș dori imediat să „reduc domeniul de activitate”. Ce clasă de funcții ar trebui să aleg pentru cercetare? O tehnică primitivă, dar eficientă:

– Cel mai simplu mod este să descrii puncte pe desen și analizați locația acestora. Dacă au tendința de a alerga în linie dreaptă, atunci ar trebui să cauți ecuația unei linii cu valori optime și . Cu alte cuvinte, sarcina este de a găsi ACEPTĂ coeficienți astfel încât suma abaterilor pătrate să fie cea mai mică.

Dacă punctele sunt situate, de exemplu, de-a lungul hiperbolă, atunci este evident clar că funcția liniară va da o aproximare slabă. În acest caz, căutăm cei mai „favorabili” coeficienți pentru ecuația hiperbolei – cele care dau suma minimă de pătrate .

Acum rețineți că în ambele cazuri vorbim funcţiile a două variabile, ale căror argumente sunt parametrii de dependență căutați:

Și, în esență, trebuie să rezolvăm o problemă standard - găsiți funcţie minimă a două variabile.

Să ne amintim exemplul nostru: să presupunem că punctele „de depozit” tind să fie situate în linie dreaptă și există toate motivele să credem că dependență liniară cifra de afaceri din spațiul comercial. Să găsim astfel de coeficienți „a” și „fi” astfel încât suma abaterilor pătrate a fost cel mai mic. Totul este ca de obicei - mai întâi Derivate parțiale de ordinul I. Conform regula liniarității Puteți diferenția chiar sub pictograma sumă:

Dacă doriți să folosiți aceste informații pentru un eseu sau un referat, vă voi fi foarte recunoscător pentru linkul din lista de surse; veți găsi astfel de calcule detaliate în câteva locuri:

Să creăm un sistem standard:

Reducem fiecare ecuație cu „două” și, în plus, „despărțim” sumele:

Notă : analizați în mod independent de ce „a” și „fi” pot fi scoase dincolo de pictograma sumei. Apropo, formal acest lucru se poate face cu suma

Să rescriem sistemul în formă „aplicată”:

după care începe să apară algoritmul pentru rezolvarea problemei noastre:

Cunoaștem coordonatele punctelor? Noi stim. Sume il putem gasi? Uşor. Să facem cel mai simplu sistem de două ecuații liniare în două necunoscute(„a” și „fi”). Rezolvăm sistemul, de exemplu, metoda lui Cramer, în urma căruia obținem un punct staționar. Control condiție suficientă pentru un extremum, putem verifica că în acest moment funcția ajunge exact minim. Verificarea presupune calcule suplimentare și, prin urmare, o vom lăsa în culise (dacă este necesar, cadrul lipsă poate fi vizualizat). Tragem concluzia finală:

Funcţie cel mai bun mod (cel puțin în comparație cu orice altă funcție liniară) apropie punctele experimentale . În linii mari, graficul său trece cât mai aproape de aceste puncte. In traditie econometrie funcţia de aproximare rezultată se mai numeşte ecuația de regresie liniară pereche .

Problema luată în considerare este de mare importanță practică. În situația noastră exemplu, Ec. vă permite să preziceți ce cifră de afaceri comercială ("Igrec") magazinul va avea la una sau alta valoare a zonei de vânzare (unul sau altul sens al lui „x”). Da, prognoza rezultată va fi doar o prognoză, dar în multe cazuri se va dovedi a fi destul de precisă.

Voi analiza doar o problemă cu numerele „reale”, deoarece nu există dificultăți în ea - toate calculele sunt la nivelul curiculumul scolar 7-8 clase. În 95 la sută din cazuri, vi se va cere să găsiți doar o funcție liniară, dar la sfârșitul articolului voi arăta că nu este mai dificil să găsiți ecuațiile hiperbolei optime, ale exponențiale și ale altor funcții.

De fapt, tot ce rămâne este să distribuiți bunătățile promise - astfel încât să puteți învăța să rezolvați astfel de exemple nu numai cu acuratețe, ci și rapid. Studiem cu atenție standardul:

Sarcină

În urma studierii relației dintre doi indicatori, am obținut următoarele perechi numere:

Folosind metoda celor mai mici pătrate, găsiți funcția liniară care aproximează cel mai bine empiric (cu experienta) date. Realizați un desen pe care să construiți puncte experimentale și un grafic al funcției de aproximare într-un sistem de coordonate dreptunghiular cartezian . Aflați suma abaterilor pătrate dintre valorile empirice și teoretice. Aflați dacă funcția ar fi mai bună (din punct de vedere al metodei celor mai mici pătrate) apropie punctele experimentale.

Vă rugăm să rețineți că semnificațiile „x” sunt naturale, iar aceasta are un sens caracteristic caracteristic, despre care voi vorbi puțin mai târziu; dar ele, desigur, pot fi și fracționate. În plus, în funcție de conținutul unei anumite sarcini, atât valorile „X” cât și „joc” pot fi complet sau parțial negative. Ei bine, ni s-a dat o sarcină „fără chip” și o începem soluţie:

Găsim coeficienții funcției optime ca soluție a sistemului:

În scopul unei înregistrări mai compacte, variabila „contor” poate fi omisă, deoarece este deja clar că însumarea se realizează de la 1 la .

Calcul sumele cerute Este mai convenabil să-l puneți în formă tabelară:


Calculele pot fi efectuate pe un microcalculator, dar este mult mai bine să utilizați Excel - atât mai rapid, cât și fără erori; vezi un scurt video:

Astfel, obținem următoarele sistem:

Aici puteți înmulți a doua ecuație cu 3 și scădeți al 2-lea din prima ecuație termen cu termen. Dar acesta este noroc - în practică, sistemele nu sunt adesea un cadou și, în astfel de cazuri, economisesc metoda lui Cramer:
, ceea ce înseamnă că sistemul are o soluție unică.

Sa verificam. Înțeleg că nu vrei, dar de ce să sari peste erorile în care nu pot fi ratate? Să înlocuim soluția găsită în partea stanga fiecare ecuație a sistemului:

Se obțin părțile din dreapta ecuațiilor corespunzătoare, ceea ce înseamnă că sistemul este rezolvat corect.

Astfel, funcția de aproximare dorită: – de la toata lumea funcții liniare Ea este cea care aproximează cel mai bine datele experimentale.

Spre deosebire de Drept dependenţa cifrei de afaceri a magazinului de suprafaţa acestuia, dependenţa constatată este verso (principiul „cu cât mai mult, cu atât mai puțin”), iar acest fapt este imediat relevat de negativ pantă. Funcţie ne spune că cu o creștere a unui anumit indicator cu 1 unitate, valoarea indicatorului dependent scade in medie cu 0,65 unități. După cum se spune, cu cât prețul hrișcii este mai mare, cu atât se vinde mai puțin.

Pentru a reprezenta graficul funcției de aproximare, găsim cele două valori ale acesteia:

și executați desenul:


Linia dreaptă construită se numește linie de tendință (și anume, o linie de tendință liniară, adică în caz general o tendință nu este neapărat o linie dreaptă). Toată lumea este familiarizată cu expresia „a fi în tendință” și cred că acest termen nu are nevoie de comentarii suplimentare.

Să calculăm suma abaterilor pătrate între valorile empirice şi cele teoretice. Geometric, aceasta este suma pătratelor lungimii segmentelor „zmeură”. (dintre care două sunt atât de mici încât nici măcar nu sunt vizibile).

Să rezumam calculele într-un tabel:


Din nou, pot fi făcute manual; pentru orice eventualitate, voi da un exemplu pentru primul punct:

dar este mult mai eficient să o faci în modul deja cunoscut:

Repetăm ​​încă o dată: Care este semnificația rezultatului obținut? Din toate funcțiile liniare funcția y indicatorul este cel mai mic, adică din familia sa este cea mai bună aproximare. Și aici, apropo, întrebarea finală a problemei nu este întâmplătoare: ce se întâmplă dacă funcția exponențială propusă ar fi mai bine să apropii punctele experimentale?

Să găsim suma corespunzătoare a abaterilor pătrate - pentru a distinge, le voi desemna cu litera „epsilon”. Tehnica este exact aceeași:


Și din nou, pentru orice eventualitate, calculele pentru primul punct:

În Excel folosim funcția standard EXP (sintaxa poate fi găsită în Ajutor Excel).

Concluzie: , ceea ce înseamnă că funcția exponențială aproximează punctele experimentale mai rău decât o dreaptă .

Dar aici trebuie remarcat că „mai rău” este nu înseamnă încă, Ce s-a întâmplat. Acum am construit un grafic al acestei funcții exponențiale - și trece, de asemenea, aproape de puncte - atât de mult încât fără cercetare analitică este greu de spus care funcție este mai precisă.

Aceasta încheie soluția și revin la întrebarea valorilor naturale ale argumentului. În diverse studii, de obicei economice sau sociologice, „X”-urile naturale sunt folosite pentru a număra luni, ani sau alte intervale de timp egale. Luați în considerare, de exemplu, următoarea problemă.

3.5. Metoda celor mai mici pătrate

Prima lucrare care a pus bazele metodei celor mai mici pătrate a fost realizată de Legendre în 1805. În articolul „Noi metode pentru determinarea orbitelor cometelor”, el a scris: „După ce toate condițiile problemei au fost utilizate pe deplin, este necesar să se determine coeficienții astfel încât mărimea erorilor lor să fie cât mai mică posibil. Cel mai într-un mod simplu pentru a realiza acest lucru este o metodă care constă în găsirea sumei minime a erorilor pătrate.” În prezent, metoda este utilizată pe scară largă atunci când se aproximează dependențe funcționale necunoscute specificate de multe eșantioane experimentale pentru a obține o expresie analitică care este cel mai bine aproximată la o valoare completă. -experiment la scară.

Să fie, pe baza unui experiment, să se stabilească dependența funcțională a cantității y din x : Să presupunem că în urma experimentului am obţinutn valorile ypentru valorile corespunzătoare ale argumentuluiX. Dacă punctele experimentale sunt situate pe planul de coordonate ca în figură, atunci, știind că în timpul experimentului apar erori, putem presupune că dependența este liniară, adică.y= topor+ bRețineți că metoda nu impune restricții asupra tipului de funcție, adică. poate fi aplicat oricăror dependențe funcționale.

Din punctul de vedere al experimentatorului, este adesea mai firesc să se ia în considerare secvența de eșantionarefixat în prealabil, adică este o variabilă independentă și contează - variabilă dependentă.Acest lucru este clar mai ales dacă este sub sunt înțelese ca momente în timp, care este cel mai larg utilizat în aplicațiile tehnice.Dar acesta este doar un caz special foarte frecvent. De exemplu, este necesar să se clasifice unele mostre după mărime. Apoi variabila independentă va fi numărul eșantionului, variabila dependentă va fi dimensiunea sa individuală.

Metoda celor mai mici pătrate este descrisă în detaliu în multe publicații educaționale și științifice, în special în ceea ce privește aproximarea funcțiilor în ingineria electrică și radio, precum și în cărțile despre teoria probabilităților și statistica matematică.

Să revenim la desen. Liniile punctate arată că erorile pot apărea nu numai din cauza procedurilor de măsurare imperfecte, ci și din cauza inexactității în specificarea variabilei independente.Cu tipul de funcție selectat Tot ce rămâne este să selectați parametrii incluși în acestaAȘi bEste clar că numărul de parametri poate fi mai mare de doi, ceea ce este tipic doar pentru funcțiile liniare. În general, vom presupune

.(1)

Trebuie să selectați coteleA, b, c... astfel încât condiția să fie îndeplinită

. (2)

Să găsim valorile A, b, c..., rotind partea stângă a (2) la minim. Pentru a face acest lucru, definim punctele staţionare(puncte în care prima derivată dispare) prin diferențierea părții stângi a (2) în raport cuA, b, c:

(3)

etc.Sistemul de ecuații rezultat conține tot atâtea ecuații câte necunoscuteA, b, c…. Este imposibil să se rezolve un astfel de sistem într-o formă generală, de aceea este necesar să se precizeze, cel puțin aproximativ, un anumit tip de funcție. În continuare, vom lua în considerare două cazuri: funcții liniare și pătratice.

Funcție liniară .

Luați în considerare suma diferențelor pătrate valori experimentaleși valorile funcției în punctele corespunzătoare:

(4)

Să selectăm parametriiAȘi bastfel încât această sumă să aibă cea mai mică valoare. Astfel, sarcina se rezumă la găsirea valorilorAȘi b, la care funcția are un minim, adică să studieze funcția a două variabile independenteAȘi bla minim. Pentru a face acest lucru, facem diferența prinAȘi b:

;

.


Sau

(5)

Înlocuind datele experimentale și , obținem un sistem de doi ecuatii lineare cu două necunoscuteAȘi b. După ce am rezolvat acest sistem, putem scrie funcția .

Să ne asigurăm că pentru valorile găsiteAȘi bare un minim. Pentru a face acest lucru, găsim și:

, , .

Prin urmare,

− = ,

>0,

acestea. este îndeplinită o condiție minimă suficientă pentru o funcție a două variabile.

Funcția pătratică .

Lăsați experimentul să obțină valorile funcției în puncte. Să fie, de asemenea, pe baza informațiilor a priori, să existe o presupunere că funcția este pătratică:

.

Trebuie să găsim coeficiențiiA, bȘi c.Avem

– funcţia a trei variabileA, b, c.

În acest caz, sistemul (3) ia forma:

Sau:

După ce am rezolvat acest sistem de ecuații liniare, determinăm necunoscuteleA, b, c.

Exemplu.Să se obțină patru valori ale funcției dorite pe baza experimentului y = (x ) cu patru valori ale argumentului, care sunt date în tabel: