Aproximarea datelor experimentale este o metodă bazată pe înlocuirea datelor obținute experimental cu o funcție analitică care trece cel mai aproape sau coincide în punctele nodale cu valorile originale (date obținute în timpul unui experiment sau experiment). În prezent, există două moduri de a defini o funcție analitică:

Prin construirea unui polinom de interpolare de n grade care trece direct prin toate punctele o matrice de date dată. În acest caz, funcția de aproximare este prezentată sub forma: un polinom de interpolare în formă Lagrange sau un polinom de interpolare în formă Newton.

Construind un polinom de aproximare de n grade care trece în imediata apropiere a punctelor dintr-o matrice de date dată. Astfel, funcția de aproximare netezește toate zgomotele aleatorii (sau erorile) care pot apărea în timpul experimentului: valorile măsurate în timpul experimentului depind de factori aleatori care fluctuează de la sine legi aleatorii(erori de măsurare sau de instrument, inexactitate sau erori experimentale). În acest caz, funcția de aproximare este determinată folosind metoda cele mai mici pătrate.

Metoda celor mai mici pătrate(în literatura engleză Ordinary Least Squares, MCO) este o metodă matematică bazată pe determinarea unei funcții de aproximare care este construită în cea mai apropiată apropiere de puncte dintr-o serie dată de date experimentale. Apropierea funcțiilor originale și de aproximare F(x) este determinată de o măsură numerică și anume: suma abaterilor pătrate ale datelor experimentale de la curba de aproximare F(x) ar trebui să fie cea mai mică.

Curba de aproximare construită folosind metoda celor mai mici pătrate

Se folosește metoda celor mai mici pătrate:

Să rezolve sisteme de ecuații supradeterminate când numărul de ecuații depășește numărul de necunoscute;

Pentru a găsi o soluție în cazul sistemelor de ecuații neliniare obișnuite (nu supradeterminate);

Pentru a aproxima valorile punctuale cu o funcție de aproximare.

Funcția de aproximare folosind metoda celor mai mici pătrate este determinată din condiția sumei minime a abaterilor pătrate ale funcției de aproximare calculată dintr-o serie dată de date experimentale. Acest criteriu al metodei celor mai mici pătrate se scrie ca următoarea expresie:

Valorile funcției de aproximare calculate la punctele nodale,

O serie dată de date experimentale în puncte nodale.

Criteriul pătratic are o serie de proprietăți „bune”, cum ar fi diferențiabilitatea, oferind o soluție unică la problema de aproximare cu funcții de aproximare polinomială.

În funcție de condițiile problemei, funcția de aproximare este un polinom de gradul m

Gradul funcției de aproximare nu depinde de numărul de puncte nodale, dar dimensiunea acesteia trebuie să fie întotdeauna mai mică decât dimensiunea (numărul de puncte) unui tablou de date experimentale dat.

∙ Dacă gradul funcției de aproximare este m=1, atunci aproximăm funcția tabelului linie dreaptă (regresie liniară).

∙ Dacă gradul funcției de aproximare este m=2, atunci aproximăm funcția tabelă cu o parabolă pătratică (aproximare pătratică).

∙ Dacă gradul funcției de aproximare este m=3, atunci aproximăm funcția tabelă cu o parabolă cubică (aproximație cubică).

ÎN caz general, când este necesar să se construiască un polinom de aproximare de gradul m pentru valorile tabelului date, condiția pentru minimul sumei abaterilor pătrate peste toate punctele nodale este rescrisă în următoarea formă:

- coeficienți necunoscuți ai polinomului de aproximare de gradul m;

Numărul de valori din tabel specificat.

O condiție necesară pentru existența unui minim al unei funcții este egalitatea cu zero a derivatelor sale parțiale în raport cu variabilele necunoscute. . Ca rezultat, obținem următorul sistem de ecuații:

Să transformăm sistemul liniar de ecuații rezultat: deschideți parantezele și mutați termenii liberi în partea dreaptă a expresiei. Ca urmare, sistemul rezultat de expresii algebrice liniare va fi scris în următoarea formă:

Acest sistem de expresii algebrice liniare poate fi rescris sub formă de matrice:

Rezultatul a fost un sistem ecuatii lineare dimensiunea m+1, care constă din m+1 necunoscute. Acest sistem poate fi rezolvat folosind orice metodă de rezolvare a problemelor liniare. ecuații algebrice(de exemplu, prin metoda Gaussiană). Ca urmare a soluției, se vor găsi parametri necunoscuți ai funcției de aproximare, cu condiția cantitatea minima abaterile pătrate ale funcției de aproximare față de datele originale, adică cea mai bună aproximare pătratică posibilă. Trebuie amintit că, dacă chiar și o valoare a datelor sursă se modifică, toți coeficienții își vor schimba valorile, deoarece sunt complet determinați de datele sursă.

Aproximarea datelor sursă prin dependență liniară

(regresie liniara)

Ca exemplu, să luăm în considerare tehnica de determinare a funcției de aproximare, care este specificată sub forma unei dependențe liniare. În conformitate cu metoda celor mai mici pătrate, condiția pentru minimul sumei abaterilor pătrate este scrisă în următoarea formă:

Coordonatele nodurilor de tabel;

Coeficienți necunoscuți ai funcției de aproximare, care este specificat ca o dependență liniară.

O condiție necesară pentru existența unui minim al unei funcții este egalitatea la zero a derivatelor sale parțiale în raport cu variabilele necunoscute. Ca rezultat, obținem următorul sistem de ecuații:

Să transformăm sistemul liniar de ecuații rezultat.

Rezolvăm sistemul rezultat de ecuații liniare. Coeficienții funcției de aproximare în formă analitică se determină după cum urmează (metoda lui Cramer):

Acești coeficienți asigură construirea unei funcții liniare de aproximare în conformitate cu criteriul minimizării sumei pătratelor funcției de aproximare din valorile tabelare date (date experimentale).

Algoritm pentru implementarea metodei celor mai mici pătrate

1. Date inițiale:

Este specificată o serie de date experimentale cu numărul de măsurători N

Se precizează gradul polinomului de aproximare (m).

2. Algoritm de calcul:

2.1. Coeficienții sunt determinați pentru construirea unui sistem de ecuații cu dimensiuni

Coeficienții sistemului de ecuații (partea stângă a ecuației)

- indexul numărului coloanei matrice pătrată sisteme de ecuații

Termeni liberi ai unui sistem de ecuații liniare (partea dreaptă a ecuației)

- indicele numărului de rând al matricei pătrate a sistemului de ecuații

2.2. Formarea unui sistem de ecuații liniare cu dimensiunea .

2.3. Rezolvarea unui sistem de ecuații liniare pentru a determina coeficienții necunoscuți ai unui polinom de aproximare de gradul m.

2.4 Determinarea sumei abaterilor pătrate ale polinomului de aproximare de la valorile originale la toate punctele nodale

Valoarea găsită a sumei abaterilor pătrate este minimul posibil.

Aproximare folosind alte funcții

Trebuie remarcat faptul că atunci când se aproximează datele originale în conformitate cu metoda celor mai mici pătrate, funcția logaritmică, funcția exponențială și funcția de putere sunt uneori folosite ca funcție de aproximare.

Aproximație logaritmică

Să luăm în considerare cazul când este dată funcția de aproximare funcţie logaritmică tip:

Metoda celor mai mici pătrate

În lecția finală a subiectului, ne vom familiariza cu cea mai cunoscută aplicație FNP, care își găsește cea mai largă aplicație în diverse domenii ale științei și activității practice. Aceasta ar putea fi fizică, chimie, biologie, economie, sociologie, psihologie și așa mai departe și așa mai departe. Prin voința sorții, de multe ori trebuie să mă ocup de economie și, prin urmare, astăzi vă voi aranja o excursie într-o țară uimitoare numită Econometrie=) ...Cum sa nu-l vrei?! Este foarte bine acolo – trebuie doar să vă hotărâți! ...Dar ceea ce probabil că vrei cu siguranță este să înveți cum să rezolvi problemele metoda celor mai mici pătrate. Și mai ales cititorii harnici vor învăța să le rezolve nu doar cu acuratețe, ci și FOARTE RAPID ;-) Dar mai întâi expunerea generală a problemei+ exemplu însoțitor:

Lasă să intre pe unii domeniul subiectului se studiază indicatorii care au o expresie cantitativă. În același timp, există toate motivele să credem că indicatorul depinde de indicator. Această ipoteză poate fi fie o ipoteză științifică, fie bazată pe elementar bun simț. Să lăsăm totuși știința deoparte și să explorăm zone mai apetisante - și anume, magazinele alimentare. Să notăm prin:

– suprafata comerciala a unui magazin alimentar, mp,
– cifra de afaceri anuală a unui magazin alimentar, milioane de ruble.

Este absolut clar că, cu cât suprafața magazinului este mai mare, cu atât va fi mai mare în majoritatea cazurilor cifra de afaceri a acestuia.

Sa presupunem ca dupa efectuarea observatiilor/experimentelor/calculelor/dansurilor cu tamburina avem la dispozitie date numerice:

Cu magazinele alimentare, cred că totul este clar: - aceasta este zona primului magazin, - cifra de afaceri anuală a acestuia, - zona celui de-al doilea magazin, - cifra de afaceri anuală etc. Apropo, nu este deloc necesar să aveți acces la materiale clasificate - o evaluare destul de precisă a cifrei de afaceri comerciale poate fi obținută prin intermediul statistici matematice . Totuși, să nu ne distragem, cursul de spionaj comercial este deja plătit =)

Datele tabelare pot fi, de asemenea, scrise sub formă de puncte și descrise în forma familiară Sistemul cartezian .

Să răspundem la o întrebare importantă: Câte puncte sunt necesare pentru un studiu calitativ?

Cu cât mai mare cu atât mai bine. Setul minim acceptabil este format din 5-6 puncte. În plus, atunci când cantitatea de date este mică, rezultatele „anomale” nu pot fi incluse în eșantion. Deci, de exemplu, un mic magazin de elită poate câștiga ordine de mărime mai mult decât „colegii săi”, distorsionând astfel model general, care este ceea ce trebuie să găsiți!



Pentru a spune foarte simplu, trebuie să selectăm o funcție, programa care trece cât mai aproape de puncte . Această funcție este numită aproximând (aproximare - aproximare) sau functie teoretica . În general, aici apare imediat un „concurent” evident - un polinom de grad înalt, al cărui grafic trece prin TOATE punctele. Dar această opțiune este complicată și adesea pur și simplu incorectă. (deoarece graficul se va „încerca” tot timpul și reflectă slab tendința principală).

Astfel, funcția căutată trebuie să fie destul de simplă și, în același timp, să reflecte adecvat dependența. După cum ați putea ghici, una dintre metodele pentru găsirea unor astfel de funcții este numită metoda celor mai mici pătrate. În primul rând, să ne uităm la esența sa în vedere generala. Lasă o anumită funcție să aproximeze datele experimentale:


Cum se evaluează acuratețea acestei aproximări? Să calculăm și diferențele (abaterile) dintre valorile experimentale și cele funcționale (studiam desenul). Primul gând care îmi vine în minte este de a estima cât de mare este suma, dar problema este că diferențele pot fi negative (De exemplu, ) iar abaterile ca urmare a unei astfel de însumări se vor anula reciproc. Prin urmare, ca o estimare a preciziei aproximării, se cere să se ia suma module abateri:

sau prăbușit: (in caz ca cineva nu stie: este pictograma sumei și – o variabilă „contor” auxiliară, care ia valori de la 1 la ) .

Apropierea punctelor experimentale diverse funcții, vom primi sensuri diferiteși, evident, acolo unde această sumă este mai mică, acea funcție este mai precisă.

O astfel de metodă există și se numește metoda modulului minim. Cu toate acestea, în practică am primit multe distributie mai mare metoda celor mai mici pătrate, în care posibilele valori negative sunt eliminate nu de modul, ci prin pătrarea abaterilor:



, după care eforturile sunt îndreptate spre selectarea unei funcții astfel încât suma abaterilor pătrate era cât se poate de mică. De fapt, de aici provine numele metodei.

Și acum ne întoarcem la altceva punct important: după cum sa menționat mai sus, funcția selectată ar trebui să fie destul de simplă - dar există și multe astfel de funcții: liniar , hiperbolic , exponenţială , logaritmică , pătratică etc. Și, desigur, aici aș dori imediat să „reduc domeniul de activitate”. Ce clasă de funcții ar trebui să aleg pentru cercetare? O tehnică primitivă, dar eficientă:

– Cel mai simplu mod este să descrii puncte pe desen și analizați locația acestora. Dacă au tendința de a alerga în linie dreaptă, atunci ar trebui să cauți ecuația unei linii cu valori optime și . Cu alte cuvinte, sarcina este de a găsi ACEPTĂ coeficienți astfel încât suma abaterilor pătrate să fie cea mai mică.

Dacă punctele sunt situate, de exemplu, de-a lungul hiperbolă, atunci este evident clar că funcția liniară va da o aproximare slabă. În acest caz, căutăm cei mai „favorabili” coeficienți pentru ecuația hiperbolei – cele care dau suma minimă de pătrate .

Acum rețineți că în ambele cazuri vorbim funcţiile a două variabile, ale căror argumente sunt parametrii de dependență căutați:

Și, în esență, trebuie să rezolvăm o problemă standard - găsiți funcţie minimă a două variabile.

Să ne amintim exemplul nostru: să presupunem că punctele „de depozit” tind să fie situate în linie dreaptă și există toate motivele să credem că dependență liniară cifra de afaceri din spațiul comercial. Să găsim astfel de coeficienți „a” și „fi” astfel încât suma abaterilor pătrate a fost cel mai mic. Totul este ca de obicei - mai întâi Derivate parțiale de ordinul I. Conform regula liniarității Puteți diferenția chiar sub pictograma sumă:

Dacă doriți să utilizați aceste informații pentru un eseu sau un referat, vă voi fi foarte recunoscător pentru linkul din lista de surse; veți găsi astfel de calcule detaliate în câteva locuri:

Să creăm un sistem standard:

Reducem fiecare ecuație cu „două” și, în plus, „despărțim” sumele:

Notă : analizați în mod independent de ce „a” și „fi” pot fi scoase dincolo de pictograma sumei. Apropo, formal acest lucru se poate face cu suma

Să rescriem sistemul în formă „aplicată”:

după care începe să apară algoritmul pentru rezolvarea problemei noastre:

Cunoaștem coordonatele punctelor? Noi stim. Sume îl putem găsi? Uşor. Să facem cel mai simplu sistem de două ecuații liniare în două necunoscute(„a” și „fi”). Rezolvăm sistemul, de exemplu, metoda lui Cramer, în urma căruia obținem un punct staționar. Control condiție suficientă pentru un extremum, putem verifica că în acest moment funcția ajunge exact minim. Verificarea presupune calcule suplimentare și, prin urmare, o vom lăsa în culise (dacă este necesar, cadrul lipsă poate fi vizualizatAici ) . Tragem concluzia finală:

Funcţie cel mai bun mod (cel puțin în comparație cu orice altă funcție liniară) apropie punctele experimentale . În linii mari, graficul său trece cât mai aproape de aceste puncte. In traditie econometrie funcţia de aproximare rezultată se mai numeşte ecuație de regresie liniară pereche .

Problema luată în considerare este de mare importanță practică. În situația noastră exemplu, Ec. vă permite să preziceți ce cifră de afaceri comercială ("Igrec") magazinul va avea la una sau alta valoare a zonei de vânzare (unul sau altul sens al lui „x”). Da, prognoza rezultată va fi doar o prognoză, dar în multe cazuri se va dovedi a fi destul de precisă.

Voi analiza doar o problemă cu numerele „reale”, deoarece nu există dificultăți în ea - toate calculele sunt la nivelul curiculumul scolar 7-8 clase. În 95% din cazuri, vi se va cere să găsiți doar o funcție liniară, dar la sfârșitul articolului voi arăta că nu este mai dificil să găsiți ecuațiile hiperbolei optime, ale exponențiale și ale altor funcții.

De fapt, tot ce rămâne este să distribuiți bunătățile promise - astfel încât să puteți învăța să rezolvați astfel de exemple nu numai cu acuratețe, ci și rapid. Studiem cu atenție standardul:

Sarcină

În urma studierii relației dintre doi indicatori, am obținut următoarele perechi numere:

Folosind metoda celor mai mici pătrate, găsiți funcția liniară care aproximează cel mai bine empiric (cu experienta) date. Realizați un desen pe care să construiți puncte experimentale și un grafic al funcției de aproximare într-un sistem de coordonate dreptunghiular cartezian . Aflați suma abaterilor pătrate dintre valorile empirice și teoretice. Aflați dacă funcția ar fi mai bună (din punct de vedere al metodei celor mai mici pătrate) apropie punctele experimentale.

Vă rugăm să rețineți că semnificațiile „x” sunt naturale, iar aceasta are un sens caracteristic caracteristic, despre care voi vorbi puțin mai târziu; dar ele, desigur, pot fi și fracționate. În plus, în funcție de conținutul unei anumite sarcini, atât valorile „X” cât și „joc” pot fi complet sau parțial negative. Ei bine, ni s-a dat o sarcină „fără chip” și o începem soluţie:

Găsim coeficienții funcției optime ca soluție a sistemului:

În scopul unei înregistrări mai compacte, variabila „contor” poate fi omisă, deoarece este deja clar că însumarea se realizează de la 1 la .

Este mai convenabil să calculați sumele necesare în formă tabelară:


Calculele pot fi efectuate pe un microcalculator, dar este mult mai bine să utilizați Excel - atât mai rapid, cât și fără erori; vezi un scurt video:

Astfel, obținem următoarele sistem:

Aici puteți înmulți a doua ecuație cu 3 și scădeți al 2-lea din prima ecuație termen cu termen. Dar acesta este noroc - în practică, sistemele nu sunt adesea un cadou și, în astfel de cazuri, economisesc metoda lui Cramer:
, ceea ce înseamnă că sistemul are o soluție unică.

Sa verificam. Înțeleg că nu vrei, dar de ce să sari peste erorile în care nu pot fi ratate? Să înlocuim soluția găsită în partea stanga fiecare ecuație a sistemului:

Se obțin părțile din dreapta ecuațiilor corespunzătoare, ceea ce înseamnă că sistemul este rezolvat corect.

Astfel, funcția de aproximare dorită: – de la toate funcțiile liniare Ea este cea care aproximează cel mai bine datele experimentale.

Spre deosebire de Drept dependenţa cifrei de afaceri a magazinului de suprafaţa acestuia, dependenţa constatată este verso (principiul „cu cât mai mult, cu atât mai puțin”), iar acest fapt este imediat relevat de negativ pantă. Funcția ne spune că pe măsură ce un anumit indicator crește cu 1 unitate, valoarea indicatorului dependent scade in medie cu 0,65 unități. După cum se spune, cu cât prețul hrișcii este mai mare, cu atât se vinde mai puțin.

Pentru a reprezenta graficul funcției de aproximare, găsim cele două valori ale acesteia:

și executați desenul:

Linia dreaptă construită se numește linie de tendință (și anume, o linie de tendință liniară, adică, în cazul general, o tendință nu este neapărat o linie dreaptă). Toată lumea este familiarizată cu expresia „a fi în tendință” și cred că acest termen nu are nevoie de comentarii suplimentare.

Să calculăm suma abaterilor pătrate între valorile empirice şi cele teoretice. Geometric, aceasta este suma pătratelor lungimii segmentelor „zmeură”. (dintre care două sunt atât de mici încât nici măcar nu sunt vizibile).

Să rezumam calculele într-un tabel:


Din nou, pot fi făcute manual; pentru orice eventualitate, voi da un exemplu pentru primul punct:

dar este mult mai eficient să o faci în modul deja cunoscut:

Repetăm ​​încă o dată: Care este semnificația rezultatului obținut? Din toate funcțiile liniare funcția are cel mai mic exponent, adică este cea mai bună aproximare din familia sa. Și aici, apropo, întrebarea finală a problemei nu este întâmplătoare: ce se întâmplă dacă funcția exponențială propusă ar fi mai bine să apropii punctele experimentale?

Să găsim suma corespunzătoare a abaterilor pătrate - pentru a distinge, le voi desemna cu litera „epsilon”. Tehnica este exact aceeași:

Și din nou, pentru orice eventualitate, calculele pentru primul punct:

În Excel folosim funcția standard EXP (sintaxa poate fi găsită în Ajutor Excel).

Concluzie: , ceea ce înseamnă că funcția exponențială aproximează punctele experimentale mai rău decât dreapta.

Dar aici trebuie remarcat că „mai rău” este nu înseamnă încă, Ce s-a întâmplat. Acum am construit un grafic al acestei funcții exponențiale - și trece, de asemenea, aproape de puncte - atât de mult încât fără cercetări analitice este dificil de spus care funcție este mai precisă.

Aceasta încheie soluția și revin la întrebarea valorilor naturale ale argumentului. În diverse studii, de obicei economice sau sociologice, „X”-urile naturale sunt folosite pentru a număra luni, ani sau alte intervale de timp egale. Luați în considerare, de exemplu, următoarea problemă:

Următoarele date sunt disponibile cu privire la cifra de afaceri cu amănuntul a magazinului pentru prima jumătate a anului:

Folosind alinierea analitică în linie dreaptă, determinați volumul cifrei de afaceri pentru iulie.

Da, nicio problemă: numerotăm lunile 1, 2, 3, 4, 5, 6 și folosim algoritmul obișnuit, în urma căruia obținem o ecuație - singurul lucru este că, când vine vorba de timp, de obicei folosesc litera „te” (deși acest lucru nu este critic). Ecuația rezultată arată că în prima jumătate a anului cifra de afaceri din comerț a crescut în medie cu 27,74 unități. pe luna. Să luăm prognoza pentru iulie (luna nr. 7): d.e.

Și există nenumărate sarcini ca aceasta. Cei care doresc pot folosi un serviciu suplimentar si anume my Calculator Excel (versiunea demo), care rezolvă problema analizată aproape instantaneu! Versiunea de lucru a programului este disponibilă în schimb sau pentru taxă simbolică.

La sfarsitul lectiei informatie scurta o găsirea de dependențe de alte tipuri. De fapt, nu sunt multe de spus, deoarece abordarea fundamentală și algoritmul de soluție rămân aceleași.

Să presupunem că aranjarea punctelor experimentale seamănă cu o hiperbolă. Apoi, pentru a găsi coeficienții celei mai bune hiperbole, trebuie să găsiți minimul funcției - oricine poate efectua calcule detaliateși ajungeți la un sistem similar:

Din punct de vedere tehnic formal, se obține dintr-un sistem „liniar”. (să-l notăm cu un asterisc)înlocuind „x” cu . Ei bine, cum rămâne cu sumele? calculați, după care la coeficienții optimi „a” și „fi” la indemana.

Dacă există toate motivele să credem că punctele sunt situate de-a lungul unei curbe logaritmice, apoi pentru a găsi valorile optime găsim minimul funcției . În mod oficial, în sistem (*) trebuie înlocuit cu:

Când efectuați calcule în Excel, utilizați funcția LN. Mărturisesc că nu mi-ar fi deosebit de dificil să creez calculatoare pentru fiecare dintre cazurile luate în considerare, dar tot ar fi mai bine dacă ai „programa” singur calculele. Videoclipuri de lecție pentru a ajuta.

Cu dependența exponențială situația este puțin mai complicată. Pentru a reduce problema la cazul liniar, luăm funcția logaritm și folosim proprietățile logaritmului:

Acum, comparând funcția rezultată cu funcția liniară, ajungem la concluzia că în sistem (*) trebuie înlocuit cu , și – cu . Pentru comoditate, să notăm:

Vă rugăm să rețineți că sistemul este rezolvat în raport cu și, prin urmare, după găsirea rădăcinilor, nu trebuie să uitați să găsiți coeficientul în sine.

Pentru a apropia punctele experimentale parabolă optimă , ar trebui găsit funcţie minimă a trei variabile . După efectuarea acțiunilor standard, obținem următoarea „funcționare” sistem:

Da, desigur, aici sunt mai multe sume, dar nu există deloc dificultăți atunci când utilizați aplicația preferată. Și, în sfârșit, vă voi spune cum să efectuați rapid o verificare folosind Excel și să construiți linia de tendință dorită: creați un grafic de dispersie, selectați oricare dintre punctele cu mouse-ul și faceți clic dreapta pentru a selecta opțiunea „Adăugați o linie de tendință”. Apoi, selectați tipul de diagramă și pe filă "Opțiuni" activați opțiunea „Afișați ecuația pe diagramă”. Bine

Ca întotdeauna, aș vrea să închei articolul cu câteva într-o frază frumoasăși aproape că am tastat „Fii la modă!” Dar s-a răzgândit în timp. Și nu pentru că este stereotip. Nu știu cum este pentru nimeni, dar nu prea vreau să urmăresc tendința promovată americană și mai ales europeană =) Prin urmare, vă doresc fiecăruia dintre voi să rămână la propria linie!

http://www.grandars.ru/student/vysshaya-matematika/metod-naimenshih-kvadratov.html

Metoda celor mai mici pătrate este una dintre cele mai comune și mai dezvoltate datorită ei simplitatea și eficiența metodelor de estimare a parametrilor modelelor econometrice liniare. În același timp, atunci când îl utilizați, trebuie să aveți grijă, deoarece modelele construite folosindu-l pot să nu satisfacă o serie de cerințe pentru calitatea parametrilor lor și, ca urmare, să nu reflecte „bine” tiparele de dezvoltare a procesului. suficient.

Să luăm în considerare mai detaliat procedura de estimare a parametrilor unui model econometric liniar folosind metoda celor mai mici pătrate. Un astfel de model în general poate fi reprezentat prin ecuația (1.2):

y t = a 0 + a 1 x 1t +...+ a n x nt + ε t.

Datele inițiale la estimarea parametrilor a 0 , a 1 ,..., a n sunt un vector de valori ale variabilei dependente y= (y 1 , y 2 , ... , y T)" și matricea valorilor variabilelor independente

în care prima coloană, formată din unele, corespunde coeficientului de model.

Metoda celor mai mici pătrate și-a primit numele pe baza principiului de bază conform căruia estimările parametrilor obținute pe baza ei trebuie să satisfacă: suma pătratelor erorii de model ar trebui să fie minimă.

Exemple de rezolvare a problemelor folosind metoda celor mai mici pătrate

Exemplul 2.1.Întreprinderea comercială are o rețea de 12 magazine, informații despre activitățile cărora sunt prezentate în tabel. 2.1.

Conducerea întreprinderii ar dori să știe în ce măsură dimensiunea cifrei de afaceri anuale depinde de spațiul de vânzare cu amănuntul al magazinului.

Tabelul 2.1

Numărul magazinului Cifra de afaceri anuală, milioane de ruble. Suprafata comerciala, mii m2
19,76 0,24
38,09 0,31
40,95 0,55
41,08 0,48
56,29 0,78
68,51 0,98
75,01 0,94
89,05 1,21
91,13 1,29
91,26 1,12
99,84 1,29
108,55 1,49

Soluția celor mai mici pătrate. Să notăm cifra de afaceri anuală a celui de-al-lea magazin, milioane de ruble; - suprafața comercială a celui de-al-lea magazin, mii m2.

Fig.2.1. Scatterplot pentru Exemplul 2.1

Pentru a determina forma relației funcționale dintre variabile și vom construi o diagramă de dispersie (Fig. 2.1).

Pe baza diagramei de dispersie, putem concluziona că cifra de afaceri anuală este dependentă pozitiv de spațiul comercial (adică, y va crește odată cu creșterea ). Cea mai potrivită formă de conexiune funcțională este liniar.

Informațiile pentru calcule suplimentare sunt prezentate în tabel. 2.2. Folosind metoda celor mai mici pătrate, estimăm parametrii unui model econometric liniar cu un singur factor

Tabelul 2.2

t YT x 1t y t 2 x 1t 2 x 1t y t
19,76 0,24 390,4576 0,0576 4,7424
38,09 0,31 1450,8481 0,0961 11,8079
40,95 0,55 1676,9025 0,3025 22,5225
41,08 0,48 1687,5664 0,2304 19,7184
56,29 0,78 3168,5641 0,6084 43,9062
68,51 0,98 4693,6201 0,9604 67,1398
75,01 0,94 5626,5001 0,8836 70,5094
89,05 1,21 7929,9025 1,4641 107,7505
91,13 1,29 8304,6769 1,6641 117,5577
91,26 1,12 8328,3876 1,2544 102,2112
99,84 1,29 9968,0256 1,6641 128,7936
108,55 1,49 11783,1025 2,2201 161,7395
S 819,52 10,68 65008,554 11,4058 858,3991
In medie 68,29 0,89

Prin urmare,

Prin urmare, cu o creștere a spațiului comercial cu 1 mie m2, cu altele condiţii egale Cifra de afaceri medie anuală a comerțului crește cu 67,8871 milioane de ruble.

Exemplul 2.2. Conducerea companiei a observat că cifra de afaceri anuală depinde nu doar de aria de vânzare a magazinului (vezi exemplul 2.1), ci și de numărul mediu de vizitatori. Informațiile relevante sunt prezentate în tabel. 2.3.

Tabelul 2.3

Soluţie. Să notăm - numărul mediu de vizitatori ai magazinului pe zi, mii de oameni.

Pentru a determina forma relației funcționale dintre variabile și vom construi o diagramă de dispersie (Fig. 2.2).

Pe baza graficului de dispersie, putem concluziona că cifra de afaceri anuală depinde pozitiv de numărul mediu de vizitatori pe zi (adică, y va crește odată cu creșterea ). Forma dependenței funcționale este liniară.

Orez. 2.2. Scatterplot pentru Exemplul 2.2

Tabelul 2.4

t x 2t x 2t 2 y t x 2t x 1t x 2t
8,25 68,0625 163,02 1,98
10,24 104,8575 390,0416 3,1744
9,31 86,6761 381,2445 5,1205
11,01 121,2201 452,2908 5,2848
8,54 72,9316 480,7166 6,6612
7,51 56,4001 514,5101 7,3598
12,36 152,7696 927,1236 11,6184
10,81 116,8561 962,6305 13,0801
9,89 97,8121 901,2757 12,7581
13,72 188,2384 1252,0872 15,3664
12,27 150,5529 1225,0368 15,8283
13,92 193,7664 1511,016 20,7408
S 127,83 1410,44 9160,9934 118,9728
In medie 10,65

În general, este necesar să se determine parametrii unui model econometric cu doi factori

y t = a 0 + a 1 x 1t + a 2 x 2t + ε t

Informațiile necesare pentru calcule ulterioare sunt prezentate în tabel. 2.4.

Să estimăm parametrii unui model econometric liniar cu doi factori folosind metoda celor mai mici pătrate.

Prin urmare,

Estimarea coeficientului =61,6583 arată că, în egală măsură, cu o creștere a spațiului comercial cu 1 mie m 2, cifra de afaceri anuală va crește cu o medie de 61,6583 milioane ruble.

Coeficientul estimat = 2,2748 arată că, cu toate acestea, cu o creștere a numărului mediu de vizitatori la 1 mie de persoane. pe zi, cifra de afaceri anuală va crește cu o medie de 2,2748 milioane de ruble.

Exemplul 2.3. Folosind informațiile prezentate în tabel. 2.2 și 2.4, estimați parametrul modelului econometric cu un singur factor

unde este valoarea centrată a cifrei de afaceri anuale a celui de-al-lea magazin, milioane de ruble; - valoarea centrată a numărului mediu zilnic de vizitatori la al-lea magazin, mii de persoane. (vezi exemplele 2.1-2.2).

Soluţie. Informațiile suplimentare necesare pentru calcule sunt prezentate în tabel. 2.5.

Tabelul 2.5

-48,53 -2,40 5,7720 116,6013
-30,20 -0,41 0,1702 12,4589
-27,34 -1,34 1,8023 36,7084
-27,21 0,36 0,1278 -9,7288
-12,00 -2,11 4,4627 25,3570
0,22 -3,14 9,8753 -0,6809
6,72 1,71 2,9156 11,4687
20,76 0,16 0,0348 3,2992
22,84 -0,76 0,5814 -17,413
22,97 3,07 9,4096 70,4503
31,55 1,62 2,6163 51,0267
40,26 3,27 10,6766 131,5387
Cantitate 48,4344 431,0566

Folosind formula (2.35), obținem

Prin urmare,

http://www.cleverstudents.ru/articles/mnk.html

Exemplu.

Date experimentale despre valorile variabilelor XȘi la sunt date în tabel.

Ca urmare a alinierii lor, se obține funcția

Folosind metoda celor mai mici pătrate, aproximați aceste date printr-o dependență liniară y=ax+b(găsiți parametri AȘi b). Aflați care dintre cele două linii (în sensul metodei celor mai mici pătrate) aliniază mai bine datele experimentale. Faceți un desen.

Soluţie.

În exemplul nostru n=5. Completam tabelul pentru confortul calculării sumelor care sunt incluse în formulele coeficienților necesari.

Valorile din al patrulea rând al tabelului se obțin prin înmulțirea valorilor celui de-al 2-lea rând cu valorile celui de-al 3-lea rând pentru fiecare număr i.

Valorile din al cincilea rând al tabelului se obțin prin pătratul valorilor din al doilea rând pentru fiecare număr i.

Valorile din ultima coloană a tabelului sunt sumele valorilor de pe rânduri.

Folosim formulele metodei celor mai mici pătrate pentru a găsi coeficienții AȘi b. Înlocuim valorile corespunzătoare din ultima coloană a tabelului în ele:

Prin urmare, y = 0,165x+2,184- linia dreaptă de aproximare dorită.

Rămâne să aflăm care dintre rânduri y = 0,165x+2,184 sau aproximează mai bine datele originale, adică face o estimare folosind metoda celor mai mici pătrate.

Dovada.

Așa că atunci când este găsit AȘi b funcția a luat cea mai mică valoare, este necesar ca în acest moment matricea formei pătratice a diferenţialului de ordinul doi pentru funcţia a fost pozitiv definit. Să o arătăm.

Diferenţialul de ordinul doi are forma:

Acesta este

Prin urmare, matricea de formă pătratică are forma

iar valorile elementelor nu depind de AȘi b.

Să arătăm că matricea este definită pozitivă. Pentru a face acest lucru, minorii unghiulari trebuie să fie pozitivi.

Minor unghiular de ordinul întâi . Inegalitatea este strictă, deoarece punctele

Este utilizat pe scară largă în econometrie sub forma unei interpretări economice clare a parametrilor săi.

Regresia liniară se reduce la găsirea unei ecuații de formă

sau

Ecuația formei permite pe baza valorilor parametrilor specificate X au valori teoretice ale caracteristicii rezultante, substituind valorile reale ale factorului în ea X.

Construcția regresiei liniare se reduce la estimarea parametrilor săi - AȘi V. Estimările parametrilor de regresie liniară pot fi găsite folosind diferite metode.

Abordarea clasică a estimării parametrilor de regresie liniară se bazează pe metoda celor mai mici pătrate(MNC).

Metoda celor mai mici pătrate ne permite să obținem astfel de estimări ale parametrilor AȘi V, la care suma abaterilor pătrate ale valorilor reale ale caracteristicii rezultante (y) din calculat (teoretic) minim:

Pentru a găsi minimul unei funcții, trebuie să calculați derivatele parțiale pentru fiecare dintre parametri AȘi bși setați-le egale cu zero.

Să notăm prin S, atunci:

Transformând formula, obținem următorul sistem de ecuații normale pentru estimarea parametrilor AȘi V:

Rezolvarea sistemului de ecuații normale (3.5) fie prin metoda eliminare secvenţială variabilelor, sau prin metoda determinanților, găsim estimările necesare ale parametrilor AȘi V.

Parametru V numit coeficient de regresie. Valoarea acestuia arată modificarea medie a rezultatului cu o modificare a factorului cu o unitate.

Ecuația de regresie este întotdeauna completată cu un indicator al proximității conexiunii. Când se utilizează regresia liniară, un astfel de indicator este coeficientul de corelație liniară. Există diferite modificări ale formulei coeficientului de corelație liniară. Unele dintre ele sunt prezentate mai jos:

După cum se știe, coeficientul de corelație liniară este în limitele: -1 1.

Pentru a evalua calitatea selecției funcție liniară se calculează pătratul

Coeficient de corelație liniară numit coeficient de determinare. Coeficientul de determinare caracterizează proporția de varianță a caracteristicii rezultate y, explicată prin regresie, în varianța totală a trăsăturii rezultate:

În consecință, valoarea 1 caracterizează ponderea de varianță y, cauzate de influența altor factori neluați în considerare în model.

Întrebări pentru autocontrol

1. Esența metodei celor mai mici pătrate?

2. Câte variabile oferă regresia perechi?

3. Ce coeficient determină apropierea legăturii dintre modificări?

4. În ce limite se determină coeficientul de determinare?

5. Estimarea parametrului b în analiza corelației-regresiune?

1. Christopher Dougherty. Introducere în econometrie. - M.: INFRA - M, 2001 - 402 p.

2. S.A. Borodich. Econometrie. Minsk LLC „Noi cunoștințe” 2001.


3. R.U. Rakhmetova Curs scurt de econometrie. Tutorial. Almaty. 2004. -78p.

4. I.I. Eliseeva.Econometrie. - M.: „Finanțe și Statistică”, 2002

5. Revista lunară de informare și analitică.

Modele economice neliniare. Modele de regresie neliniară. Transformarea variabilelor.

Modele economice neliniare..

Transformarea variabilelor.

Coeficientul de elasticitate.

Dacă există relații neliniare între fenomenele economice, atunci acestea sunt exprimate folosind funcțiile neliniare corespunzătoare: de exemplu, o hiperbolă echilaterală , parabole de gradul doi si etc.

Există două clase de regresii neliniare:

1. Regresii care sunt neliniare în raport cu variabilele explicative incluse în analiză, dar liniare în raport cu parametrii estimați, de exemplu:

Polinoame de diferite grade - , ;

Hiperbola echilaterală - ;

Funcția semilogaritmică - .

2. Regresii care sunt neliniare în parametrii estimați, de exemplu:

Putere -;

Demonstrativ - ;

Exponenţial - .

Suma totală a abaterilor pătrate ale valorilor individuale ale caracteristicii rezultate la din valoarea medie este cauzată de influența mai multor motive. Să împărțim condiționat întregul set de motive în două grupuri: factor studiat xȘi alti factori.

Dacă factorul nu influențează rezultatul, atunci linia de regresie de pe grafic este paralelă cu axa OhȘi

Atunci întreaga varianță a caracteristicii rezultate se datorează influenței altor factori și suma totală a abaterilor pătrate va coincide cu reziduul. Dacă alți factori nu influențează rezultatul, atunci y legat Cu X funcțional și suma reziduală a pătratelor este zero. În acest caz, suma abaterilor pătrate explicate prin regresie este aceeași cu suma totală a pătratelor.

Deoarece nu toate punctele câmpului de corelație se află pe linia de regresie, împrăștierea lor apare întotdeauna ca urmare a influenței factorului X, adică regresie la De X,și cauzate de alte cauze (variație inexplicabilă). Adecvarea unei linii de regresie pentru prognoză depinde de ce parte din variația totală a trăsăturii laține seama de variația explicată

Evident, dacă suma abaterilor pătrate datorate regresiei este mai mare decât suma reziduală a pătratelor, atunci ecuația de regresie este semnificativă statistic și factorul X are un impact semnificativ asupra rezultatului u.

, adică cu numărul de libertate de variație independentă a unei caracteristici. Numărul de grade de libertate este legat de numărul de unități ale populației n și de numărul de constante determinate din aceasta. În raport cu problema studiată, numărul de grade de libertate ar trebui să arate câte abateri independente de la P

Evaluarea semnificației ecuației de regresie în ansamblu este dată folosind F- Criteriul Fisher. În acest caz, se propune o ipoteză nulă că coeficientul de regresie este egal cu zero, adică. b = 0 și, prin urmare, factorul X nu afectează rezultatul u.

Calculul imediat al testului F este precedat de analiza varianței. Locul central în acesta este ocupat de descompunerea sumei totale a abaterilor pătrate ale unei variabile la din valoarea medie laîn două părți - „explicat” și „neexplicat”:

- suma totală a abaterilor pătrate;

- suma abaterilor pătrate explicate prin regresie;

- suma reziduală a abaterilor pătrate.

Orice sumă a abaterilor pătrate este legată de numărul de grade de libertate , adică cu numărul de libertate de variație independentă a unei caracteristici. Numărul de grade de libertate este raportat la numărul de unități de populație nşi cu numărul de constante determinate din acesta. În raport cu problema studiată, numărul de grade de libertate ar trebui să arate câte abateri independente de la P posibil necesar pentru a forma o sumă dată de pătrate.

Dispersia pe grad de libertateD.

Raporturi F (test F):

Dacă ipoteza nulă este adevărată, atunci factorul și variațiile reziduale nu diferă unul de celălalt. Pentru H 0, este necesară o respingere astfel încât dispersia factorului să depășească dispersia reziduală de câteva ori. Statisticianul englez Snedekor a elaborat tabele de valori critice F- relaţii la diferite niveluri de semnificaţie ale ipotezei nule şi diverse numere grade de libertate. Valoarea tabelului F-criteriul este valoarea maximă a raportului de varianțe care poate apărea în cazul divergenței aleatoare pentru un nivel dat de probabilitate a prezenței ipotezei nule. Valoarea calculată F-relațiile sunt considerate de încredere dacă o este mai mare decât tabelul.

În acest caz, ipoteza nulă despre absența unei relații între semne este respinsă și se trage o concluzie despre semnificația acestei relații: F fapt > F tabel H 0 este respins.

Dacă valoarea este mai mică decât cea din tabel F fapt ‹, F tabel, atunci probabilitatea ipotezei nule este mai mare decât un nivel specificat și nu poate fi respinsă fără riscul serios de a trage o concluzie greșită despre prezența unei relații. În acest caz, ecuația de regresie este considerată nesemnificativă statistic. Dar el nu se abate.

Eroarea standard a coeficientului de regresie

Pentru a evalua semnificația coeficientului de regresie, valoarea acestuia este comparată cu eroarea sa standard, adică se determină valoarea reală t- testul elevului: care este apoi comparată cu valoarea tabelului la un anumit nivel de semnificație și număr de grade de libertate ( n- 2).

Eroare de parametru standard A:

Semnificația coeficientului de corelație liniară este verificată pe baza mărimii erorii coeficient de corelație t r:

Varianta totală a trăsăturilor X:

Regresia liniară multiplă

Construirea modelului

Regresie multiplă reprezintă o regresie a unei caracteristici efective cu doi sau mai mulți factori, adică un model al formei

Regresia poate da rezultate bune în modelare dacă influența altor factori care afectează obiectul de studiu poate fi neglijată. Comportamentul variabilelor economice individuale nu poate fi controlat, adică nu este posibil să se asigure egalitatea tuturor celorlalte condiții pentru evaluarea influenței unui factor studiat. În acest caz, ar trebui să încercați să identificați influența altor factori introducându-i în model, adică să construiți o ecuație de regresie multiplă: y = a+b 1 x 1 +b 2 +…+b p x p + .

Scopul principal al regresiei multiple este de a construi un model cu un număr mare de factori, determinând în același timp influența fiecăruia dintre ei separat, precum și impactul lor combinat asupra indicatorului modelat. Specificația modelului include două game de aspecte: selecția factorilor și alegerea tipului de ecuație de regresie

Sarcina este de a găsi coeficienții de dependență liniară la care funcția a două variabile AȘi b ia cea mai mică valoare. Adică dat AȘi b suma abaterilor pătrate a datelor experimentale de la linia dreaptă găsită va fi cea mai mică. Acesta este punctul întreg al metodei celor mai mici pătrate.

Astfel, rezolvarea exemplului se reduce la găsirea extremului unei funcții a două variabile.

Derivarea formulelor pentru găsirea coeficienților. Se compilează și se rezolvă un sistem de două ecuații cu două necunoscute. Găsirea derivatelor parțiale ale unei funcții prin variabile AȘi b, echivalăm aceste derivate cu zero.

Rezolvăm sistemul de ecuații rezultat folosind orice metodă (de exemplu, metoda substituției sau metoda Cramer) și obținem formule pentru găsirea coeficienților folosind metoda celor mai mici pătrate (LSM).

Dat AȘi b funcţie ia cea mai mică valoare.

Aceasta este întreaga metodă a celor mai mici pătrate. Formula pentru găsirea parametrului A conține sumele , , și parametrul n- cantitatea de date experimentale. Vă recomandăm să calculați separat valorile acestor sume. Coeficient b găsit după calcul A.

Domeniul principal de aplicare a unor astfel de polinoame este prelucrarea datelor experimentale (construcția de formule empirice). Faptul este că un polinom de interpolare construit din valorile funcției obținute prin experiment va fi puternic influențat de „zgomotul experimental”; în plus, la interpolare, nodurile de interpolare nu pot fi repetate, adică. Rezultatele experimentelor repetate în aceleași condiții nu pot fi utilizate. Polinomul pătrat mediu netezește zgomotul și vă permite să utilizați rezultatele mai multor experimente.

Integrare și diferențiere numerică. Exemplu.

Integrare numerică– calculul valorii unei anumite integrale (de obicei aproximativă). Integrarea numerică este înțeleasă ca un set de metode numerice pentru găsirea valorii unei anumite integrale.

Diferențierea numerică– un set de metode pentru calcularea valorii derivatei unei funcții specificate discret.

Integrare

Formularea problemei. Enunțul problemei matematice: trebuie să găsiți valoarea integrala definita

unde a, b sunt finite, f(x) este continuă pe [a, b].

La rezolvarea problemelor practice, se întâmplă adesea ca integrala să fie incomod sau imposibil de luat analitic: poate să nu fie exprimată în functii elementare, integrandul poate fi specificat sub forma unui tabel etc. În astfel de cazuri se folosesc metode de integrare numerică. Metodele de integrare numerică folosesc înlocuirea ariei unui trapez curbiliniu cu o sumă finită a ariilor celor mai simple forme geometrice, care poate fi calculat exact. În acest sens, ei vorbesc despre utilizarea formulelor de cuadratura.

Majoritatea metodelor folosesc o reprezentare a integralei ca o sumă finită (formulă în pătrare):

Formulele de cuadratura se bazează pe ideea de a înlocui graficul integrandului pe segmentul de integrare cu funcții de mai mult. tip simplu, care poate fi ușor integrat analitic și astfel ușor de calculat. Sarcina de a construi formule în cuadratura este implementată cel mai simplu pentru modelele matematice polinomiale.

Se pot distinge trei grupe de metode:

1. Metodă cu împărțirea segmentului de integrare în intervale egale. Împărțirea în intervale se face în prealabil; de obicei intervalele sunt alese egale (pentru a facilita calcularea funcției la sfârșitul intervalelor). Calculați suprafețele și însumați-le (dreptunghi, trapez, metode Simpson).

2. Metode cu partiţionarea segmentului de integrare folosind puncte speciale (metoda Gauss).

3. Calculul integralelor folosind numere aleatoare (metoda Monte Carlo).

Metoda dreptunghiului. Fie ca funcția (figura) să fie integrată numeric pe segment. Împărțiți segmentul la N intervale egale. Aria fiecăruia dintre N trapezele curbate poate fi înlocuită cu aria unui dreptunghi.

Lățimea tuturor dreptunghiurilor este aceeași și egală cu:

Pentru a selecta înălțimea dreptunghiurilor, puteți selecta valoarea funcției de pe marginea din stânga. În acest caz, înălțimea primului dreptunghi va fi f(a), al doilea - f(x 1),..., N-f(N-1).

Dacă luăm valoarea funcției de pe marginea dreaptă pentru a selecta înălțimea dreptunghiului, atunci în acest caz înălțimea primului dreptunghi va fi f(x 1), al doilea - f(x 2), ... , N - f(x N).

După cum puteți vedea, în acest caz, una dintre formule oferă o aproximare a integralei cu un exces, iar a doua cu o deficiență. Există o altă modalitate - de a utiliza valoarea funcției din mijlocul segmentului de integrare pentru aproximare:

Estimarea erorii absolute a metodei dreptunghiului (la mijloc)

Estimarea erorii absolute a metodelor dreptunghiului stâng și drept.

Exemplu. Calculați pentru întregul interval și împărțiți intervalul în patru secțiuni

Soluţie. Calculul analitic al acestei integrale dă I=arctg(1)–arctg(0)=0,7853981634. În cazul nostru:

1)h = 1; xo = 0; x1 = 1;

2) h = 0,25 (1/4); x0 = 0; x1 = 0,25; x2 = 0,5; x3 = 0,75; x4 = 1;

Să calculăm folosind metoda dreptunghiului din stânga:

Să calculăm folosind metoda dreptunghiului drept:

Să calculăm folosind metoda dreptunghiului mediu:

Metoda trapezoidală. Folosind un polinom de gradul I (o linie dreaptă trasată prin două puncte) pentru a interpola rezultă formula trapezoidală. Capetele segmentului de integrare sunt luate ca noduri de interpolare. Prin urmare, trapez curbat este înlocuit cu un trapez obișnuit, a cărui zonă poate fi găsită ca produsul dintre jumătate din suma bazelor și înălțimea

În cazul a N segmente de integrare pentru toate nodurile, cu excepția punctelor extreme ale segmentului, valoarea funcției va fi inclusă în suma totală de două ori (deoarece trapezele adiacente au o latură comună)

Formula trapezoidală poate fi obținută luând jumătate din suma formulelor dreptunghiurilor de-a lungul marginilor din dreapta și din stânga segmentului:

Verificarea stabilității soluției. De regulă, cu cât lungimea fiecărui interval este mai scurtă, de exemplu. Cum număr mai mare aceste intervale, cu atât diferența dintre valoarea aproximativă și exactă a integralei este mai mică. Acest lucru este valabil pentru majoritatea funcțiilor. În metoda trapezului, eroarea în calcularea integralei ϭ este aproximativ proporțională cu pătratul pasului de integrare (ϭ ~ h 2).Astfel, pentru a calcula integrala unei anumite funcții în termeni de a, b, este necesar să se calculeze împărțiți segmentul în N 0 intervale și găsiți suma ariilor trapezului. Apoi, trebuie să creșteți numărul de intervale N 1, să calculați din nou suma trapezului și să comparați valoarea rezultată cu rezultatul anterior. Acest lucru ar trebui repetat până la (N i) până când este atinsă precizia specificată a rezultatului (criteriul de convergență).

Pentru metodele dreptunghi și trapez, de obicei la fiecare pas de iterație numărul de intervale crește de 2 ori (N i +1 = 2N i).

Criteriul de convergență:

Principalul avantaj al regulii trapezoidale este simplitatea sa. Cu toate acestea, dacă este necesară o precizie ridicată la calcularea integralei, utilizarea acestei metode poate necesita prea mult cantitate mare iterații.

Eroarea absolută a metodei trapezoidale este estimat ca
.

Exemplu. Calculați o integrală aproximativ definită folosind formula trapezoidală.

a) Împărțirea segmentului de integrare în 3 părți.
b) Împărțirea segmentului de integrare în 5 părți.

Soluţie:
a) După condiție, segmentul de integrare trebuie împărțit în 3 părți, adică.
Să calculăm lungimea fiecărui segment de partiție: .

Prin urmare, formula generala trapezul este redus la o dimensiune plăcută:

In cele din urma:

Permiteți-mi să vă reamintesc că valoarea rezultată este o valoare aproximativă a zonei.

b) Să împărțim segmentul de integrare în 5 părți egale, adică. Prin creșterea numărului de segmente, creștem acuratețea calculelor.

Dacă , atunci formula trapezoidală ia următoarea vedere:

Să găsim pasul de partiție:
, adică lungimea fiecărui segment intermediar este de 0,6.

La finalizarea sarcinii, este convenabil să formalizați toate calculele folosind un tabel de calcul:

În prima linie scriem „contor”

Ca urmare:

Ei bine, chiar există o clarificare, și una serioasă!
Dacă pentru 3 segmente de partiție, atunci pentru 5 segmente. Dacă luați un segment și mai mare => va fi și mai precis.

Formula lui Simpson. Formula trapezoidală dă un rezultat care depinde puternic de mărimea pasului h, care afectează acuratețea calculării unei anumite integrale, mai ales în cazurile în care funcția este nemonotonă. Se poate presupune că acuratețea calculelor va crește dacă, în loc de segmente drepte care înlocuiesc fragmente curbilinii ale graficului funcției f(x), vom folosi, de exemplu, fragmente de parabole date prin trei puncte adiacente ale graficului. Această interpretare geometrică stă la baza metodei lui Simpson de calculare a integralei definite. Întregul interval integrare a,b N segmente sunt împărțite, lungimea segmentului va fi, de asemenea, egală cu h=(b-a)/N.

Formula lui Simpson arată astfel:

termenul rămas

Pe măsură ce lungimea segmentelor crește, acuratețea formulei scade, deci pentru a crește precizia, se folosește formula compusă a lui Simpson. Întregul interval de integrare este împărțit în număr par segmente identice N, lungimea segmentului va fi de asemenea egală cu h=(b-a)/N. Formula compusă a lui Simpson este:

În formulă, expresiile dintre paranteze reprezintă sumele valorilor integrandului de la capetele segmentelor interne pare, respectiv.

Restul formulei lui Simpson este proporțional cu puterea a patra a pasului:

Exemplu: Folosind regula lui Simpson, calculați integrala. (Soluția exactă - 0,2)

metoda Gauss

Formula de cuadratura gaussiana. Principiul de bază al formulelor de cuadratura de al doilea tip este vizibil din Figura 1.12: este necesar să se plaseze punctele în acest fel X 0 și X 1 în interiorul segmentului [ A;b], astfel încât aria totală a „triunghiurilor” să fie egală cu aria „segmentului”. Când se utilizează formula Gauss, segmentul original [ A;b] se reduce la segmentul [-1;1] prin înlocuirea variabilei X pe

0.5∙(bA)∙t+ 0.5∙(b + A).

Apoi , Unde .

O astfel de înlocuire este posibilă dacă AȘi b sunt finite, iar funcția f(X) este continuă pe [ A;b]. Formula Gauss la n puncte x i, i=0,1,..,n-1 în interiorul segmentului [ A;b]:

, (1.27)

Unde t iȘi A i pentru diverse n sunt date în cărți de referință. De exemplu, când n=2 A 0 =A 1 =1; la n=3: t 0 =t 2 "0,775, t 1 =0, A 0 =A 2 "0,555, A 1 "0,889.

Formula de cuadratura gaussiana

obţinută cu o funcţie de greutate egală cu unitatea p(x)= 1 și noduri x i, care sunt rădăcinile polinoamelor Legendre

Cote A i ușor de calculat folosind formule

i=0,1,2,...n.

Valorile nodurilor și coeficienților pentru n=2,3,4,5 sunt date în tabel

Ordin Noduri Cote
n=2 x 1=0 x 0 =-x 2=0.7745966692 A 1=8/9 A 0 = A 2=5/9
n=3 x 2 =-x 1=0.3399810436 x 3 =-x 0=0.8611363116 A 1 = A 2=0.6521451549 A 0 = A 3=0.6521451549
n=4 X 2 = 0 X 3 = -X 1 = 0.5384693101 X 4 =-X 0 =0.9061798459 A 0 =0.568888899 A 3 =A 1 =0.4786286705 A 0 =A 4 =0.2869268851
n=5 X 5 = -X 0 =0.9324695142 X 4 = -X 1 =0.6612093865 X 3 = -X 2 =0.2386191861 A 5 =A 0 =0.1713244924 A 4 =A 1 =0.3607615730 A 3 =A 2 =0.4679139346

Exemplu. Calculați valoarea utilizând formula Gauss pentru n=2:

Valoare exacta: .

Algoritmul de calcul al integralei folosind formula Gauss nu implică dublarea numărului de microsegmente, ci creșterea numărului de ordonate cu 1 și compararea valorilor obținute ale integralei. Avantajul formulei Gauss este precizia sa ridicată cu un număr relativ mic de ordonate. Dezavantaje: incomod pentru calcule manuale; este necesar să stocați valorile în memoria computerului t i, A i pentru diverse n.

Eroarea formulei de cuadratura gaussiană pe segment va fi Pentru restul termenului formula va fi și coeficientul α N scade rapid odata cu cresterea N. Aici

Formulele gaussiene oferă o precizie ridicată chiar și cu un număr mic de noduri (de la 4 la 10). În acest caz, în calculele practice, numărul de noduri variază de la câteva sute la câteva mii. De remarcat, de asemenea, că ponderile cuadraturilor gaussiene sunt întotdeauna pozitive, ceea ce asigură stabilitatea algoritmului de calcul al sumelor.

Diferenţiere. Când rezolvați probleme, este adesea necesar să găsiți derivata de o anumită ordine din funcția f(x), dată într-un tabel. În plus, uneori, din cauza complexității expresiei analitice a funcției f(x), diferențierea directă a acesteia este prea dificilă, precum și la rezolvarea numerică. ecuatii diferentiale. În aceste cazuri, se utilizează diferențierea numerică.

3.5. Metoda celor mai mici pătrate

Prima lucrare care a pus bazele metodei celor mai mici pătrate a fost realizată de Legendre în 1805. În articolul „Noi metode pentru determinarea orbitelor cometelor”, el a scris: „După ce toate condițiile problemei au fost utilizate pe deplin, este necesar să se determine coeficienții astfel încât mărimea erorilor lor să fie cât mai mică posibil. Cel mai într-un mod simplu pentru a realiza acest lucru este o metodă care constă în găsirea sumei minime a erorilor pătrate.” În prezent, metoda este utilizată pe scară largă atunci când se aproximează dependențe funcționale necunoscute specificate de multe eșantioane experimentale pentru a obține o expresie analitică care este cel mai bine aproximată la o valoare completă. -experiment la scară.

Să fie, pe baza unui experiment, să se stabilească dependența funcțională a cantității y din x : Să presupunem că în urma experimentului am obţinutn valorile ypentru valorile corespunzătoare ale argumentuluiX. Dacă punctele experimentale sunt situate pe planul de coordonate ca în figură, atunci, știind că în timpul experimentului apar erori, putem presupune că dependența este liniară, adică.y= topor+ bRețineți că metoda nu impune restricții asupra tipului de funcție, adică. poate fi aplicat oricăror dependențe funcționale.

Din punctul de vedere al experimentatorului, este adesea mai firesc să se ia în considerare secvența de eșantionarefixat în prealabil, adică este o variabilă independentă și contează - variabilă dependentă.Acest lucru este clar mai ales dacă este sub sunt înțelese ca momente în timp, care este cel mai larg utilizat în aplicațiile tehnice.Dar acesta este doar un caz special foarte frecvent. De exemplu, este necesar să se clasifice unele mostre după mărime. Apoi variabila independentă va fi numărul eșantionului, variabila dependentă va fi dimensiunea sa individuală.

Metoda celor mai mici pătrate este descrisă în detaliu în multe publicații educaționale și științifice, în special în ceea ce privește aproximarea funcțiilor în ingineria electrică și radio, precum și în cărțile despre teoria probabilităților și statistica matematică.

Să revenim la desen. Liniile punctate arată că erorile pot apărea nu numai din cauza procedurilor de măsurare imperfecte, ci și din cauza inexactității în specificarea variabilei independente.Cu tipul de funcție selectat Tot ce rămâne este să selectați parametrii incluși în acestaAȘi bEste clar că numărul de parametri poate fi mai mare de doi, ceea ce este tipic doar pentru funcțiile liniare. În general, vom presupune

.(1)

Trebuie să selectați coteleA, b, c... astfel încât condiția să fie îndeplinită

. (2)

Să găsim valorile A, b, c..., rotind partea stângă a (2) la minim. Pentru a face acest lucru, definim punctele staţionare(puncte în care prima derivată dispare) prin diferențierea părții stângi a (2) în raport cuA, b, c:

(3)

etc.Sistemul de ecuații rezultat conține tot atâtea ecuații câte necunoscuteA, b, c…. Este imposibil să se rezolve un astfel de sistem într-o formă generală, de aceea este necesar să se precizeze, cel puțin aproximativ, un anumit tip de funcție. În continuare, vom lua în considerare două cazuri: funcții liniare și pătratice.

Funcție liniară .

Luați în considerare suma diferențelor pătrate valori experimentaleși valorile funcției în punctele corespunzătoare:

(4)

Să selectăm parametriiAȘi bastfel încât această sumă să aibă cea mai mică valoare. Astfel, sarcina se rezumă la găsirea valorilorAȘi b, la care funcția are un minim, adică să studieze funcția a două variabile independenteAȘi bla minim. Pentru a face acest lucru, facem diferența prinAȘi b:

;

.


Sau

(5)

Înlocuind datele experimentale și , obținem un sistem de două ecuații liniare cu două necunoscuteAȘi b. După ce am rezolvat acest sistem, putem scrie funcția .

Să ne asigurăm că pentru valorile găsiteAȘi bare un minim. Pentru a face acest lucru, găsim și:

, , .

Prin urmare,

− = ,

>0,

acestea. este îndeplinită o condiție minimă suficientă pentru o funcție a două variabile.

Funcția pătratică .

Lăsați experimentul să obțină valorile funcției în puncte. Să fie, de asemenea, pe baza informațiilor a priori, să existe o presupunere că funcția este pătratică:

.

Trebuie să găsim coeficiențiiA, bȘi c.Avem

– funcţia a trei variabileA, b, c.

În acest caz, sistemul (3) ia forma:

Sau:

După ce am rezolvat acest sistem de ecuații liniare, determinăm necunoscuteleA, b, c.

Exemplu.Să se obțină patru valori ale funcției dorite pe baza experimentului y = (x ) cu patru valori ale argumentului, care sunt date în tabel: