Kapcsolatok

Példák a legkisebb négyzetek módszerére a problémamegoldásra. Legkisebb négyzet alakú módszer

A legkisebb négyzetek módszerének lényege egy olyan trendmodell paramétereinek megtalálásában, amely a legjobban leírja bármely véletlenszerű jelenség időbeni vagy térbeli fejlődési tendenciáját (a trend egy vonal, amely ennek a fejlődésnek a tendenciáját jellemzi). A legkisebb négyzetek módszerének (LSM) feladata nem csak egy trendmodell, hanem a legjobb vagy optimális modell megtalálása is. Ez a modell akkor lesz optimális, ha a megfigyelt tényleges értékek és a megfelelő számított trendértékek közötti négyzetes eltérések összege minimális (legkisebb):

Ahol - szórás megfigyelt tényleges érték között

és a megfelelő számított trendérték,

A vizsgált jelenség tényleges (megfigyelt) értéke,

A trendmodell számított értéke,

A vizsgált jelenség megfigyelésének száma.

Az MNC-t meglehetősen ritkán használják önmagában. Általában a korrelációs vizsgálatok során leggyakrabban csak szükséges technikai technikaként használják. Emlékeztetni kell arra, hogy az MNC információs alapja csak megbízható lehet statisztikai sorozat, és a megfigyelések száma nem lehet kevesebb 4-nél, különben az OLS simító eljárások elveszíthetik a józan eszét.

Az MNC eszközkészlet a következő eljárásokból áll:

Első eljárás. Kiderül, hogy van-e egyáltalán tendencia az eredő attribútum megváltoztatására, amikor a kiválasztott faktor-argumentum megváltozik, vagy más szóval, van-e kapcsolat a „ nál nél "És" x ».

Második eljárás. Meghatározzák, hogy melyik vonal (pálya) írja le vagy jellemezheti legjobban ezt a tendenciát.

Harmadik eljárás.

Példa. Tegyük fel, hogy van információnk a vizsgált gazdaság átlagos napraforgóterméséről (9.1. táblázat).

9.1. táblázat

Megfigyelési szám

Termőképesség, c/ha

Mivel hazánkban a napraforgótermesztés technológiai szintje az elmúlt 10 évben gyakorlatilag változatlan maradt, ez azt jelenti, hogy a vizsgált időszakban a terméshozam ingadozása nagymértékben függött az időjárási és éghajlati viszonyok ingadozásától. Ez tényleg igaz?

Az első OLS eljárás. A hipotézist a napraforgó terméshozamában az időjárási és éghajlati viszonyok változásától függően az elemzett 10 év alatti tendencia meglétére vonatkozó hipotézist teszteljük.

Ebben a példában a " y " célszerű a napraforgó hozamát venni, és a " x » – a vizsgált év száma a vizsgált időszakban. Annak a hipotézisnek a tesztelése, hogy létezik-e bármilyen kapcsolat x "És" y "kétféleképpen lehet megtenni: manuálisan és számítógépes programokkal. Természetesen, ha van számítástechnika ez a probléma magától megoldódik. De az MNC eszközök jobb megértése érdekében tanácsos tesztelni azt a hipotézist, hogy létezik-e kapcsolat a „ x "És" y » manuálisan, amikor csak egy toll és egy közönséges számológép van kéznél. Ilyen esetekben a trend létezésére vonatkozó hipotézist a legjobban vizuálisan ellenőrizni az elemzett dinamikasorozat grafikus képének elhelyezkedése - a korrelációs mező:

Példánkban a korrelációs mező egy lassan növekvő vonal körül helyezkedik el. Ez önmagában azt jelzi, hogy a napraforgótermés változásában bizonyos tendencia van. Csak akkor nem lehet tendencia jelenlétéről beszélni, ha a korrelációs mező körnek, körnek, szigorúan függőleges vagy szigorúan vízszintes felhőnek néz ki, vagy kaotikusan szétszórt pontokból áll. Minden más esetben az a hipotézis, hogy létezik kapcsolat x "És" y ", és folytassa a kutatást.

Második OLS eljárás. Meghatározzuk, hogy melyik vonal (pálya) írja le vagy jellemezze legjobban a napraforgótermés változásának trendjét a vizsgált időszakban.

Ha rendelkezik számítástechnikával, az optimális trend kiválasztása automatikusan megtörténik. A „kézi” feldolgozás során az optimális funkció kiválasztása általában vizuálisan történik - a korrelációs mező helye alapján. Ez azt jelenti, hogy a gráf típusa alapján az empirikus trendhez (a tényleges pályához) legjobban illeszkedő egyenes egyenlete kerül kiválasztásra.

Mint ismeretes, a természetben nagyon sokféle funkcionális függőség létezik, ezért rendkívül nehéz vizuálisan elemezni még egy kis részét is. Szerencsére a valós gazdasági gyakorlatban a legtöbb összefüggés elég pontosan leírható akár parabolával, akár hiperbolával, akár egyenessel. Ebben a tekintetben a legjobb funkció kiválasztásának „kézi” opciójával csak erre a három modellre korlátozhatja magát.

Hiperbola:

Másodrendű parabola: :

Könnyen belátható, hogy példánkban az elemzett 10 év napraforgótermés-változásának trendjét az egyenes vonal jellemzi legjobban, így a regressziós egyenlet egy egyenes egyenlete lesz.

Harmadik eljárás. Kiszámolják az ezt az egyenest jellemző regressziós egyenlet paramétereit, vagyis meghatározzák a legjobb trendmodellt leíró analitikai képletet.

A regressziós egyenlet paraméterei értékeinek megkeresése, esetünkben a és a paraméterek, az OLS magja. Ez a folyamat egy normál egyenletrendszer megoldásán múlik.

(9.2)

Ez az egyenletrendszer meglehetősen könnyen megoldható Gauss-módszerrel. Emlékezzünk vissza, hogy a megoldás eredményeként példánkban a és a paraméterek értékei találhatók. Így a talált regressziós egyenlet a következő formában lesz:

Közelítsük a függvényt egy 2-es fokú polinommal. Ehhez kiszámítjuk a normál egyenletrendszer együtthatóit:

, ,

Hozzunk létre egy normál legkisebb négyzetek rendszert, aminek a következő alakja van:

A rendszer megoldása könnyen megtalálható:, , .

Így egy 2. fokú polinom található: .

Elméleti információk

Vissza az oldalra<Введение в вычислительную математику. Примеры>

2. példa. Egy polinom optimális fokának megtalálása.

Vissza az oldalra<Введение в вычислительную математику. Примеры>

3. példa. Normál egyenletrendszer levezetése az empirikus függőség paramétereinek megtalálásához.

Vezessünk le egyenletrendszert az együtthatók és függvények meghatározására , amely egy adott függvény négyzetes középértékének pontonkénti közelítését végzi el. Készítsünk függvényt és írd le neki szükséges feltétel extrémum:

Ekkor a normál rendszer a következő formában jelenik meg:

Kapott lineáris rendszer egyenletek ismeretlen paraméterekre, és ami könnyen megoldható.

Elméleti információk

Vissza az oldalra<Введение в вычислительную математику. Примеры>

Példa.

Kísérleti adatok a változók értékeiről xÉs nál nél táblázatban vannak megadva.

Az igazításuk eredményeképpen a függvényt kapjuk

Használata legkisebb négyzetes módszer, közelítse meg ezeket az adatokat lineáris függéssel y=ax+b(keresse meg a paramétereket AÉs b). Nézze meg, hogy a két egyenes közül melyik igazítja jobban (a legkisebb négyzetek módszere értelmében) a kísérleti adatokat. Készítsen rajzot.

A legkisebb négyzetek módszerének (LSM) lényege.

A feladat az, hogy megtaláljuk azokat a lineáris függőségi együtthatókat, amelyeknél két változó függvénye AÉs ba legkisebb értéket veszi fel. Vagyis adott AÉs b a kísérleti adatok négyzetes eltéréseinek összege a talált egyenestől lesz a legkisebb. Ez a legkisebb négyzetek módszerének lényege.

Így a példa megoldása két változó függvényének extrémumának megkereséséhez vezet.

Levezetési képletek az együtthatók megtalálásához.

Összeállítunk és megoldunk egy két egyenletrendszert két ismeretlennel. Egy függvény parciális deriváltjainak megkeresése változók szerint AÉs b, ezeket a származékokat nullával egyenlővé tesszük.

A kapott egyenletrendszert bármilyen módszerrel megoldjuk (pl helyettesítési módszerrel vagy Cramer-módszer), és kapjunk képleteket az együtthatók megtalálásához a legkisebb négyzetek módszerével (LSM).

Adott AÉs b funkció a legkisebb értéket veszi fel. Ennek a ténynek a bizonyítékát alább az oldal végén található szöveg tartalmazza.

Ez a legkisebb négyzetek módszere. Képlet a paraméter megtalálásához a tartalmazza az összegeket , , , és paramétereket n— a kísérleti adatok mennyisége. Javasoljuk ezen összegek értékének külön kiszámítását.

Együttható b számítás után találtuk meg a.

Ideje emlékezni az eredeti példára.

Megoldás.

Példánkban n=5. A táblázatot a szükséges együtthatók képleteiben szereplő összegek kiszámításának megkönnyítése érdekében töltjük ki.

A táblázat negyedik sorában szereplő értékeket úgy kapjuk meg, hogy minden számhoz megszorozzuk a 2. sor értékét a 3. sor értékével én.

A táblázat ötödik sorában szereplő értékeket úgy kapjuk meg, hogy a 2. sorban lévő értékeket minden számhoz négyzetre emeljük én.

A táblázat utolsó oszlopában szereplő értékek a sorok közötti értékek összegei.

Az együtthatók meghatározásához a legkisebb négyzetek módszerének képleteit használjuk AÉs b. A táblázat utolsó oszlopának megfelelő értékeit helyettesítjük beléjük:

Ennélfogva, y = 0,165x+2,184— a kívánt közelítő egyenes.

Azt kell kideríteni, hogy melyik sorból y = 0,165x+2,184 vagy jobban közelíti az eredeti adatokat, azaz a legkisebb négyzetek módszerével becslést készít.

A legkisebb négyzetek módszerének hibabecslése.

Ehhez ki kell számítani az eredeti adatok e soroktól való eltérésének négyzetes összegét És , egy kisebb érték egy olyan vonalnak felel meg, amely jobban közelíti az eredeti adatokat a legkisebb négyzetek módszere értelmében.

Azóta, majd egyenesen y = 0,165x+2,184 jobban közelíti az eredeti adatokat.

A legkisebb négyzetek (LS) módszer grafikus ábrázolása.

A grafikonokon minden jól látható. A piros vonal a talált egyenes y = 0,165x+2,184, a kék vonal az , rózsaszín pöttyök az eredeti adatok.

Miért van erre szükség, miért ennyi közelítés?

Én személy szerint adatsimítási, interpolációs és extrapolációs problémák megoldására használom (az eredeti példában előfordulhat, hogy meg kell találniuk egy megfigyelt érték értékét y nál nél x=3 vagy mikor x=6 a legkisebb négyzetek módszerével). Erről azonban később az oldal másik részében fogunk beszélni.

Lap teteje

Bizonyíték.

Tehát amikor megtalálták AÉs b függvény a legkisebb értéket veszi fel, akkor szükséges, hogy ezen a ponton a függvény másodrendű differenciáljának másodfokú alakjának mátrixa határozott pozitív volt. Mutassuk meg.

A másodrendű differenciál alakja:

Azaz

Ezért a másodfokú mátrixnak van formája

és az elemek értéke nem függ attól AÉs b.

Mutassuk meg, hogy a mátrix pozitív határozott. Ehhez a szögletes kiskorúaknak pozitívnak kell lenniük.

Angular moll elsőrendű . Az egyenlőtlenség szigorú, mert a pontok nem esnek egybe. A következőkben erre utalunk.

Másodrendű szögmoll

Bizonyítsuk be a matematikai indukció módszerével.

Következtetés: talált értékek AÉs b megfelelnek legalacsonyabb érték funkciókat , ezért a legkisebb négyzetek módszeréhez szükséges paraméterek.

Nincs idő rájönni?
Rendeljen megoldást

Lap teteje

Előrejelzés készítése a legkisebb négyzetek módszerével. Példa a probléma megoldására

Extrapoláció egy olyan tudományos kutatási módszer, amely a múltbeli és jelenbeli trendek, minták, valamint az előrejelzési objektum jövőbeli fejlődésével való összefüggések terjesztésén alapul. Az extrapolációs módszerek közé tartozik mozgóátlag módszer, exponenciális simítás módszer, legkisebb négyzetek módszere.

Lényeg legkisebb négyzetek módszere a megfigyelt és számított értékek közötti négyzetes eltérések összegének minimalizálásából áll. A számított értékeket a kiválasztott egyenlet - a regressziós egyenlet - segítségével találjuk meg. Minél kisebb a távolság a tényleges és a számított értékek között, annál pontosabb az előrejelzés a regressziós egyenlet alapján.

A görbe kiválasztásának alapjául a vizsgált jelenség lényegének elméleti elemzése szolgál, amelynek változását egy idősor tükrözi. Néha figyelembe veszik a sorozatok szintjének növekedésének természetére vonatkozó megfontolásokat. Így, ha a kibocsátás növekedése aritmetikai folyamatban várható, akkor a simítást egyenes vonalban hajtjuk végre. Ha kiderül, hogy a növekedés geometriai progresszióban van, akkor a simítást exponenciális függvénnyel kell elvégezni.

Munkaképlet a legkisebb négyzetek módszeréhez : Y t+1 = a*X + b, ahol t + 1 – előrejelzési időszak; Уt+1 – előrejelzett mutató; a és b együtthatók; X - szimbólum idő.

Az a és b együtthatók kiszámítása a következő képletekkel történik:

ahol Uf – a dinamikai sorozat tényleges értékei; n – idősorszintek száma;

A legkisebb négyzetek módszerével végzett idősorok simítása a vizsgált jelenség fejlődési mintázatának tükrözésére szolgál. Egy trend analitikus kifejezésében az időt független változónak tekintjük, és a sorozatok szintjei ennek a független változónak a függvényében működnek.

Egy jelenség kialakulása nem attól függ, hogy hány év telt el a kiindulópont óta, hanem attól, hogy milyen tényezők, milyen irányban és milyen intenzitással befolyásolták a fejlődését. Innen már világos, hogy egy jelenség időbeli fejlődése e tényezők hatásának eredménye.

A görbe típusát helyesen megállapítva az analitikai időfüggőség típusa az egyik legerősebb. összetett feladatok előrejelzési elemzés .

A trendet leíró függvény típusának kiválasztása, amelynek paramétereit a legkisebb négyzetek módszerével határozzuk meg, a legtöbb esetben empirikusan, számos függvény összeállításával és a függvény értékének megfelelő összehasonlításával történik. átlagos négyzetes hiba, a következő képlettel számítva:

ahol UV a dinamikai sorozat aktuális értékei; Ur – a dinamikai sorozat számított (simított) értékei; n – idősorszintek száma; p – a trendet leíró képletekben meghatározott paraméterek száma (fejlődési trend).

A legkisebb négyzetek módszerének hátrányai :

  • amikor a vizsgált gazdasági jelenséget matematikai egyenlettel próbáljuk leírni, az előrejelzés rövid ideig pontos lesz, és a regressziós egyenletet újra kell számolni, amint új információk állnak rendelkezésre;
  • a standard számítógépes programokkal megoldható regressziós egyenlet kiválasztásának bonyolultsága.

Példa a legkisebb négyzetek módszerének használatára előrejelzés elkészítéséhez

Feladat . Vannak a régió munkanélküliségi rátáját jellemző adatok, %

  • Készítsen előrejelzést a régió munkanélküliségi rátájáról novemberre, decemberre, januárra a következő módszerekkel: mozgóátlag, exponenciális simítás, legkisebb négyzetek.
  • Számítsa ki az eredményül kapott előrejelzések hibáit az egyes módszerek használatával.
  • Hasonlítsa össze az eredményeket, és vonjon le következtetéseket.

Legkisebb négyzetek megoldása

Ennek megoldásához készítünk egy táblázatot, amelyben elvégezzük a szükséges számításokat:

ε = 28,63/10 = 2,86% előrejelzés pontossága magas.

Következtetés : A számításokból kapott eredmények összehasonlítása mozgóátlag módszer , exponenciális simítási módszer és a legkisebb négyzetek módszerével azt mondhatjuk, hogy az átlagos relatív hiba az exponenciális simítási módszerrel történő számításnál 20-50% közé esik. Ez azt jelenti, hogy az előrejelzés pontossága ebben az esetben csak kielégítő.

Az első és a harmadik esetben az előrejelzési pontosság magas, mivel az átlagos relatív hiba kevesebb, mint 10%. A mozgóátlag módszer azonban megbízhatóbb eredmények elérését tette lehetővé (novemberi előrejelzés - 1,52%, decemberi előrejelzés - 1,53%, januárra előrejelzés - 1,49%), mivel az átlagos relatív hiba ennek a módszernek a használatakor a legkisebb - 1 ,13%.

Legkisebb négyzet alakú módszer

További cikkek a témában:

A felhasznált források listája

  1. Tudományos és módszertani ajánlások a társadalmi kockázatok diagnosztizálására és a kihívások, veszélyek és társadalmi következmények előrejelzésére. Orosz Állami Szociális Egyetem. Moszkva. 2010;
  2. Vladimirova L.P. Előrejelzés és tervezés piaci viszonyok között: Tankönyv. juttatás. M.: "Dashkov and Co" kiadó, 2001;
  3. Novikova N.V., Pozdeeva O.G. A nemzetgazdasági előrejelzés: Oktatási és módszertani kézikönyv. Jekatyerinburg: Ural Kiadó. állapot közgazdász. Egyetem, 2007;
  4. Slutskin L.N. MBA tanfolyam az üzleti előrejelzésről. M.: Alpina Business Books, 2006.

MNC program

Adja meg az adatokat

Adatok és közelítés y = a + b x

én- kísérleti pontok száma;
x i- egy pontban rögzített paraméter értéke én;
y i- a mért paraméter értéke egy ponton én;
ωi- súlymérés egy ponton én;
y i, kalc.- különbség a mért és a regresszióval számított érték között y azon a ponton én;
S x i (x i)- hibabecslés x i méréskor y azon a ponton én.

Adatok és közelítés y = k x

én x i y i ωi y i, kalc. Δy i S x i (x i)

Kattintson a diagramra

Az MNC online program felhasználói kézikönyve.

Az adatmezőben minden egyes sorba írja be az „x” és „y” értékeit egy kísérleti pontban. Az értékeket szóközzel (szóközzel vagy tabulátorral) kell elválasztani.

A harmadik érték a "w" pont súlya lehet. Ha egy pont súlya nincs megadva, akkor az egyenlő eggyel. Az esetek túlnyomó többségében a kísérleti pontok súlya ismeretlen vagy nem számítható ki, pl. minden kísérleti adat egyenértékűnek tekinthető. Néha a vizsgált értéktartományban lévő súlyok egyáltalán nem egyenértékűek, és elméletileg is kiszámíthatók. Például a spektrofotometriában a tömegek kiszámíthatók egyszerű képletekkel, bár ezt többnyire figyelmen kívül hagyják a munkaerőköltségek csökkentése érdekében.

Az adatokat a vágólapon keresztül lehet beilleszteni egy irodai programcsomag táblázataiból, például az Excelből a Microsoft Office-ból vagy a Calc-ből az Open Office-ból. Erre a célra be táblázatot jelölje ki a másolandó adatok körét, másolja a vágólapra, és illessze be az adatokat ezen az oldalon az adatmezőbe.

A legkisebb négyzetek módszerével történő kiszámításhoz legalább két pontra van szükség két együttható "b" - az egyenes dőlésszögének érintője és "a" - az "y" tengelyen lévő egyenes által elfogott érték meghatározásához.

A számított regressziós együtthatók hibájának becsléséhez a kísérleti pontok számát kettőnél többre kell állítani.

A legkisebb négyzetek módszere (LSM).

Minél nagyobb a kísérleti pontok száma, annál pontosabb az együtthatók statisztikai értékelése (a Student-együttható csökkenése miatt), és annál közelebb áll a becslés az általános minta becsléséhez.

Az egyes kísérleti pontokon az értékek megszerzése gyakran jelentős munkaerőköltséggel jár, ezért gyakran kompromisszumos számú kísérletet hajtanak végre, amely kezelhető becslést ad, és nem vezet túlzott munkaerőköltségekhez. A két együtthatós lineáris legkisebb négyzetek függésének kísérleti pontjainak számát általában 5-7 pont tartományban választják ki.

A legkisebb négyzetek rövid elmélete a lineáris kapcsolatokhoz

Tegyük fel, hogy van egy kísérleti adatkészletünk értékpárok formájában ["y_i", "x_i"], ahol az "i" egy kísérleti mérés száma 1-től "n"-ig; "y_i" - a mért mennyiség értéke az "i" pontban; "x_i" - az "i" pontban beállított paraméter értéke.

Példaként tekintsük az Ohm-törvény működését. Az elektromos áramkör szakaszai közötti feszültség (potenciálkülönbség) változtatásával mérjük az ezen a szakaszon áthaladó áram nagyságát. A fizika egy kísérletileg megállapított függőséget ad:

"I = U/R",
ahol "I" az áramerősség; "R" - ellenállás; "U" - feszültség.

Ebben az esetben az "y_i" a mért áramérték, az "x_i" pedig a feszültség értéke.

Egy másik példaként vegyük egy anyag oldatban lévő oldatának fényelnyelését. A kémia a következő képletet adja:

"A = ε l C",
ahol "A" az oldat optikai sűrűsége; "ε" - az oldott anyag áteresztőképessége; `l` - úthossz, amikor a fény áthalad az oldatot tartalmazó küvettán; "C" az oldott anyag koncentrációja.

Ebben az esetben az „y_i” az „A” optikai sűrűség mért értéke, az „x_i” pedig az általunk megadott anyag koncentrációértéke.

Megvizsgáljuk azt az esetet, amikor az `x_i` feladat relatív hibája lényegesen kisebb, relatív hiba"y_i" méretek. Azt is feltételezzük, hogy minden mért "y_i" érték véletlenszerű és normális eloszlású, pl. tartsa be a normál eloszlási törvényt.

Abban az esetben, ha az "y" lineáris függése az "x"-től, felírhatjuk az elméleti függést:
"y = a + b x".

VAL VEL geometriai pont A látás szempontjából a "b" együttható az egyenes dőlésszögének érintőjét jelöli az "x" tengelyhez, az "a" együttható pedig az "y" értékét a vonal metszéspontjában a " y tengely ("x = 0"-nál).

A regressziós egyenes paramétereinek megkeresése.

Egy kísérletben az "y_i" mért értékei nem lehetnek pontosan az elméleti egyenesen a mérési hibák miatt, amelyek mindig velejárók. való élet. Ezért egy lineáris egyenletet egyenletrendszerrel kell ábrázolni:
"y_i = a + b x_i + ε_i" (1),
ahol "ε_i" az "y" ismeretlen mérési hibája az "i"-edik kísérletben.

A függőséget (1) is nevezik regresszió, azaz két mennyiség egymástól való függése statisztikai szignifikanciával.

A függőség helyreállításának feladata az `a` és `b` együtthatók megtalálása az [`y_i`, `x_i`] kísérleti pontokból.

Az "a" és "b" együtthatók megtalálásához általában ezt használják legkisebb négyzetes módszer(MNC). Ez a maximális valószínűség elvének speciális esete.

Írjuk át az (1)-et `ε_i = y_i - a - b x_i` formában.

Ekkor a hibák négyzetes összege lesz
"Φ = összeg_(i=1)^(n) ε_i^2 = összeg_(i=1)^(n) (y_i - a - b x_i)^2". (2)

A legkisebb négyzetek (legkisebb négyzetek) elve az, hogy minimalizáljuk a (2) összeget az "a" és "b" paraméterek tekintetében..

A minimum akkor érhető el, ha a (2) összeg parciális deriváltjai az "a" és "b" együtthatók tekintetében nullával egyenlőek:
`töredék(részleges Φ)(részleges a) = tört(részösszeg_(i=1)^(n) (y_i - a - b x_i)^2)(részleges a) = 0
`töredék(részleges Φ)(részleges b) = tört(részösszeg_(i=1)^(n) (y_i - a - b x_i)^2)(részleges b) = 0

A deriváltokat kibővítve egy két egyenletrendszert kapunk két ismeretlennel:
`összeg_(i=1)^(n) (2a + 2bx_i — 2y_i) = összeg_(i=1)^(n) (a + bx_i — y_i) = 0
`összeg_(i=1)^(n) (2bx_i^2 + 2ax_i — 2x_iy_i) = összeg_(i=1)^(n) (bx_i^2 + ax_i — x_iy_i) = 0

Kinyitjuk a zárójeleket és a szükséges együtthatóktól független összegeket átvisszük a másik felére, megkapjuk a rendszert lineáris egyenletek:
`összeg_(i=1)^(n) y_i = a n + b összeg_(i=1)^(n) bx_i
`összeg_(i=1)^(n) x_iy_i = a sum_(i=1)^(n) x_i + b összeg_(i=1)^(n) x_i^2

A kapott rendszert megoldva képleteket találunk az "a" és "b" együtthatókhoz:

`a = frac(összeg_(i=1)^(n) y_i összeg_(i=1)^(n) x_i^2 — összeg_(i=1)^(n) x_i összeg_(i=1)^(n) ) x_iy_i) (n sum_(i=1)^(n) x_i^2 — (sum_(i=1)^(n) x_i)^2)" (3.1)

`b = frac(n sum_(i=1)^(n) x_iy_i — sum_(i=1)^(n) x_i sum_(i=1)^(n) y_i) (n sum_(i=1)^ (n) x_i^2 — (összeg_(i=1)^(n) x_i)^2)" (3.2)

Ezeknek a képleteknek vannak megoldásai, ha `n > 1` (az egyenes legalább 2 pontból összeállítható), és ha a determináns `D = n sum_(i=1)^(n) x_i^2 - (sum_(i= 1) )^(n) x_i)^2 != 0`, azaz. amikor a kísérlet „x_i” pontjai eltérőek (azaz ha a vonal nem függőleges).

A regressziós egyenes együtthatók hibáinak becslése

Az "a" és "b" együtthatók számítási hibájának pontosabb értékeléséhez kívánatos nagyszámú kísérleti pontok. Ha `n = 2`, lehetetlen megbecsülni az együtthatók hibáját, mert a közelítő egyenes egyértelműen két ponton fog átmenni.

Hiba valószínűségi változó A "V" definiálva van hibahalmozódás törvénye
`S_V^2 = összeg_(i=1)^p (töredék(részleges f)(részleges z_i))^2 S_(z_i)^2,
ahol "p" az "S_(z_i)" hibával rendelkező "z_i" paraméterek száma, amelyek befolyásolják az "S_V" hibát;
Az "f" a "V" "z_i"-től való függésének függvénye.

Írjuk fel a hibahalmozás törvényét az "a" és "b" együtthatók hibájára
`S_a^2 = összeg_(i=1)^(n)(töredék(részleges a)(részleges y_i))^2 S_(y_i)^2 + összeg_(i=1)^(n)(töredék(részleges a) )(részleges x_i))^2 S_(x_i)^2 = S_y^2 összeg_(i=1)^(n)(töredék(részleges a)(részleges y_i))^2 `,
`S_b^2 = összeg_(i=1)^(n)(töredék(részleges b)(részleges y_i))^2 S_(y_i)^2 + összeg_(i=1)^(n)(töredék(részleges b) )(részleges x_i))^2 S_(x_i)^2 = S_y^2 összeg_(i=1)^(n)(töredék(részleges b)(részleges y_i))^2 `,
mert "S_(x_i)^2 = 0" (korábban fenntartással éltünk, hogy az "x" hiba elhanyagolható).

"S_y^2 = S_(y_i)^2" – hiba (szórás, szórásnégyzet) az "y" mérésében, feltételezve, hogy a hiba az "y" minden értékére egységes.

Az "a" és "b" kiszámításához képleteket behelyettesítve a kapott kifejezésekbe

`S_a^2 = S_y^2 frac(sum_(i=1)^(n) (sum_(i=1)^(n) x_i^2 — x_i sum_(i=1)^(n) x_i)^2 ) (D^2) = S_y^2 frac((n sum_(i=1)^(n) x_i^2 — (sum_(i=1)^(n) x_i)^2) sum_(i=1) ^(n) x_i^2) (D^2) = S_y^2 frac(összeg_(i=1)^(n) x_i^2) (D)" (4.1)

`S_b^2 = S_y^2 frac(összeg_(i=1)^(n) (n x_i — sum_(i=1)^(n) x_i)^2) (D^2) = S_y^2 frac( n (n sum_(i=1)^(n) x_i^2 — (sum_(i=1)^(n) x_i)^2)) (D^2) = S_y^2 frac(n) (D) (4.2)

A legtöbb valódi kísérletben az "Sy" értékét nem mérik. Ehhez a terv egy vagy több pontján több párhuzamos mérést (kísérletet) kell végezni, ami megnöveli a kísérlet idejét (esetleg költségét). Ezért általában azt feltételezik, hogy az "y" eltérése a regressziós egyenestől véletlenszerűnek tekinthető. Az "y" variancia becslését ebben az esetben a képlet segítségével számítjuk ki.

`S_y^2 = S_(y, rest)^2 = frac(sum_(i=1)^n (y_i - a - b x_i)^2) (n-2)".

Az "n-2" osztó azért jelenik meg, mert a szabadsági fokaink száma csökkent, mivel két együtthatót számoltunk ki ugyanazon kísérleti adatmintával.

Ezt a becslést az „S_(y, rest)^2” regressziós egyeneshez viszonyított maradék varianciának is nevezik.

Az együtthatók szignifikanciáját a Student-féle t-próba segítségével értékeljük

"t_a = frac(|a|) (S_a)", "t_b = frac(|b|) (S_b)"

Ha a számított "t_a", "t_b" kritériumok kisebbek, mint a táblázatban szereplő "t(P, n-2)" kritériumok, akkor a megfelelő együttható nem különbözik jelentősen a nullától egy adott "P" valószínűség mellett.

A lineáris kapcsolat leírásának minőségének értékeléséhez a Fisher-kritérium használatával összehasonlíthatja az "S_(y, rest)^2" és az "S_(y bar)" értékeket az átlaggal.

`S_(y bar) = frac(sum_(i=1)^n (y_i — bar y)^2) (n-1) = frac(sum_(i=1)^n (y_i — (sum_(i=) 1)^n y_i) /n)^2) (n-1)" - az "y" variancia átlaghoz viszonyított mintabecslése.

A függőséget leíró regressziós egyenlet hatékonyságának értékeléséhez a Fisher-együtthatót kiszámítjuk.
"F = S_(y bar) / S_(y, rest)^2",
amelyet a táblázatos Fisher-együtthatóval (F(p, n-1, n-2)) hasonlítanak össze.

Ha "F > F(P, n-1, n-2)", akkor az "y = f(x)" összefüggés regressziós egyenletet használó leírása és az átlagot használó leírás közötti különbség statisztikailag szignifikánsnak tekinthető valószínűséggel. "P". Azok. a regresszió jobban leírja a függőséget, mint az "y" terjedése az átlag körül.

Kattintson a diagramra
értékek hozzáadásához a táblázathoz

Legkisebb négyzet alakú módszer. A legkisebb négyzetek módszere az a, b, c ismeretlen paraméterek, az elfogadott funkcionális függés meghatározását jelenti

A legkisebb négyzetek módszere ismeretlen paraméterek meghatározására vonatkozik a, b, c,… elfogadott funkcionális függőség

y = f(x,a,b,c,…),

amely a hiba átlagos négyzetének (szórásának) minimumát biztosítaná

, (24)

ahol x i, y i a kísérletből kapott számpárok halmaza.

Mivel egy több változóból álló függvény extrémumának feltétele az a feltétel, hogy parciális deriváltjai nullával egyenlőek, akkor a paraméterek a, b, c,… egyenletrendszerből határozzuk meg:

; ; ; … (25)

Emlékeztetni kell arra, hogy a legkisebb négyzetek módszere a függvény típusa utáni paraméterek kiválasztására szolgál y = f(x) meghatározott

Ha elméleti megfontolásból nem vonható le következtetés arra vonatkozóan, hogy mi legyen az empirikus képlet, akkor a vizuális ábrázolásokon kell vezérelni, elsősorban a megfigyelt adatok grafikus ábrázolásán.

A gyakorlatban ezek leggyakrabban a következő típusú funkciókra korlátozódnak:

1) lineáris ;

2) másodfokú a.

Legkisebb négyzet alakú módszer

Legkisebb négyzet módszer ( OLS, OLS, közönséges legkisebb négyzetek) - a regresszióanalízis egyik alapvető módszere regressziós modellek ismeretlen paramétereinek mintaadatok felhasználásával történő becslésére. A módszer a regressziós maradékok négyzetösszegének minimalizálásán alapul.

Meg kell jegyezni, hogy maga a legkisebb négyzetek módszere is nevezhető módszernek egy probléma megoldására bármely területen, ha a megoldás a szükséges változók egyes függvényei négyzetösszegének minimalizálására vonatkozó feltételekben rejlik vagy eleget tesz. Ezért a legkisebb négyzetek módszere egy adott függvény más (egyszerűbb) függvényekkel való közelítő ábrázolására (közelítésére) is használható, amikor olyan mennyiségek halmazát találjuk, amelyek kielégítik az egyenleteket vagy korlátokat, amelyek száma meghaladja ezen mennyiségek számát. stb.

Az MNC lényege

Adjunk meg valamilyen (parametrikus) modellt a (magyarázott) változó közötti valószínűségi (regressziós) kapcsolatról yés sok tényező (magyarázó változók) x

ahol az ismeretlen modellparaméterek vektora

- véletlenszerű modellhiba.

Legyenek ezeknek a változóknak a mintamegfigyelései is. Legyen a megfigyelési szám (). Ezután a változók értékei vannak a megfigyelésben. Aztán at adott értékeket A b paraméterek alapján kiszámíthatja az y magyarázott változó elméleti (modell) értékeit:

A maradékok mérete a b paraméterek értékétől függ.

A legkisebb négyzetek módszerének (közönséges, klasszikus) lényege, hogy olyan b paramétereket találjunk, amelyekre a maradékok négyzetösszege (eng. Maradék négyzetösszeg) minimális lesz:

Ez a probléma általános esetben numerikus optimalizálási (minimalizálási) módszerekkel oldható meg. Ebben az esetben arról beszélnek nemlineáris legkisebb négyzetek(NLS vagy NLLS - angol) Nem lineáris legkisebb négyzetek). Sok esetben lehetséges analitikus megoldást kapni. A minimalizálási probléma megoldásához meg kell találni a függvény stacionárius pontjait úgy, hogy a függvényt az ismeretlen b paraméterek alapján differenciáljuk, a deriváltokat nullával egyenlővé kell tenni, és meg kell oldani a kapott egyenletrendszert:

Ha a modell véletlenszerű hibái normál eloszlásúak, ugyanolyan szórással rendelkeznek, és nincs korrelációjuk, az OLS paraméterbecslései megegyeznek a maximális valószínűségi becslésekkel (MLM).

OLS lineáris modell esetén

Legyen a regressziós függés lineáris:

Hadd y a magyarázott változó megfigyelésének oszlopvektora, és faktormegfigyelések mátrixa (a mátrix sorai a faktorértékek vektorai ezt a megfigyelést, oszlopok szerint - értékek vektora ezt a tényezőt minden megfigyelésben). A lineáris modell mátrixábrázolása a következő:

Ekkor a magyarázott változó becslési vektora és a regressziós maradékok vektora egyenlő lesz

Ennek megfelelően a regressziós maradékok négyzetösszege egyenlő lesz

Ezt a függvényt a paramétervektorral differenciálva és a deriváltokat nullával egyenlővé téve egy egyenletrendszert kapunk (mátrix formában):

.

Ennek az egyenletrendszernek a megoldása azt adja általános képlet OLS becslések a lineáris modellhez:

Analitikai célokra a képlet utóbbi ábrázolása hasznos. Ha egy regressziós modellben az adatok központosított, akkor ebben az ábrázolásban az első mátrix faktorok minta kovarianciamátrixát, a második pedig faktorok kovarianciavektorát jelenti a függő változóval. Ha emellett az adatok is normalizálva az MSE-hez (vagyis végső soron szabványosított), akkor az első mátrix a faktorok mintakorrelációs mátrixát jelenti, a második vektor - a faktorok mintakorrelációinak vektora a függő változóval.

A modellek OLS-becsléseinek fontos tulajdonsága állandóval- a megszerkesztett regresszió egyenese átmegy a mintaadatok súlypontján, azaz teljesül az egyenlőség:

Különösen szélsőséges esetben, amikor az egyetlen regresszor egy konstans, azt találjuk, hogy az egyetlen paraméter (maga az állandó) OLS-becslése megegyezik a magyarázott változó átlagos értékével. Vagyis a nagy számok törvényei alapján jó tulajdonságairól ismert számtani átlag is a legkisebb négyzetek becslése - az ettől való eltérések minimális négyzetösszegére vonatkozó kritériumot teljesíti.

Példa: legegyszerűbb (páronkénti) regresszió

Gőzfürdő esetén lineáris regresszió a számítási képletek leegyszerűsödnek (ez nélkül is megteheti mátrix algebra):

Az OLS becslések tulajdonságai

Először is megjegyezzük, hogy a lineáris modellek esetében az OLS becslések lineáris becslések, amint az a fenti képletből következik. Az elfogulatlan OLS becsléseknél szükséges és elegendő a regresszióanalízis legfontosabb feltételének teljesítése: a véletlenszerű hiba matematikai elvárása a tényezők függvényében nullával kell, hogy legyen. Ez az állapot, különösen elégedett, ha

  1. a véletlen hibák matematikai elvárása nulla, és
  2. tényezők és véletlenszerű hibák független valószínűségi változók.

A második feltétel - a tényezők exogenitásának feltétele - alapvető. Ha ez a tulajdonság nem teljesül, akkor feltételezhetjük, hogy szinte minden becslés rendkívül nem kielégítő: még csak nem is konzisztens (vagyis még nagyon nagy mennyiségű adat sem teszi lehetővé, hogy ebben az esetben jó minőségű becsléseket kapjunk ). Klasszikus esetben a faktorok determinizmusáról erősebb feltételezés történik, szemben a véletlenszerű hibával, ami automatikusan azt jelenti, hogy az exogenitási feltétel teljesül. Általános esetben a becslések konzisztenciájához elegendő teljesíteni az exogenitási feltételt a mátrix valamely nem szinguláris mátrixhoz való konvergenciájával együtt, amikor a minta mérete a végtelenségig nő.

Ahhoz, hogy a konzisztencián és a torzítatlanságon kívül a (közönséges) legkisebb négyzetek becslései is hatékonyak legyenek (a lineáris torzítatlan becslések osztályának legjobbjai), a véletlen hiba további tulajdonságainak teljesülniük kell:

Ezek a feltevések megfogalmazhatók a véletlen hibavektor kovarianciamátrixára

Az ezeket a feltételeket kielégítő lineáris modellt ún klasszikus. A klasszikus lineáris regresszióra vonatkozó OLS-becslések torzítatlanok, konzisztensek és a leghatékonyabb becslések az összes lineáris torzítatlan becslés osztályában (az angol szakirodalomban néha használják a rövidítést KÉK (A legjobb lineáris alap nélküli becslő) - a legjobb lineáris torzítatlan becslés; V orosz irodalom Gyakran használják a Gauss-Markov-tételt). Amint az könnyen látható, az együtthatóbecslések vektorának kovarianciamátrixa egyenlő lesz:

Általános OLS

A legkisebb négyzetek módszere széles körű általánosítást tesz lehetővé. A maradékok négyzetösszegének minimalizálása helyett minimalizálható a maradékok vektorának valamilyen pozitív határozott másodfokú formája, ahol van valamilyen szimmetrikus pozitív meghatározott súlyú mátrix. A hagyományos legkisebb négyzetek egy speciális esete ennek a megközelítésnek, ahol a súlymátrix arányos az azonosságmátrixszal. Amint az a szimmetrikus mátrixok (vagy operátorok) elméletéből ismeretes, az ilyen mátrixok esetében dekompozíció történik. Ebből következően a megadott funkcionális a következőképpen ábrázolható, vagyis ez a funkcionális néhány transzformált „maradék” négyzetösszegeként ábrázolható. Így megkülönböztethetjük a legkisebb négyzetek módszereinek egy osztályát - LS módszereket (Least Squares).

Bebizonyosodott (Aitken tétele), hogy egy általánosított lineáris regressziós modellnél (amelyben nincs korlátozás a véletlen hibák kovarianciamátrixára) a leghatékonyabbak (a lineáris torzítatlan becslések osztályában) az ún. becslések. általánosított legkisebb négyzetek (GLS – általánosított legkisebb négyzetek)- LS módszer a véletlen hibák inverz kovarianciamátrixával egyenlő súlymátrixszal: .

Megmutatható, hogy a lineáris modell paramétereinek GLS becslésére szolgáló képletnek van alakja

E becslések kovarianciamátrixa ennek megfelelően egyenlő lesz

Valójában az OLS lényege az eredeti adatok bizonyos (lineáris) transzformációjában (P) és a hagyományos OLS alkalmazásában rejlik a transzformált adatokra. Ennek az átalakításnak az a célja, hogy a transzformált adatoknál a véletlenszerű hibák már kielégítsék a klasszikus feltételezéseket.

Súlyozott OLS

Átlós súlymátrix (és ezért véletlenszerű hibák kovarianciamátrixa) esetén van az úgynevezett súlyozott legkisebb négyzetek (WLS). Ebben az esetben a modell maradékainak súlyozott négyzetösszege minimalizálva van, vagyis minden megfigyelés kap egy „súlyt”, amely fordítottan arányos a véletlen hiba szórásával ebben a megfigyelésben: . Valójában az adatokat a megfigyelések súlyozásával transzformálják (elosztják a várttal arányos összeggel szórás véletlenszerű hibák), és a szokásos OLS-t alkalmazzák a súlyozott adatokra.

Az MNC gyakorlati használatának néhány speciális esete

Lineáris függés közelítése

Tekintsük azt az esetet, amikor egy adott skaláris mennyiség egy adott skalármennyiségtől való függésének vizsgálata eredményeként (ez lehet például a feszültség függése az áramerősségtől: , ahol állandó érték, az ellenállás a vezető), ezeknek a mennyiségeknek a mérését elvégezték, aminek eredményeként az értékeket és a hozzájuk tartozó értékeket. A mérési adatokat táblázatban kell rögzíteni.

Asztal. Mérési eredmények.

Mérés sz.
1
2
3
4
5
6

A kérdés a következő: milyen együttható érték választható a függőség legjobb leírására? A legkisebb négyzetek módszere szerint ennek az értéknek olyannak kell lennie, hogy az értékek négyzetes eltéréseinek összege az értékektől

minimális volt

A négyzetes eltérések összegének van egy szélsősége - egy minimum, amely lehetővé teszi számunkra ennek a képletnek a használatát. Ebből a képletből keressük meg az együttható értékét. Ehhez alakítsuk át bal oldal a következő módon:

Az utolsó képlet lehetővé teszi, hogy megtaláljuk az együttható értékét, amelyre a feladatban szükség volt.

Sztori

Előtt eleje XIX V. a tudósoknak nem volt bizonyos szabályokat olyan egyenletrendszer megoldására, amelyben az ismeretlenek száma kisebb, mint az egyenletek száma; Addig az egyenletek típusától és a számológépek eszétől függő magántechnikákat alkalmaztak, ezért a különböző számológépek ugyanazon megfigyelési adatok alapján eltérő következtetésekre jutottak. Gauss (1795) volt az első, aki alkalmazta a módszert, Legendre (1805) pedig önállóan fedezte fel és publikálta mai nevén (francia. Méthode des moindres quarrés ) . Laplace a módszert a valószínűségszámításhoz kapcsolta, Adrain amerikai matematikus (1808) pedig valószínűségelméleti alkalmazásait vizsgálta. A módszert széles körben elterjedt és továbbfejlesztette Encke, Bessel, Hansen és mások további kutatásai.

Az OLS alternatív felhasználási módjai

A legkisebb négyzetek módszerének ötlete más, nem közvetlenül kapcsolódó esetekben is használható regresszió analízis. A tény az, hogy a négyzetösszeg a vektorok egyik leggyakoribb közelségi mértéke (euklideszi metrika véges dimenziós terekben).

Az egyik alkalmazás a lineáris egyenletrendszerek „megoldása”, amelyekben az egyenletek száma nagyobb, mint a változók száma.

ahol a mátrix nem négyzet, hanem téglalap alakú.

Egy ilyen egyenletrendszernek általában nincs megoldása (ha a rang nagyobb, mint a változók száma). Ezért ez a rendszer csak abban az értelemben „megoldható”, hogy egy ilyen vektort választunk, hogy minimalizáljuk a vektorok és a vektorok közötti „távolságot”. Ehhez alkalmazhatja azt a kritériumot, hogy minimalizálja a rendszeregyenletek bal és jobb oldala közötti különbségek négyzetösszegét, azaz. Könnyen kimutatható, hogy ennek a minimalizálási problémának a megoldása vezet a megoldáshoz következő rendszer egyenletek

A legkisebb négyzetek módszere (OLS) lehetővé teszi különféle mennyiségek becslését számos véletlenszerű hibákat tartalmazó mérés eredményeinek felhasználásával.

Az MNE-k jellemzői

fő gondolat ez a módszer abban áll, hogy a probléma megoldásának pontosságának kritériumaként a négyzetes hibák összegét veszik figyelembe, amelyet igyekeznek minimalizálni. Ennek a módszernek a használatakor mind numerikus, mind analitikus megközelítések használhatók.

A legkisebb négyzetek módszere numerikus megvalósításként azt jelenti, hogy a lehető legtöbbet kell végrehajtani több ismeretlen valószínűségi változó mérései. Sőt, minél több a számítás, annál pontosabb lesz a megoldás. A számítások ezen halmaza (kiindulási adatok) alapján egy másik becsült megoldáskészletet kapunk, amelyből azután kiválasztjuk a legjobbat. Ha a megoldások halmazát paraméterezzük, akkor a legkisebb négyzetek módszere a paraméterek optimális értékének meghatározására redukálódik.

Az LSM megvalósításának analitikus megközelítéseként egy kezdeti adathalmazon (mérések) és egy várt megoldáshalmazon meghatároznak egy bizonyosat (funkcionális), amelyet egy bizonyos hipotézisként kapott képlettel lehet kifejezni, amely megerősítést igényel. Ebben az esetben a legkisebb négyzetek módszere az eredeti adatok négyzetes hibáinak halmazán ennek a funkcionálisnak a minimumának megtalálásához vezet.

Kérjük, vegye figyelembe, hogy nem maguk a hibák, hanem a hibák négyzetei. Miért? Az a tény, hogy gyakran eltérések a mérések pontos érték pozitívak és negatívak is. Az átlag meghatározásakor az egyszerű összegzés helytelen következtetést vonhat le a becslés minőségéről, mivel a pozitív és negatív értékek törlése csökkenti a többszörös mérési mintavétel erejét. És ennek következtében az értékelés pontossága.

Hogy ez ne forduljon elő, a négyzetes eltéréseket összegezzük. Sőt, a mért érték és a végső becslés dimenziójának kiegyenlítése érdekében a négyzetes hibák összegét kivonják.

Néhány MNC alkalmazás

Az MNC-t széles körben használják különféle területeken. Például a valószínűségszámításban és a matematikai statisztikában a módszert egy valószínűségi változó olyan jellemzőjének meghatározására használják, mint az átlag. szórás, amely meghatározza a valószínűségi változók értéktartományának szélességét.

Példa.

Kísérleti adatok a változók értékeiről xÉs nál nél táblázatban vannak megadva.

Az igazításuk eredményeképpen a függvényt kapjuk

Használata legkisebb négyzetes módszer, közelítse meg ezeket az adatokat lineáris függéssel y=ax+b(keresse meg a paramétereket AÉs b). Nézze meg, hogy a két egyenes közül melyik igazítja jobban (a legkisebb négyzetek módszere értelmében) a kísérleti adatokat. Készítsen rajzot.

A legkisebb négyzetek módszerének (LSM) lényege.

A feladat az, hogy megtaláljuk azokat a lineáris függőségi együtthatókat, amelyeknél két változó függvénye AÉs b a legkisebb értéket veszi fel. Vagyis adott AÉs b a kísérleti adatok négyzetes eltéréseinek összege a talált egyenestől lesz a legkisebb. Ez a legkisebb négyzetek módszerének lényege.

Így a példa megoldása két változó függvényének extrémumának megkereséséhez vezet.

Levezetési képletek az együtthatók megtalálásához.

Összeállítunk és megoldunk egy két egyenletrendszert két ismeretlennel. Egy függvény parciális deriváltjainak megkeresése változók szerint AÉs b, ezeket a származékokat nullával egyenlővé tesszük.

A kapott egyenletrendszert bármilyen módszerrel megoldjuk (pl helyettesítési módszerrel vagy Cramer módszere), és kapjunk képleteket az együtthatók megtalálásához a legkisebb négyzetek módszerével (LSM).

Adott AÉs b funkció a legkisebb értéket veszi fel. Ennek a ténynek a bizonyítéka adott alatta, az oldal végén található szövegben.

Ez a legkisebb négyzetek módszere. Képlet a paraméter megtalálásához a a ,,, és a paraméter összegeit tartalmazza n- kísérleti adatok mennyisége. Javasoljuk ezen összegek értékének külön kiszámítását. Együttható b számítás után találtuk meg a.

Ideje emlékezni az eredeti példára.

Megoldás.

Példánkban n=5. A táblázatot a szükséges együtthatók képleteiben szereplő összegek kiszámításának megkönnyítése érdekében töltjük ki.

A táblázat negyedik sorában szereplő értékeket úgy kapjuk meg, hogy minden számhoz megszorozzuk a 2. sor értékét a 3. sor értékével én.

A táblázat ötödik sorában szereplő értékeket úgy kapjuk meg, hogy a 2. sorban lévő értékeket minden számhoz négyzetre emeljük én.

A táblázat utolsó oszlopában szereplő értékek a sorok közötti értékek összegei.

Az együtthatók meghatározásához a legkisebb négyzetek módszerének képleteit használjuk AÉs b. A táblázat utolsó oszlopának megfelelő értékeit helyettesítjük beléjük:

Ennélfogva, y = 0,165x+2,184- a kívánt közelítő egyenes.

Azt kell kideríteni, hogy melyik sorból y = 0,165x+2,184 vagy jobban közelíti az eredeti adatokat, azaz a legkisebb négyzetek módszerével becslést készít.

A legkisebb négyzetek módszerének hibabecslése.

Ehhez ki kell számítani az eredeti adatok e soroktól való eltérésének négyzetes összegét És , egy kisebb érték egy olyan vonalnak felel meg, amely jobban közelíti az eredeti adatokat a legkisebb négyzetek módszere értelmében.

Azóta, majd egyenesen y = 0,165x+2,184 jobban közelíti az eredeti adatokat.

A legkisebb négyzetek (LS) módszer grafikus ábrázolása.

A grafikonokon minden jól látható. A piros vonal a talált egyenes y = 0,165x+2,184, a kék vonal az , rózsaszín pöttyök az eredeti adatok.

A gyakorlatban a különböző folyamatok - különösen gazdasági, fizikai, műszaki, társadalmi - modellezésekor széles körben alkalmazzák a függvények közelítő értékeinek kiszámításának egyik vagy másik módszerét az ismert értékekből bizonyos rögzített pontokon.

Ez a fajta függvény közelítési probléma gyakran felmerül:

    közelítő képletek összeállításakor a vizsgált folyamat jellemző mennyiségeinek értékeinek kiszámításához a kísérlet eredményeként kapott táblázatos adatok felhasználásával;

    numerikus integrálásban, differenciálásban, megoldásban differenciál egyenletek stb.;

    ha szükséges, számítsa ki a függvények értékeit a figyelembe vett intervallum közbenső pontjain;

    egy folyamat jellemző mennyiségeinek a figyelembe vett intervallumon kívüli értékeinek meghatározásakor, különösen az előrejelzés során.

Ha egy táblázat által meghatározott folyamat modellezéséhez olyan függvényt konstruálunk, amely megközelítőleg írja le ezt a folyamatot a legkisebb négyzetek módszere alapján, akkor azt közelítő függvénynek (regresszió), magát a közelítő függvények létrehozásának feladatát pedig ún. közelítési probléma.

Ez a cikk az MS Excel csomag ilyen jellegű problémák megoldására vonatkozó képességeit tárgyalja, emellett módszereket és technikákat ad táblázatos regressziók létrehozására (létrehozására). meghatározott funkciókat(ami a regresszióanalízis alapja).

Az Excel két lehetőséget kínál a regressziók létrehozására.

    Kiválasztott regressziók (trendvonalak) hozzáadása a vizsgált folyamatjellemző adattáblázata alapján felépített diagramhoz (csak diagram elkészítése esetén érhető el);

    Az Excel munkalap beépített statisztikai funkcióinak felhasználása, amely lehetővé teszi a regressziók (trendvonalak) lekérését közvetlenül a forrásadattáblázatból.

Trendvonalak hozzáadása a diagramhoz

Egy folyamatot leíró és diagrammal ábrázolt adattáblázathoz az Excel hatékony regresszióelemző eszközzel rendelkezik, amely lehetővé teszi:

    építsünk a legkisebb négyzetek módszere alapján, és adjunk hozzá ötféle regressziót a diagramhoz, amelyek változó pontossággal modellezik a vizsgált folyamatot;

    add hozzá a diagramhoz a megszerkesztett regressziós egyenletet;

    határozza meg, hogy a kiválasztott regresszió milyen mértékben felel meg a diagramon megjelenített adatoknak.

A diagramadatok alapján az Excel lehetővé teszi lineáris, polinomiális, logaritmikus, hatványos, exponenciális típusú regressziók lekérését, amelyeket a következő egyenlet határoz meg:

y = y(x)

ahol x egy független változó, amely gyakran veszi fel a természetes számok sorozatának értékeit (1; 2; 3; ...), és például visszaszámlálja a vizsgált folyamat idejét (karakterisztika).

1 . A lineáris regresszió jó olyan jellemzők modellezésére, amelyek értéke állandó sebességgel nő vagy csökken. Ez a legegyszerűbb modell a vizsgált folyamathoz. Az egyenletnek megfelelően épül fel:

y = mx + b

ahol m a lineáris regressziós meredekség érintője az x tengelyhez; b - a lineáris regresszió metszéspontjának koordinátája az ordináta tengellyel.

2 . A polinomiális trendvonal hasznos olyan jellemzők leírására, amelyeknek több különálló szélsőségük van (maximum és minimum). A polinomiális fokozat megválasztását a vizsgált jellemző szélsőértékeinek száma határozza meg. Így egy másodfokú polinom jól leírhat egy olyan folyamatot, amelynek csak egy maximuma vagy minimuma van; a harmadik fokú polinom - legfeljebb két szélsőség; a negyedik fokú polinom - legfeljebb három szélsőség stb.

Ebben az esetben a trendvonalat a következő egyenlet szerint kell megszerkeszteni:

y = c0 + c1x + c2x2 + c3x3 + c4x4 + c5x5 + c6x6

ahol a c0, c1, c2,...c6 együtthatók olyan állandók, amelyek értékeit az építés során határozzák meg.

3 . A logaritmikus trendvonalat sikeresen alkalmazzák olyan jellemzők modellezésekor, amelyek értékei kezdetben gyorsan változnak, majd fokozatosan stabilizálódnak.

y = c ln(x) + b

4 . A hatványtörvény trendvonal jó eredményeket ad, ha a vizsgált kapcsolat értékeit a növekedési ütem állandó változása jellemzi. Ilyen függőségre példa az autó egyenletesen gyorsított mozgásának grafikonja. Ha az adatok nulla vagy negatív értékeket tartalmaznak, nem használhat teljesítménytrend vonalat.

Az egyenlet szerint készült:

y = c xb

ahol a b, c együtthatók állandók.

5 . Exponenciális trendvonalat kell használni, ha az adatok változási üteme folyamatosan növekszik. A nulla vagy negatív értékeket tartalmazó adatok esetében ez a fajta közelítés szintén nem alkalmazható.

Az egyenlet szerint készült:

y = c ebx

ahol a b, c együtthatók állandók.

Trendvonal kiválasztásakor az Excel automatikusan kiszámítja az R2 értékét, ami a közelítés megbízhatóságát jellemzi: minél közelebb van az R2 érték az egységhez, a trendvonal annál megbízhatóbban közelíti meg a vizsgált folyamatot. Szükség esetén az R2 értéke mindig megjeleníthető a diagramon.

A képlet határozza meg:

Trendvonal hozzáadása adatsorhoz:

    aktiváljon egy diagramot egy adatsor alapján, azaz kattintson a diagram területen belülre. A Diagram elem megjelenik a főmenüben;

    erre az elemre kattintva egy menü jelenik meg a képernyőn, amelyben a Trendvonal hozzáadása parancsot kell kiválasztani.

Ugyanezek a műveletek egyszerűen végrehajthatók, ha az egérmutatót az egyik adatsornak megfelelő grafikon fölé mozgatjuk, és jobb egérgombbal kattintunk; A megjelenő helyi menüben válassza a Trendvonal hozzáadása parancsot. Megjelenik a képernyőn a Trendline párbeszédpanel a Típus fül megnyitásával (1. ábra).

Ezek után szüksége van:

Válassza a Típus lapon szükséges típus trendvonalak (alapértelmezés szerint a lineáris típus van kiválasztva). A Polinom típushoz a Fok mezőben adja meg a kiválasztott polinom fokszámát.

1 . A Beépített sorozat mezőben a kérdéses diagram összes adatsora látható. Ha trendvonalat szeretne hozzáadni egy adott adatsorhoz, válassza ki a nevét a sorozatra épített mezőben.

Ha szükséges, a Paraméterek fülre lépve (2. ábra) a következő paramétereket állíthatja be a trendvonalhoz:

    módosítsa a trendvonal nevét a Közelítő (simított) görbe neve mezőben.

    állítsa be az előrejelzés periódusainak számát (előre vagy hátra) az Előrejelzés mezőben;

    jelenítse meg a trendvonal egyenletét a diagram területén, amelyhez engedélyeznie kell az egyenlet megjelenítése a diagramon jelölőnégyzetet;

    jelenítse meg az R2 közelítési megbízhatósági értéket a diagram területén, amelyhez engedélyeznie kell a Közelítési megbízhatósági érték elhelyezése a diagramon (R^2) jelölőnégyzetet;

    állítsa be a trendvonal metszéspontját az Y tengellyel, amelynél engedélyeznie kell a görbe Y tengellyel való metszéspontját egy pontban;

    Kattintson az OK gombra a párbeszédpanel bezárásához.

A már megrajzolt trendvonal szerkesztésének megkezdéséhez három módszer áll rendelkezésre:

    használja a Kijelölt trendvonal parancsot a Formátum menüben, miután előzőleg kiválasztotta a trendvonalat;

    válasszuk a helyi menüből a Trendvonal formázása parancsot, amely a trendvonalra jobb gombbal kattintva hívható elő;

    kattintson duplán a trendvonalra.

A képernyőn megjelenik a Trend Line Format párbeszédablak (3. ábra), amely három fület tartalmaz: Nézet, Típus, Paraméterek, és az utolsó kettő tartalma teljesen egybeesik a Trend Line párbeszédpanel hasonló füleivel (1. ábra). -2). A Nézet lapon beállíthatja a vonal típusát, színét és vastagságát.

Egy már megrajzolt trendvonal törléséhez válassza ki a törölni kívánt trendvonalat, és nyomja meg a Delete gombot.

A vizsgált regresszióelemző eszköz előnyei a következők:

    a trendvonal felépítésének viszonylagos egyszerűsége a diagramokon anélkül, hogy adattáblázatot készítene hozzá;

    a javasolt trendvonalak típusainak meglehetősen széles listája, és ez a lista tartalmazza a leggyakrabban használt regressziós típusokat;

    a vizsgált folyamat viselkedésének előrejelzésének képessége tetszőleges (a józan ész határain belül) előre és hátra lépéssel;

    a trendvonal-egyenlet analitikus formában való megszerzésének képessége;

    szükség esetén a közelítés megbízhatóságának értékelésének lehetősége.

A hátrányok közé tartoznak a következők:

    trendvonal felépítésére csak akkor kerül sor, ha van egy adatsorra épített diagram;

    a vizsgált karakterisztikára vonatkozó adatsorok generálásának folyamata a rá kapott trendvonal-egyenletek alapján kissé zsúfolt: a szükséges regressziós egyenletek az eredeti adatsor értékeinek minden változásával frissülnek, de csak a diagram területén belül , míg adatsorok, a régi trendvonal egyenlet alapján generált változatlan marad;

    A kimutatásdiagram jelentésekben a diagram vagy a kapcsolódó kimutatás nézetének módosítása nem őrzi meg a meglévő trendvonalakat, ami azt jelenti, hogy mielőtt trendvonalakat rajzolna vagy más módon formázna egy kimutatásdiagramot, meg kell győződnie arról, hogy a jelentés elrendezése megfelel a szükséges követelményeknek.

A trendvonalak a diagramokon, például grafikonon, hisztogramon, lapos, nem szabványosított területdiagramon, oszlopdiagramon, szóródási diagramon, buborékdiagramon és részvénydiagramon bemutatott adatsorok kiegészítésére használhatók.

Nem adhat trendvonalakat adatsorokhoz 3D, normalizált, radar-, kör- és fánkdiagramokban.

Az Excel beépített funkcióinak használata

Az Excel egy regressziós elemző eszközzel is rendelkezik a diagram területén kívüli trendvonalak ábrázolásához. Számos statisztikai munkalapfüggvény használható erre a célra, de mindegyik csak lineáris vagy exponenciális regressziók létrehozását teszi lehetővé.

Az Excel számos funkcióval rendelkezik a lineáris regresszió létrehozásához, különösen:

    IRÁNYZAT;

  • SLOPE és VÁGÁS.

Valamint számos funkció egy exponenciális trendvonal felépítéséhez, különösen:

    LGRFPRIBL.

Meg kell jegyezni, hogy a TREND és a GROWTH függvények segítségével történő regressziók létrehozásának technikái szinte azonosak. Ugyanez mondható el a LINEST és az LGRFPRIBL funkciópárról is. Ehhez a négy függvényhez az értéktáblázat létrehozása Excel-funkciókat, például tömbképleteket használ, ami némileg megzavarja a regressziók létrehozásának folyamatát. Vegyük észre azt is, hogy a lineáris regresszió felépítése véleményünk szerint a legegyszerűbben a SLOPE és INTERCEPT függvényekkel valósítható meg, ahol az első a lineáris regresszió meredekségét, a második pedig azt a szakaszt, amelyet a regresszió elfog. az y tengely.

A regressziós elemzéshez beépített függvényeszköz előnyei a következők:

    egy meglehetősen egyszerű, egységes folyamat a vizsgált jellemző adatsorainak előállítására az összes trendvonalat meghatározó beépített statisztikai függvényhez;

    szabványos módszertan generált adatsorok alapján trendvonalak felépítésére;

    a vizsgált folyamat viselkedésének előrejelzésének képessége szükséges mennyiség előre vagy hátra lép.

A hátrányok közé tartozik, hogy az Excel nem rendelkezik beépített függvényekkel más (a lineáris és exponenciális) típusú trendvonalak létrehozására. Ez a körülmény gyakran nem teszi lehetővé a vizsgált folyamat kellően pontos modelljének kiválasztását, valamint a valósághoz közeli előrejelzések készítését. Ezenkívül a TREND és a GROWTH függvények használatakor a trendvonalak egyenlete nem ismert.

Megjegyzendő, hogy a szerzők nem tűzték ki célul a regresszióanalízis menetének teljes körű bemutatását. Fő feladata, hogy konkrét példákon keresztül bemutassa az Excel csomag képességeit közelítési feladatok megoldása során; bemutatni, milyen hatékony eszközei vannak az Excelnek a regressziók felépítéséhez és az előrejelzésekhez; szemléltesse, hogyan lehet viszonylag könnyen megoldani az ilyen problémákat még olyan felhasználó számára is, aki nem rendelkezik széles körű ismeretekkel a regressziós elemzésről.

Példák konkrét problémák megoldására

Nézzük meg konkrét problémák megoldását a felsorolt ​​Excel eszközök segítségével.

1. probléma

Gépjármű-közlekedési vállalkozás 1995-2002. évi nyereségének adattáblázatával. a következőket kell tenned:

    Készítsen diagramot.

    Lineáris és polinomiális (négyzetes és köbös) trendvonalak hozzáadása a diagramhoz.

    A trendvonal-egyenletek segítségével táblázatos adatokat kapjon a vállalati nyereségről az 1995-2004 közötti időszak minden egyes trendvonalához.

    Készítsen előrejelzést a vállalkozás nyereségére vonatkozóan 2003-ra és 2004-re.

A probléma megoldása

    Az Excel munkalap A4:C11 celláinak tartományába írja be az ábrán látható munkalapot. 4.

    A B4:C11 cellák tartományának kiválasztása után diagramot készítünk.

    Aktiváljuk a megszerkesztett diagramot, és a fent leírt módszer szerint a Trend Line párbeszédpanelen a trendvonal típusának kiválasztása után (lásd 1. ábra) felváltva lineáris, másodfokú és köbös trendvonalakat adunk a diagramhoz. Ugyanebben a párbeszédablakban nyissa meg a Paraméterek lapot (lásd 2. ábra), a Közelítő (simított) görbe neve mezőbe írja be a hozzáadandó trend nevét, és az Előrejelzés előre: időszakokra mezőben állítsa be a értéke 2, mivel a tervek szerint két évre előrejelzést készítenek. A regressziós egyenlet és az R2 közelítés megbízhatósági értékének diagramterületen való megjelenítéséhez engedélyezze az egyenlet megjelenítése a képernyőn jelölőnégyzeteket, és helyezze el a közelítés megbízhatósági értékét (R^2) a diagramon. A jobb vizuális érzékelés érdekében megváltoztatjuk a megszerkesztett trendvonalak típusát, színét és vastagságát, melyhez a Trend Line Format párbeszédpanel Nézet fülét használjuk (lásd 3. ábra). Az eredményül kapott diagram a hozzáadott trendvonalakkal az ábrán látható. 5.

    Táblázatos adatok beszerzése a vállalati nyereségről az 1995-2004 közötti trendvonalakon. Használjuk az ábrán bemutatott trendvonal-egyenleteket. 5. Ehhez a D3:F3 tartomány celláiba írjon be szöveges információkat a kiválasztott trendvonal típusáról: Lineáris trend, Kvadratikus trend, Köbtrend. Ezután írja be a lineáris regressziós képletet a D4 cellába, és a kitöltési marker segítségével másolja ezt a képletet a D5:D13 cellatartomány relatív hivatkozásaival. Meg kell jegyezni, hogy a D4:D13 cellatartományból származó lineáris regressziós képletű cellák argumentumaként egy megfelelő cellát tartalmaznak az A4:A13 tartományból. Hasonlóképpen, másodfokú regresszió esetén töltse ki az E4:E13, köbös regresszió esetén pedig az F4:F13 cellatartományt. Így elkészült a vállalkozás 2003. és 2004. évi nyereségére vonatkozó előrejelzés. három irányzatot használva. Az így kapott értéktáblázat az ábrán látható. 6.

2. probléma

    Készítsen diagramot.

    Adjon hozzá logaritmikus, hatványos és exponenciális trendvonalakat a diagramhoz.

    Vezesse le a kapott trendvonalak egyenleteit, valamint mindegyikre az R2 közelítés megbízhatósági értékeit.

    A trendvonal-egyenletek segítségével táblázatos adatokat kapjon a vállalat nyereségéről az 1995-2002 közötti időszak minden egyes trendvonalához.

    Készítsen előrejelzést a vállalat nyereségéről 2003-ra és 2004-re ezen trendvonalak segítségével.

A probléma megoldása

Az 1. feladat megoldásánál megadott módszertant követve egy diagramot kapunk, amelyhez hozzáadjuk a logaritmikus, hatvány- és exponenciális trendvonalakat (7. ábra). Ezután a kapott trendvonal-egyenletek felhasználásával kitöltjük a vállalkozás nyereségének értéktáblázatát, amely tartalmazza a 2003-as és 2004-es előrejelzett értékeket. (8. ábra).

ábrán. 5. és 3. ábra. látható, hogy a logaritmikus trendű modell a legalacsonyabb közelítési megbízhatóság értéknek felel meg

R2 = 0,8659

Az R2 legmagasabb értékei polinomiális trenddel rendelkező modelleknek felelnek meg: másodfokú (R2 = 0,9263) és köbös (R2 = 0,933).

3. probléma

Az 1. feladatban megadott, egy gépjármű-közlekedési vállalkozás 1995-2002. évi nyereségére vonatkozó adattáblázattal a következő lépéseket kell végrehajtania.

    Szerezzen adatsorokat a lineáris és exponenciális trendvonalakhoz a TREND és a GROW függvények segítségével.

    A TREND és GROWTH függvények segítségével készítsen előrejelzést a vállalkozás 2003. és 2004. évi nyereségére vonatkozóan.

    Készítsen diagramot az eredeti adatokhoz és a kapott adatsorokhoz!

A probléma megoldása

Használjuk a munkalapot az 1. feladathoz (lásd 4. ábra). Kezdjük azzal TREND függvények:

    válassza ki a D4:D11 cellák tartományát, amelyet fel kell tölteni a TREND függvény értékeivel, amelyek megfelelnek a vállalkozás nyereségére vonatkozó ismert adatoknak;

    Hívja a Funkció parancsot a Beszúrás menüből. A megjelenő Funkcióvarázsló párbeszédpanelen válassza ki a TREND függvényt a Statisztikai kategóriából, majd kattintson az OK gombra. Ugyanez a művelet elvégezhető a szabványos eszköztár (Funkció beszúrása) gombjára kattintva.

    A megjelenő Függvényargumentumok párbeszédpanelen írja be a C4:C11 cellatartományt az Ismert_értékek_y mezőbe; az Ismert_értékek_x mezőben - a B4:B11 cellatartomány;

    Ha a beírt képletből tömbképletet szeretne készíteni, használja a + + billentyűkombinációt.

A képletsorba beírt képlet így fog kinézni: =(TREND(C4:C11,B4:B11)).

Ennek eredményeként a D4:D11 cellák tartománya megtelik a TREND funkció megfelelő értékeivel (9. ábra).

A vállalkozás nyereségének előrejelzése 2003-ra és 2004-re. szükséges:

    válassza ki a D12:D13 cellák tartományát, ahol a TREND függvény által előre jelzett értékek kerülnek beírásra.

    hívja meg a TREND függvényt, és a megjelenő Függvényargumentumok párbeszédpanelen írja be a Known_values_y mezőbe - a C4:C11 cellatartományt; az Ismert_értékek_x mezőben - a B4:B11 cellatartomány; az Új_értékek_x mezőben pedig a B12:B13 cellatartomány.

    a kombináció segítségével ezt a képletet tömbképletté alakítjuk Ctrl billentyűk+ Shift + Enter.

    A beírt képlet így fog kinézni: =(TREND(C4:C11;B4:B11;B12:B13)), és a D12:D13 cellák tartománya ki lesz töltve a TREND függvény előrejelzett értékeivel (lásd az ábrát). 9).

Az adatsort hasonlóan töltjük ki a GROWTH függvénnyel, amely a nemlineáris függőségek elemzésére szolgál, és pontosan ugyanúgy működik, mint a TREND lineáris megfelelője.

A 10. ábra a táblázatot képlet megjelenítési módban mutatja.

A kiinduló adatokhoz és a kapott adatsorokhoz az ábrán látható diagram. tizenegy.

4. probléma

A gépjárművek diszpécserszolgálata által a tárgyhó 1-től 11-ig terjedő időszakra vonatkozó szolgáltatási igények beérkezésének adattáblázatával a következő műveleteket kell végrehajtania.

    Adatsorok lekérése lineáris regresszióhoz: a SLOPE és INTERCEPT függvények használatával; a LINEST funkció használatával.

    Szerezzen be egy adatsort az exponenciális regresszióhoz az LGRFPRIBL függvény segítségével.

    A fenti funkciók segítségével készítsen előrejelzést a diszpécserszolgálathoz történő jelentkezések beérkezéséről a tárgyhó 12-től 14-ig terjedő időszakra.

    Készítsen diagramot az eredeti és a kapott adatsorokhoz!

A probléma megoldása

Vegye figyelembe, hogy a TREND és GROWTH függvényekkel ellentétben a fent felsorolt ​​függvények (SLOPE, INTERCEPT, LINEST, LGRFPRIB) egyike sem regresszió. Ezek a függvények csak támogató szerepet játszanak, meghatározzák a szükséges regressziós paramétereket.

A SLOPE, INTERCEPT, LINEST, LGRFPRIB függvényekkel felépített lineáris és exponenciális regresszióknál az egyenleteik megjelenése mindig ismert, ellentétben a TREND és GROWTH függvényeknek megfelelő lineáris és exponenciális regressziókkal.

1 . Készítsünk lineáris regressziót a következő egyenlettel:

y = mx+b

a SLOPE és INTERCEPT függvények használatával, az m regressziós meredekséget a SLOPE függvény, a b szabad tagot pedig az INTERCEPT függvény határozza meg.

Ennek érdekében a következő műveleteket hajtjuk végre:

    írja be az eredeti táblázatot az A4:B14 cellatartományba;

    az m paraméter értéke a C19 cellában lesz meghatározva. Válassza ki a Slope függvényt a Statisztikai kategóriából; írja be a B4:B14 cellatartományt az ismert_értékek_y mezőbe és az A4:A14 cellák tartományát az ismert_értékek_x mezőbe. A képlet a C19 cellába kerül: =SLOPE(B4:B14,A4:A14);

    Hasonló technikával határozzuk meg a b paraméter értékét a D19 cellában. A tartalma pedig így fog kinézni: =SEGMENT(B4:B14,A4:A14). Így a lineáris regresszió felépítéséhez szükséges m és b paraméterek értékei a C19, D19 cellákban lesznek tárolva;

    Ezután írja be a lineáris regressziós képletet a C4 cellába a következő formában: =$C*A4+$D. Ebben a képletben a C19 és D19 cellák abszolút hivatkozásokkal vannak írva (a cella címe nem változhat az esetleges másolás során). A $ abszolút referenciajel beírható a billentyűzetről vagy az F4 billentyűvel, miután a kurzort a cellacímre helyeztük. A kitöltő fogantyú segítségével másolja ezt a képletet a C4:C17 cellatartományba. Megkapjuk a szükséges adatsorokat (12. ábra). Tekintettel arra, hogy a kérések száma egész szám, a Cellaformátum ablak Szám lapján a tizedesjegyek számának formátumát 0-ra kell állítani.

2 . Most építsünk fel egy lineáris regressziót, amelyet az egyenlet ad meg:

y = mx+b

a LINEST funkció használatával.

Ezért:

    Írja be a LINEST függvényt tömbképletként a C20:D20: =(LINEST(B4:B14,A4:A14) cellatartományba. Ennek eredményeként megkapjuk az m paraméter értékét a C20 cellában, és a b paraméter értékét a D20 cellában;

    írja be a képletet a D4 cellába: =$C*A4+$D;

    másolja ezt a képletet a kitöltési marker segítségével a D4:D17 cellatartományba, és kapja meg a kívánt adatsort.

3 . Építünk egy exponenciális regressziót a következő egyenlettel:

az LGRFPRIBL funkciót használva a művelet hasonlóan történik:

    A C21:D21 cellatartományban tömbképletként beírjuk az LGRFPRIBL függvényt: =( LGRFPRIBL (B4:B14,A4:A14)). Ebben az esetben az m paraméter értéke a C21 cellában, a b paraméter értéke pedig a D21 cellában kerül meghatározásra;

    a képlet az E4 cellába kerül: =$D*$C^A4;

    a kitöltési marker segítségével ezt a képletet az E4:E17 cellatartományba másoljuk, ahol az exponenciális regresszió adatsorai lesznek (lásd 12. ábra).

ábrán. A 13. ábra egy táblázatot mutat, ahol láthatjuk az általunk a szükséges cellatartományokkal használt függvényeket, valamint képleteket.

Nagyságrend R 2 hívott determinációs együttható.

A regressziós függés megalkotásának feladata, hogy megtaláljuk az (1) modell m együtthatóinak azt a vektorát, amelynél az R együttható felveszi a maximális értéket.

Az R szignifikanciájának értékelésére Fisher-féle F-tesztet használnak, amelyet a képlet alapján számítanak ki

Ahol n- mintanagyság (kísérletek száma);

k a modell együtthatók száma.

Ha F túllép az adatok valamelyik kritikus értékén nÉs kés az elfogadott megbízhatósági valószínűséget, akkor R értéke szignifikánsnak tekinthető. Az F kritikus értékeinek táblázatait a matematikai statisztika referenciakönyvei tartalmazzák.

Így az R jelentőségét nemcsak az értéke határozza meg, hanem a kísérletek számának és a modell együtthatóinak (paramétereinek) számának aránya is. Valójában a korrelációs arány n=2 esetén egy egyszerű lineáris modell esetén 1 (egyetlen egyenes mindig húzható egy síkon 2 ponton keresztül). Ha azonban a kísérleti adatok véletlen változók, akkor az R ilyen értékében nagy körültekintéssel kell megbízni. Általában a szignifikáns R és megbízható regresszió elérése érdekében arra törekednek, hogy a kísérletek száma jelentősen meghaladja a modell együtthatók számát (n>k).

Lineáris regressziós modell felépítéséhez a következőkre lesz szüksége:

1) készítsen egy listát n sorból és m oszlopból, amelyek kísérleti adatokat tartalmaznak (a kimeneti értéket tartalmazó oszlop Y elsőnek vagy utolsónak kell lennie a listán); Vegyük például az előző feladat adatait, adjunk hozzá egy „Időszakszám” nevű oszlopot, számozzuk meg a periódusszámokat 1-től 12-ig. (ezek lesznek az értékek x)

2) lépjen az Adatok/Adatelemzés/Regresszió menübe

Ha az "Eszközök" menüből hiányzik az "Adatelemzés" pont, akkor ugyanebben a menüben lépjen a "Kiegészítők" menüpontra, és jelölje be az "Elemzési csomag" jelölőnégyzetet.

3) a "Regresszió" párbeszédpanelen állítsa be:

· Y beviteli intervallum;

· X beviteli intervallum;

· kimeneti intervallum - annak az intervallumnak a bal felső cellája, amelybe a számítási eredmények kerülnek (ajánlott új munkalapon elhelyezni);

4) kattintson az "Ok" gombra, és elemezze az eredményeket.

Tetszett a cikk? Oszd meg