Felső megbízhatósági határ. A gyakoriságok és arányok konfidencia intervallumai. Konfidenciaintervallum felépítése

A konfidenciaintervallum kiszámítása a megfelelő paraméter átlagos hibáján alapul. Megbízhatósági intervallum megmutatja, hogy (1-a) valószínűséggel milyen határok között van a becsült paraméter valódi értéke. Itt a a szignifikancia szint, (1-a) megbízhatósági valószínűségnek is nevezik.

Az első fejezetben megmutattuk, hogy például a számtani átlag esetében a valódi sokaság átlaga az esetek 95%-ában az átlag 2 standard hibáján belül van. Így az átlag 95%-os konfidenciaintervallumának határait a minta átlagától az átlag kétszeres hibája választja el, azaz. az átlag átlagos hibáját megszorozzuk egy bizonyos együtthatóval a konfidenciaszinttől függően. Az átlagok átlagához és különbségéhez a Student-féle együtthatót (a Student-próba kritikus értéke), a részesedések részarányára és különbségére a z kritérium kritikus értékét vesszük. Az együttható és az átlagos hiba szorzatát egy adott paraméter maximális hibájának nevezhetjük, azaz. az értékeléskor elérhetõ maximum.

Bizalmi intervallum ehhez számtani átlaga : .

Itt van a minta átlaga;

A számtani közép középhibája;

s – minta szórása;

n

f = n-1 (Diák együtthatója).

Bizalmi intervallum ehhez a számtani átlagok különbségei :

Itt van a különbség a minta átlagai között;

- a számtani átlagok különbségének átlagos hibája;

s 1, s 2 – minta szórása;

n1, n2

A Student-próba kritikus értéke egy adott a szignifikanciaszintre és a szabadságfokok számára f=n 1 + n 2-2 (Diák együtthatója).

Bizalmi intervallum ehhez megoszt :

.

Itt d a mintafrakció;

– átlagos tört hiba;

n– mintanagyság (csoportlétszám);

Bizalmi intervallum ehhez részvények különbsége :

Itt van a különbség a mintarészesedésekben;

– a számtani átlagok különbségének átlagos hibája;

n1, n2– mintanagyság (csoportok száma);

A z kritérium kritikus értéke egy adott szignifikanciaszinten a ( , , ).

A mutatók közötti különbség konfidenciaintervallumainak kiszámításával először is közvetlenül látjuk a hatás lehetséges értékeit, és nem csak a pontbecslését. Másodsorban következtetést vonhatunk le a nullhipotézis elfogadásáról vagy elutasításáról, harmadszor pedig a teszt erejéről.

A hipotézisek megbízhatósági intervallumokkal történő tesztelésekor be kell tartani következő szabály:

Ha az átlagkülönbség 100(1-a) százalékos konfidencia intervalluma nem tartalmaz nullát, akkor a különbségek statisztikailag szignifikánsak az a szignifikancia szinten; ellenkezőleg, ha ez az intervallum nullát tartalmaz, akkor a különbségek statisztikailag nem szignifikánsak.

Valójában, ha ez az intervallum nullát tartalmaz, az azt jelenti, hogy az összehasonlított mutató az egyik csoportban lehet nagyobb vagy kisebb a másikhoz képest, azaz. a megfigyelt eltérések a véletlennek köszönhetők.

A teszt erejét a nulla helye alapján lehet megítélni a konfidenciaintervallumon belül. Ha a nulla közel van az intervallum alsó vagy felső határához, akkor lehetséges, hogy nagyobb számú csoport összehasonlítása esetén a különbségek statisztikailag szignifikánsak lennének. Ha a nulla az intervallum közepe közelében van, akkor ez azt jelenti, hogy a kísérleti csoportban a mutató növekedése és csökkenése egyaránt valószínű, és valószínűleg tényleg nincsenek különbségek.

Példák:

Összehasonlítva a műtéti mortalitást két különböző típusú érzéstelenítés esetén: az első típusú érzéstelenítéssel 61 főt operáltak, 8-an meghaltak, a második típussal 67 fő, 10-en haltak meg.

d1 = 8/61 = 0,131; d2 = 10/67 = 0,149; d1-d2 = -0,018.

Az összehasonlított módszerek letalitásbeli különbsége (-0,018 - 0,122; -0,018 + 0,122) vagy (-0,14; 0,104) 100(1-a) = 95%-os valószínűséggel. Az intervallum nullát tartalmaz, azaz. hipotézis ugyanarról a letalitásról kettőben különböző típusok Az érzéstelenítést nem lehet elutasítani.

Így a halálozási arány 14%-ra csökkenhet és fog is csökkenni, és 95%-os valószínűséggel 10,4%-ra nő, azaz. a nulla megközelítőleg az intervallum közepén van, tehát vitatható, hogy nagy valószínűséggel ez a két módszer valóban nem különbözik a letalitásban.

A korábban tárgyalt példában a koppintási teszt alatti átlagos préselési időt négy, vizsgapontszámban eltérő tanulócsoportban hasonlították össze. Számítsuk ki a 2. és 5. osztályzattal vizsgázott tanulók átlagos préselési idejének konfidenciaintervallumát, valamint ezen átlagok közötti különbség konfidenciaintervallumát.

A Student-féle együtthatókat a Student-féle eloszlási táblázatok segítségével találjuk meg (lásd a mellékletet): az első csoportnál: = t(0,05;48) = 2,011; a második csoportnál: = t(0,05;61) = 2,000. Így az első csoport konfidenciaintervallumai: = (162,19-2,011*2,18; 162,19+2,011*2,18) = (157,8; 166,6), a második csoportban (156,55-2,000*1,88; 156,0,8 = 1,8,5*1,2,8) 160,3). Tehát a 2-vel sikeresen vizsgázóknál az átlagos nyomási idő 157,8 ms és 166,6 ms között mozog 95%-os valószínűséggel, az 5-tel vizsgázóknál 152,8 ms és 160,3 ms között 95%-os valószínűséggel .

A nullhipotézist az átlagok konfidenciaintervallumainak használatával is tesztelheti, nem csak az átlagok különbségére. Például, mint esetünkben, ha az átlagok konfidencia intervallumai átfedik egymást, akkor a nullhipotézist nem lehet elvetni. Egy hipotézis egy kiválasztott szignifikanciaszinten történő elutasításához a megfelelő konfidenciaintervallumok nem fedhetik át egymást.

Határozzuk meg az átlagos préselési idő különbségének konfidencia intervallumát a 2. és 5. osztályzattal vizsgázott csoportokban. Átlagok különbsége: 162,19 – 156,55 = 5,64. Student-féle együttható: = t(0,05;49+62-2) = t(0,05;109) = 1,982. A csoport szórása egyenlő lesz: ; . Kiszámítjuk az átlagok különbségének átlagos hibáját: . Konfidenciaintervallum: =(5,64-1,982*2,87; 5,64+1,982*2,87) = (-0,044; 11,33).

Tehát az átlagos préselési idő különbsége a 2-vel és 5-tel sikeresen vizsgázó csoportokban -0,044 ms és 11,33 ms közötti tartományba esik. Ez az intervallum magában foglalja a nullát, azaz. A jól vizsgázók átlagos préselési ideje vagy nőhet, vagy csökkenhet a nem kielégítően vizsgázókhoz képest, pl. a nullhipotézist nem lehet elvetni. De a nulla nagyon közel van az alsó határhoz, a préselési idő pedig sokkal inkább csökken a jól passzolóknál. Ebből arra következtethetünk, hogy a 2-es és az 5-ösök között továbbra is vannak különbségek a préselési átlagidőben, csak az átlagidő változása, az átlagidő elterjedése és a mintanagyságok miatt nem tudtuk kimutatni ezeket.

A teszt ereje egy hibás nullhipotézis elutasításának valószínűsége, azaz. különbségeket találni ott, ahol valójában léteznek.

A teszt erejét a szignifikancia szintje, a csoportok közötti különbségek nagysága, az értékek csoportonkénti eloszlása ​​és a minták nagysága alapján határozzuk meg.

Student-féle t-próbához és varianciaanalízishez érzékenységi diagramok használhatók.

A kritérium hatványa felhasználható az előzetes meghatározásban szükséges szám csoportok.

A konfidencia intervallum megmutatja, hogy adott valószínűség mellett a becsült paraméter valódi értéke mely határokon belül van.

A konfidenciaintervallumok segítségével statisztikai hipotéziseket tesztelhet, és következtetéseket vonhat le a kritériumok érzékenységére vonatkozóan.

IRODALOM.

Glanz S. – 6. fejezet,7.

Rebrova O.Yu. – 112-114., 171-173., 234-238.

Sidorenko E.V. – 32-33.

Kérdések a tanulók önellenőrzéséhez.

1. Mekkora a kritérium ereje?

2. Milyen esetekben szükséges a kritériumok erejét értékelni?

3. A teljesítmény számítási módszerei.

6. Hogyan tesztelhetünk statisztikai hipotézist konfidenciaintervallum segítségével?

7. Mi mondható el a kritérium erejéről a konfidenciaintervallum számításakor?

Feladatok.

Az előző alfejezetekben egy ismeretlen paraméter becslésének kérdésével foglalkoztunk A egy szám. Ezt nevezik „pont” becslésnek. Számos feladatnál nem csak a paramétert kell megkeresnie A megfelelő számérték, hanem annak pontosságának és megbízhatóságának értékelése is. Tudnia kell, hogy egy paraméter cseréje milyen hibákhoz vezethet A pontbecslését Aés milyen fokú biztonsággal számíthatunk arra, hogy ezek a hibák nem lépik túl az ismert határokat?

Az ilyen jellegű problémák különösen fontosak kis számú megfigyelés esetén, amikor a pontbecslést és be nagyrészt véletlenszerű, és az a hozzávetőleges helyettesítése a-val súlyos hibákhoz vezethet.

Képet adni a becslés pontosságáról és megbízhatóságáról A,

A matematikai statisztikában úgynevezett konfidenciaintervallumokat és konfidenciavalószínűségeket használnak.

Legyen a paraméter A tapasztalatból nyert elfogulatlan becslés A. Ebben az esetben szeretnénk megbecsülni a lehetséges hibát. Adjunk hozzá elég nagy p valószínűséget (például p = 0,9, 0,95 vagy 0,99), hogy egy p valószínűségű esemény gyakorlatilag megbízhatónak tekinthető, és keressünk egy s értéket, amelyre

Ezután a csere során fellépő hiba gyakorlatilag lehetséges értékeinek tartománya A tovább A, ± s lesz; Az abszolút értékben mért nagy hibák csak kis valószínűséggel jelennek meg a = 1 - p. Írjuk át (14.3.1) így:

Az egyenlőség (14.3.2) azt jelenti, hogy p valószínűséggel a paraméter ismeretlen értéke A intervallumba esik

Meg kell jegyezni egy körülményt. Korábban többször is figyelembe vettük annak a valószínűségét, hogy egy valószínűségi változó egy adott nem véletlenszerű intervallumba esik. Itt más a helyzet: a nagyságrend A nem véletlen, de a / p intervallum véletlenszerű. Helyzete az x tengelyen véletlenszerű, a középpontja határozza meg A; Általában a 2s intervallum hossza is véletlenszerű, mivel az s értékét általában kísérleti adatokból számítjuk. Ezért ebben az esetben jobb, ha a p értéket nem a pont „eltalálásának” valószínűségeként értelmezzük. A a / p intervallumban, és annak valószínűségeként, hogy egy / p véletlenszerű intervallum lefedi a pontot A(14.3.1. ábra).

Rizs. 14.3.1

A p valószínűséget általában ún megbízhatósági valószínűség, és intervallum / p - megbízhatósági intervallum. Intervallumhatárok Ha. a x = a- s és a 2 = a +és hívják bizalom határai.

Adjunk egy másik értelmezést a konfidenciaintervallum fogalmának: tekinthető paraméterértékek intervallumának A, kompatibilis a kísérleti adatokkal, és nem mond ellent azoknak. Valóban, ha egyetértünk abban, hogy egy a = 1-p valószínűségű eseményt gyakorlatilag lehetetlennek tekintünk, akkor az a paraméter azon értékei, amelyekre a - a> s ellentmondó kísérleti adatoknak kell tekinteni, és azokat, amelyeknél |a - A a t na 2 .

Legyen a paraméter A van egy elfogulatlan becslés A. Ha ismernénk a mennyiség eloszlásának törvényét A, a konfidenciaintervallum megtalálásának feladata nagyon egyszerű lenne: elég lenne egy olyan s értéket találni, amelyre

A nehézséget az jelenti, hogy a becslések eloszlásának törvénye A a mennyiség eloszlási törvényétől függ x következésképpen az ismeretlen paraméterein (különösen magán a paraméteren A).

Ennek a nehézségnek a megkerülésére használhatja a következő nagyjából közelítő technikát: cserélje ki az s kifejezésben szereplő ismeretlen paramétereket a pontbecsléseikre. Viszonylag sok kísérlettel P(kb. 20...30) ez a technika általában kielégítő eredményt ad a pontosság szempontjából.

Példaként tekintsük a matematikai elvárás konfidenciaintervallumának problémáját.

Hagyd előállítani P X, amelynek jellemzői a matematikai elvárás Tés variancia D- ismeretlen. A következő becsléseket kaptuk ezekre a paraméterekre:

A matematikai elvárás p konfidenciavalószínűségének megfelelő / p konfidenciaintervallumot kell alkotni T mennyiségeket X.

A probléma megoldásánál azt fogjuk használni, hogy a mennyiség T az összeget jelenti P független, azonos eloszlású valószínűségi változók Xhés a centrális határértéktétel szerint egy kellően nagy P eloszlási törvénye közel áll a normálishoz. A gyakorlatban még viszonylag kis számú tag (kb. 10...20) esetén is megközelítőleg normálisnak tekinthető az összeg eloszlási törvénye. Feltételezzük, hogy az érték T a normál törvény szerint osztják el. Ennek a törvénynek a jellemzői - a matematikai elvárás és a variancia - egyenlőek, ill TÉs

(lásd a 13. fejezet 13.3. alpontját). Tegyük fel, hogy az érték D tudunk és találunk olyan Ep értéket, amelyre

A 6. fejezet (6.3.5) képletével a (14.3.5) bal oldalán lévő valószínűséget a normális eloszlási függvényen keresztül fejezzük ki

ahol a becslés szórása T.

Az Eq.

keresse meg Sp értékét:

ahol arg Ф* (х) a Ф* inverz függvénye (X), azok. az argumentum olyan értéke, amelyre a normális eloszlásfüggvény egyenlő X.

Diszperzió D, amelyen keresztül a mennyiség kifejeződik A 1P, nem tudjuk pontosan; hozzávetőleges értékeként használhatja a becslést D(14.3.4) és körülbelül:

Így a konfidenciaintervallum felépítésének problémája megközelítőleg megoldódott, ami egyenlő:

ahol a gp-t a (14.3.7) képlet határozza meg.

A fordított interpoláció elkerülése érdekében az Ф* (l) függvény táblázataiban az s p kiszámításakor célszerű egy speciális táblázatot összeállítani (14.3.1. táblázat), amely megadja a mennyiség értékeit.

attól függően, hogy r. A (p érték a normáltörvényhez határozza meg a szórások számát, amelyeket a szórás középpontjától jobbra és balra kell ábrázolni, hogy a kapott területre való bejutás valószínűsége egyenlő legyen p-vel.

7 p értékén keresztül a konfidencia intervallum a következőképpen fejeződik ki:

14.3.1. táblázat

1. példa A mennyiséggel 20 kísérletet végeztünk X; az eredmények a táblázatban láthatók. 14.3.2.

14.3.2. táblázat

A mennyiség matematikai elvárására becslést kell találni a -ból xés a p = 0,8 konfidenciavalószínűségnek megfelelő konfidenciaintervallumot készítsünk.

Megoldás. Nekünk van:

Az l: = 10 referenciapontot választva a harmadik képlet (14.2.14) segítségével megkapjuk a torzítatlan becslést D :

táblázat szerint 14.3.1 találjuk

Bizalom határai:

Megbízhatósági intervallum:

Paraméterértékek T, Az ebben az intervallumban fekvő értékek kompatibilisek a táblázatban megadott kísérleti adatokkal. 14.3.2.

A variancia konfidenciaintervallumát hasonló módon lehet megszerkeszteni.

Hagyd előállítani P független kísérletek egy valószínűségi változón x ismeretlen paraméterekkel mind az A-ra, mind a diszperzióra vonatkozóan D elfogulatlan becslést kaptunk:

Közelítőleg meg kell alkotni a variancia konfidencia intervallumát.

A (14.3.11) képletből jól látható, hogy a mennyiség D képviseli

összeg P alak valószínűségi változói . Ezek az értékek nem

független, hiszen bármelyik tartalmazza a mennyiséget T, mindenki mástól függ. Azonban kimutatható, hogy a növekvő Pösszegük eloszlási törvénye is megközelíti a normált. Majdnem at P= 20...30 már normálisnak tekinthető.

Tegyük fel, hogy ez így van, és keressük meg ennek a törvénynek a jellemzőit: a matematikai elvárást és a diszperziót. Az értékelés óta D- akkor elfogulatlan M[D] = D.

Variancia számítás D D viszonylag bonyolult számításokhoz kapcsolódik, ezért a kifejezését levezetés nélkül mutatjuk be:

ahol q 4 a nagyság negyedik központi momentuma X.

A kifejezés használatához be kell cserélnie az értékeket\u003d 4 és D(legalábbis közeliek). Ahelyett D használhatod az értékelését D. Elvileg a negyedik központi momentum helyettesíthető egy becsléssel is, például a következő alakzat értékével:

de egy ilyen csere rendkívül alacsony pontosságot ad, mivel általában korlátozott számú kísérlet mellett a nagyfokú nyomatékokat nagy hibákkal határozzák meg. A gyakorlatban azonban gyakran előfordul, hogy a mennyiségi eloszlási törvény típusa x előre ismert: csak a paraméterei ismeretlenek. Ezután megpróbálhatja μ 4-en keresztül kifejezni D.

Vegyük a leggyakoribb esetet, amikor az érték x a normál törvény szerint osztják el. Ekkor negyedik központi momentumát szórással fejezzük ki (lásd a 6. fejezet 6.2. alfejezetét);

és a (14.3.12) képlet megadja vagy

Az ismeretlen cseréje a (14.3.14)-ben Dértékelését D, kapjuk: honnan

A μ 4 nyomaték keresztül fejezhető ki D más esetekben is, amikor az érték eloszlását x nem normális, de a megjelenése ismert. Például az egyenletes sűrűség törvényéhez (lásd az 5. fejezetet) a következőket kapjuk:

ahol (a, P) az az intervallum, amelyen a törvény megadásra kerül.

Ennélfogva,

A (14.3.12) képlet segítségével megkapjuk: hol találjuk hozzávetőlegesen

Azokban az esetekben, amikor a 26-os mennyiségre vonatkozó eloszlási törvény típusa ismeretlen, az a/) érték közelítő becslésekor továbbra is javasolt a (14.3.16) képlet használata, kivéve, ha különleges okunk van feltételezni, hogy ez a törvény nagyon eltér a normáltól (észrevehető pozitív vagy negatív kurtózisa van).

Ha így vagy úgy megkapjuk az a/) közelítő értéket, akkor a variancia konfidenciaintervallumát ugyanúgy megszerkeszthetjük, mint ahogy azt a matematikai elváráshoz építettük:

ahol az adott p valószínűségtől függő értéket találjuk a táblázat szerint. 14.3.1.

2. példa Keressen körülbelül 80%-os konfidencia intervallumot egy valószínűségi változó varianciájához x az 1. példa feltételei szerint, ha ismert, hogy az érték x a normálishoz közeli törvény szerint elosztva.

Megoldás. Az érték ugyanaz marad, mint a táblázatban. 14.3.1:

A (14.3.16) képlet szerint

A (14.3.18) képlet segítségével megtaláljuk a konfidencia intervallumot:

A szórások megfelelő tartománya: (0,21; 0,29).

14.4. Pontos módszerek megbízhatósági intervallumok felépítésére egy normális törvény szerint eloszló valószínűségi változó paramétereihez

Az előző alfejezetben nagyjából közelítő módszereket vizsgáltunk a matematikai elvárások és variancia konfidenciaintervallumok felépítésére. Itt adunk egy ötletet ugyanazon probléma megoldásának pontos módszereiről. Hangsúlyozzuk, hogy a konfidenciaintervallumok pontos megtalálásához feltétlenül szükséges előre ismerni a mennyiség eloszlási törvényének alakját. X, míg közelítő módszerek alkalmazásához ez nem szükséges.

A megbízhatósági intervallumok felépítésére szolgáló pontos módszerek ötlete a következőkben rejlik. Bármely konfidenciaintervallumot egy olyan feltételből találunk, amely kifejezi bizonyos egyenlőtlenségek teljesülésének valószínűségét, amelyek magukban foglalják a minket érdeklő becslést A. Az értékelési eloszlás törvénye Aáltalános esetben a mennyiség ismeretlen paramétereitől függ X. Néha azonban lehetséges az egyenlőtlenségek átadása egy valószínűségi változóból A a megfigyelt értékek valamilyen más függvényéhez X p X 2, ..., X o. amelynek eloszlási törvénye nem ismeretlen paraméterektől, hanem csak a kísérletek számától és a mennyiség eloszlási törvényétől függ X. Az ilyen típusú valószínűségi változók fontos szerepet játszanak a matematikai statisztikában; legrészletesebben a mennyiség normális eloszlásának esetére tanulmányozták őket X.

Például bebizonyosodott, hogy az érték normál eloszlásával x véletlenszerű érték

engedelmeskedik az ún Diákelosztási törvény Val vel P- 1 szabadságfok; ennek a törvénynek a sűrűsége a formája

ahol G(x) az ismert gammafüggvény:

Az is bebizonyosodott, hogy a valószínűségi változó

"%2 disztribúcióval" rendelkezik P- 1 szabadságfok (lásd 7. fejezet), melynek sűrűségét a képlet fejezi ki

Anélkül, hogy a (14.4.2) és (14.4.4) eloszlások származtatásain foglalkoznánk, bemutatjuk, hogyan alkalmazhatók ezek a paraméterek konfidenciaintervallumának felépítésekor. ty D.

Hagyd előállítani P független kísérletek egy valószínűségi változón X, normál eloszlású, ismeretlen paraméterekkel NAK NEK. Ezekre a paraméterekre becsléseket kaptunk

Konfidenciaintervallumot kell alkotni mindkét paraméterhez, amelyek megfelelnek a p konfidenciavalószínűségnek.

Először alkossunk meg egy konfidenciaintervallumot a matematikai elváráshoz. Természetes, hogy ezt az intervallumot szimmetrikusan vesszük a -hoz képest T; jelölje s p az intervallum hosszának felét. Az s p értéket úgy kell megválasztani, hogy a feltétel teljesüljön

Próbáljunk meg a (14.4.5) egyenlőség bal oldalán mozogni a valószínűségi változóból T valószínűségi változóhoz T, a Student törvénye szerint terjesztik. Ehhez szorozzuk meg az |m-w?| egyenlőtlenség mindkét oldalát

pozitív értékkel: vagy a jelöléssel (14.4.1),

Keressünk egy olyan / p számot, hogy a / p értéke megtalálható legyen a feltételből

A (14.4.2) képletből világos, hogy (1) páros függvény, ezért (14.4.8) megadja

Az egyenlőség (14.4.9) határozza meg a / p értéket p függvényében. Ha rendelkezésére áll egy integrál értékek táblázata

akkor a /p értéke fordított interpolációval megtalálható a táblázatban. Kényelmesebb azonban előre elkészíteni a /p értékek táblázatát. Egy ilyen táblázatot a Függelék (5. táblázat) tartalmaz. Ez a táblázat a p konfidenciaszinttől és a szabadságfokok számától függő értékeket mutatja P- 1. Miután meghatározta a / p-t a táblázatból. 5 és feltételezve

megtaláljuk a / p konfidenciaintervallum szélességének felét és magát az intervallumot

1. példa 5 független kísérletet végeztünk egy valószínűségi változón X, normál eloszlású, ismeretlen paraméterekkel Tés róla. A kísérletek eredményeit a táblázat tartalmazza. 14.4.1.

14.4.1. táblázat

Értékelés keresése T a matematikai elvárásra, és konstruáljon rá egy 90%-os / p konfidenciaintervallumot (azaz a p = 0,9 konfidenciavalószínűségnek megfelelő intervallumot).

Megoldás. Nekünk van:

iránti kérelem 5. táblázata szerint P - 1 = 4 és p = 0,9 azt találjuk ahol

A konfidencia intervallum az lesz

2. példa A 14.3. alszakasz 1. példájának feltételeire, az értéket feltételezve x normál eloszlású, keresse meg a pontos konfidenciaintervallumot.

Megoldás. A függelék 5. táblázata szerint azt találjuk, hogy mikor P - 1 = 19ir =

0,8/p=1,328; innen

A 14.3. alfejezet 1. példájának megoldásával (e p = 0,072) összehasonlítva meggyőződésünk, hogy az eltérés nagyon jelentéktelen. Ha megtartjuk a pontosságot a második tizedesjegyig, akkor a pontos és közelítő módszerrel talált konfidencia intervallumok egybeesnek:

Folytassuk a variancia konfidenciaintervallumának felépítését. Tekintsük az elfogulatlan varianciabecslőt

és fejezzük ki a valószínűségi változót D nagyságrenden keresztül V(14.4.3), amelynek eloszlása ​​x 2 (14.4.4):

A mennyiségeloszlás törvényének ismerete V, megkeresheti az /(1) intervallumot, amelybe adott p valószínűséggel esik.

Az elosztás törvénye kn_x(v) Az I 7 magnitúdó alakja az ábrán látható. 14.4.1.

Rizs. 14.4.1

Felmerül a kérdés: hogyan válasszuk ki a / p intervallumot? Ha a nagyságeloszlás törvénye V szimmetrikus volt (mint a normál törvény vagy a Student-eloszlás), természetes lenne a /p intervallumot szimmetrikusnak venni a matematikai elvárásokhoz képest. Ebben az esetben a törvény k p_x (v) aszimmetrikus. Állapodjunk meg, hogy a /p intervallumot úgy választjuk meg, hogy az érték valószínűsége legyen V az intervallumon túl jobbra és balra (a 14.4.1. ábrán árnyékolt területek) azonosak és egyenlőek

Egy /p intervallum létrehozásához ezzel a tulajdonsággal a táblázatot használjuk. 4 alkalmazás: számokat tartalmaz y) oly módon, hogy

az értékért V, x 2 -eloszlású r szabadságfokkal. A mi esetünkben r = n- 1. Javítsuk ki r = n- 1, és keresse meg a táblázat megfelelő sorában. 4 két jelentése x 2 - az egyik a valószínűségnek megfelelő a másik - valószínűség Jelöljük ezeket

értékeket 2-korÉs xl? Az intervallum rendelkezik y 2, baljával, és y ~ jobb vége.

Most keressük meg a /p intervallumból a kívánt /| konfidenciaintervallumot a D határú diszperzióhoz, és D2, amely lefedi a lényeget D p valószínűséggel:

Szerkesszünk egy / (, = (?> ь А) intervallumot, amely lefedi a pontot D akkor és csak akkor, ha az érték V az /r intervallumba esik. Mutassuk meg, hogy az intervallum

megfelel ennek a feltételnek. Valóban, az egyenlőtlenségek egyenlőtlenségekkel egyenértékűek

és ezeket az egyenlőtlenségeket p valószínűséggel elégítjük ki. Így a variancia konfidencia intervallumát megtaláltuk, és a (14.4.13) képlettel fejezzük ki.

3. példa. Keresse meg a variancia konfidenciaintervallumát a 14.3. alfejezet 2. példájában szereplő feltételek mellett, ha ismert, hogy az érték x normál eloszlású.

Megoldás. Nekünk van . melléklet 4. táblázata szerint

címen találjuk r = n - 1 = 19

A (14.4.13) képlet segítségével megtaláljuk a variancia konfidencia intervallumát

A szóráshoz tartozó megfelelő intervallum (0,21; 0,32). Ez az intervallum csak kis mértékben haladja meg a 14.3. alfejezet 2. példájában a közelítő módszerrel kapott intervallumot (0,21; 0,29).

  • A 14.3.1. ábra az a körül szimmetrikus konfidenciaintervallumot tekint. Általában, mint később látni fogjuk, erre nincs szükség.

Konfidenciaintervallum a matematikai elvárásokhoz - ez egy olyan adatokból számított intervallum, amely ismert valószínűséggel tartalmazza a teljes sokaság matematikai elvárását. A matematikai elvárás természetes becslése a megfigyelt értékeinek számtani átlaga. Ezért a leckében az „átlag” és az „átlagérték” kifejezéseket fogjuk használni. A konfidenciaintervallum kiszámításának problémáinál a leggyakrabban a következő válaszra van szükség: „Az átlag [érték egy adott problémában] konfidenciaintervalluma [kisebb érték] és [nagyobb érték] között van. A konfidenciaintervallum segítségével nemcsak az átlagértékeket, hanem az általános sokaság egy adott jellemzőjének arányát is értékelheti. A leckében az átlagértékeket, a szórást, a szórást és a hibát, amelyek révén új definíciókhoz és képletekhez jutunk, tárgyaljuk. A minta és a sokaság jellemzői .

Az átlag pont- és intervallumbecslései

Ha a sokaság átlagértékét egy számmal (ponttal) becsüljük meg, akkor a megfigyelések mintájából számolt fajlagos átlagot veszünk a sokaság ismeretlen átlagértékének becsléseként. Ebben az esetben a mintaátlag értéke - egy valószínűségi változó - nem esik egybe az általános sokaság átlagértékével. Ezért a mintaátlag megadásakor egyidejűleg a mintavételi hibát is jelezni kell. A mintavételi hiba mértéke a standard hiba, amelyet az átlaggal azonos mértékegységekben adnak meg. Ezért gyakran használják a következő jelölést: .

Ha az átlag becslését bizonyos valószínűséggel kell társítani, akkor a sokaságban érdekelt paramétert nem egyetlen számként, hanem intervallumként kell megbecsülni. A konfidenciaintervallum egy olyan intervallum, amelyben bizonyos valószínűséggel P az általános sokaság becsült mutatójának értéke található. Konfidenciaintervallum, amelyben valószínű P = 1 - α a valószínűségi változót a következőképpen számítjuk ki:

,

α = 1 - P, amely szinte minden statisztikai témájú könyv mellékletében megtalálható.

A gyakorlatban a sokaság átlaga és variancia nem ismert, ezért a sokaság szórását a minta szórása, a sokaság átlagát pedig a minta átlaga helyettesíti. Így a legtöbb esetben a konfidenciaintervallumot a következőképpen számítják ki:

.

A konfidenciaintervallum képlete használható a sokaság átlagának becslésére, ha

  • ismert a sokaság szórása;
  • vagy a sokaság szórása nem ismert, de a minta mérete nagyobb, mint 30.

A minta átlaga a sokaság átlagának elfogulatlan becslése. Viszont a minta szórása nem a populáció varianciájának elfogulatlan becslése. A minta varianciaképletében a sokaság szórásának elfogulatlan becsléséhez a minta mérete n-re kell cserélni n-1.

1. példa Egy adott város 100 véletlenszerűen kiválasztott kávézójából gyűjtöttük azt az információt, hogy bennük az alkalmazottak átlagos létszáma 10,5 fő, 4,6-os szórással. Határozza meg a 95%-os konfidencia intervallumot a kávézói alkalmazottak számához.

ahol a szignifikanciaszint standard normális eloszlásának kritikus értéke α = 0,05 .

Így a 95%-os konfidenciaintervallum a kávézók átlagos létszámára vonatkozóan 9,6 és 11,4 között mozgott.

2. példa 64 megfigyelésből álló véletlenszerű minta esetén a következő összértékeket számítottuk ki:

értékek összege a megfigyelésekben,

az értékek átlagtól való eltérésének négyzetes összege .

Számítsa ki a matematikai elvárás 95%-os konfidencia intervallumát!

Számítsuk ki a szórást:

,

Számítsuk ki az átlagértéket:

.

Az értékeket behelyettesítjük a konfidenciaintervallum kifejezésébe:

ahol a szignifikanciaszint standard normális eloszlásának kritikus értéke α = 0,05 .

Kapunk:

Így ennek a mintának a matematikai várakozásának 95%-os konfidencia intervalluma 7,484 és 11,266 között volt.

3. példa 100 megfigyelésből álló véletlenszerű populációs minta esetén a számított átlag 15,2, a szórás pedig 3,2. Számítsa ki a várható érték 95%-os, majd a 99%-os konfidencia intervallumát. Ha a minta teljesítménye és variációja változatlan marad, és a konfidencia együttható növekszik, szűkül vagy szélesedik a konfidenciaintervallum?

Ezeket az értékeket behelyettesítjük a konfidenciaintervallum kifejezésébe:

ahol a szignifikanciaszint standard normális eloszlásának kritikus értéke α = 0,05 .

Kapunk:

.

Így ennek a mintának a 95%-os konfidencia intervalluma 14,57 és 15,82 között volt.

Ezeket az értékeket ismét behelyettesítjük a konfidenciaintervallum kifejezésébe:

ahol a szignifikanciaszint standard normális eloszlásának kritikus értéke α = 0,01 .

Kapunk:

.

Így ennek a mintának a 99%-os konfidencia intervalluma 14,37 és 16,02 között volt.

Amint látjuk, a konfidencia együttható növekedésével a standard normális eloszlás kritikus értéke is növekszik, és ennek következtében az intervallum kezdő- és végpontja távolabb helyezkedik el az átlagtól, így a matematikai elvárás konfidencia intervalluma nő. .

A fajsúly ​​pont- és intervallumbecslése

Valamelyik mintaattribútum részesedése a részesedés pontbecsléseként értelmezhető p ugyanaz a jellemző az általános populációban. Ha ezt az értéket valószínűséggel kell társítani, akkor a fajsúly ​​konfidencia intervallumát kell kiszámítani p valószínűséggel jellemző a populációban P = 1 - α :

.

4. példa Egyes városokban két jelölt van AÉs B indul a polgármesteri tisztségért. Véletlenszerűen 200 városlakót kérdeztek meg, akiknek 46%-a azt válaszolta, hogy a jelöltre szavazna A, 26% - a jelöltnek B 28%-uk pedig nem tudja, kire fog szavazni. Határozza meg a jelöltet támogató városlakók arányának 95%-os konfidencia intervallumát! A.

Nélkülözhetetlen és kényelmes módszereket kínálnak különféle statisztikai számításokhoz és elemzésekhez. Az egyik ilyen jellemző a konfidencia intervallum, amely a vizsgálattal kapcsolatos bizonytalanság mértékének kifejezésére szolgál. Az excel megbízhatósági intervallumai az események értékelését jelentik a valószínűségek ellenőrzésével kombinálva. Megadják a minta arányának vagy a minta átlagának valószínű tartományát a sokaságban talált valós aránytól/átlagtól, és a következőképpen jelennek meg: becslés +/- hibahatár.

Minden felmérésben vagy tanulmányban a konfidenciaintervallumok nagyszerű módja annak, hogy megértsük a mintavételi hibák szerepét az átlagos százalékokban. Bármely felmérés esetében, mivel a kutatók mindig csak egy arányt néznek egy nagyobb számból, bizonytalanság van a becsléseikben, ami mintavételi hibákat okoz.

A konfidencia intervallum (CI) képet ad arról, hogy egy érték mennyire ingadozhat. Olyan értékek tartományát képviseli, amelyek egyformán az ismert mintaátlag középpontjában állnak. Minél magasabb a konfidenciaszint (százalékban), minél kisebb az intervallum, annál pontosabbak lesznek az eredmények. Nagyobb variabilitású vagy nagyobb szórással rendelkező minták vizsgálata szélesebb konfidencia intervallumokat generál az Excelben.

A CI és a mintaméret között fordított négyzetgyök kapcsolat van. A kisebb méretek szélesebb CI-ket generálnak, így a pontosabb becslések eléréséhez vagy a hibaküszöb felére csökkentéséhez a minta méretét körülbelül megnégyszerezi.

A populációs átlag megalkotása

A sokaság átlagának, a megadott valószínűségnek és a minta méretének konfidenciaintervallumának összeállításához az Excel BIZTONSÁGI függvényét kell használnia, amely a normál eloszlást használja a megbízhatósági érték kiszámításához. Tegyük fel, hogy a kutatók véletlenszerűen kiválasztottak 100 embert, megmérték a súlyukat, és az átlagot 76 kg-nak találták. Ha meg akarja tudni az emberek átlagát egy adott városban, nem valószínű, hogy egy nagyobb csoportban is ugyanaz lesz az átlag, mint a mindössze 100 fős mintában.

Sokkal valószínűbb, hogy a 76 kg-os mintaátlag megközelítőleg megegyezik az (ismeretlen) populációs átlaggal, és tudni kell, mennyire pontos a becsült válasz. Ezt a becslési intervallumokhoz kapcsolódó bizonytalanságot megbízhatósági szintnek nevezzük, általában 95%. A CONFIDENCE (alpha, sigma, n) függvény a sokaság átlagának CI-jének összeállításához használt értéket adja vissza. Feltételezzük, hogy a mintaadatok standard normál eloszlást követnek ismert szórás szigmával, és a minta mérete n. Mielőtt kiszámítaná a konfidenciaintervallumot Excelben a 95%-os szinthez, vegye az alfát 1 - 0,95 = 0,05 értékre.

CONFIDENCE függvényformátumok

A CONFIDENCE vagy TRUST függvényt a megbízhatósági határok határozzák meg – ezek a CI alsó és felső határai, és 95%-os mutatók. Például egy preferencia-vizsgálatban az emberek 70%-a preferálja a Borjomit a Pepsihez képest 3%-os CI-vel és 95%-os megbízhatósági szinttel, akkor 95%-os esély van arra, hogy a valódi arány 67 és 73 között van. %.

A TRUST függvények különböző szintaxis alatt jelennek meg az Excel különböző verzióiban. Például az Excel 2010 két funkcióval rendelkezik: CONFIDENCE NORM és CONFIDENCE T, amelyek segítenek a szélesség kiszámításában, ha a mérés szórása ismert. Ellenkező esetben a "CONFIDENCE.T" kerül alkalmazásra, az értékelés a mintaadatokon alapul. Az Excel megbízhatósági intervallumai 2010-ig csak a "CONFIDENCE" funkcióval rendelkeztek. Érvei és eredményei hasonlóak voltak a CONFIDENCE NORM függvényéhez.

Az előbbi továbbra is elérhető az Excel későbbi verzióiban a kompatibilitás biztosítása érdekében. #NUM! Hiba – Akkor fordul elő, ha az alfa kisebb vagy egyenlő, mint 0, vagy nagyobb vagy egyenlő, mint 0. Az adott szórás kisebb vagy egyenlő, mint 0. A megadott argumentumméret kisebb, mint egy. #ÁR! Hiba – Akkor fordul elő, ha a megadott argumentumok bármelyike ​​nem numerikus.

"Bízni fog." statisztikai függvények szerint osztályozzák, és kiszámítja és visszaadja az átlag CI-jét. Az excel bizalmi intervallumai rendkívül hasznosak lehetnek pénzügyi elemzés. Elemzőként: "TRUST". a pénzügyi döntéshozatal optimalizálásával sokféle célra segíti az előrejelzéseket és a kiigazításokat. Ez az adatok grafikus megjelenítésével történik változókészletben.

Az elemzők többet is elfogadhatnak hatékony megoldások a normál eloszlás által szolgáltatott statisztikai információk alapján. Például kapcsolatot találhatnak a kapott bevétel és a luxuscikkekre fordított kiadások között. A sokaság átlagának CI-jének kiszámításához a visszaadott megbízhatósági értéket hozzá kell adni a minta átlagához, és ki kell vonni belőle. Például egy minta átlaga x: Megbízhatósági intervallum = x ± BIZTONSÁG.

Példa egy megbízhatósági intervallum kiszámítására Excelben - tegyük fel, hogy a következő adatokat kapjuk:

  1. Szignifikancia szint: 0,05.
  2. Populáció szórása: 2.5.
  3. Mintaméret: 100.

Az Excel konfidenciaintervallum-függvénye a 0,05-ös CI-érték (azaz 95%-os konfidenciaszint) kiszámítására szolgál a 100 főre jutó irodai ingázási idők vizsgálatához szükséges átlagos mintaidőre vonatkozóan. A minta átlaga 30 perc, a szórás pedig 2,5 perc. A konfidencia intervallum 30 ± 0,48999, ami a 29,510009 és 30,48999 (perc) tartománynak felel meg.

Intervallumok és normál eloszlás

A konfidenciaintervallum legismertebb használata a "hibahatár" jelentése. A közvélemény-kutatások hibahatára plusz-mínusz 3%. A DI-k olyan esetekben hasznosak, amelyek túlmutatnak ezen az egyszerű helyzeten. Használhatók nem normál eloszlásokkal, amelyek erősen ferdeek. A megbízhatósági intervallum előrejelzésének kiszámításához Excelben a következő építőelemekre van szükség:

  1. Átlagos érték.
  2. A megfigyelések szórása.
  3. A mintában lévő felmérések száma.
  4. A DI-re alkalmazandó megbízhatósági szint.

Mielőtt egy konfidenciaintervallumot szerkesztene Excelben, tanulmányozza azt a mintaátlag körül, és kezdje azzal, hogy eldöntse, hogy a többi mintaátlag hány százalékát fogadják el, ha ebben az intervallumban gyűjtik és számítják ki őket. Ha ez a helyzet, akkor a lehetséges minták 95%-át a minta feletti és alatti 1,96 szórással rendelkező CI-k rögzítik.

Az átlag standard hibája

A ráhagyás vagy a bizonytalanság nem veszi figyelembe a mérési hibát vagy a felmérés torzítását, így a tényleges bizonytalanság magasabb lehet a megadottnál. Mielőtt az Excelben konfidenciaintervallumot számítana ki, a számítást jó adatgyűjtéssel, megbízható mérési rendszerekkel és kielégítő felmérési tervvel kell alátámasztani.

Az átlag konfidencia intervallumait többféleképpen is meg lehet szerezni: SigmaXL, leíró statisztikák, hisztogramok, 1 alakú t-próba és konfidenciaintervallumok, egyirányú ANOVA és Multi-Vari diagramok segítségével. Az elégedettségi átlag CI grafikus ábrázolásához hozzon létre egy Multi-Vari diagramot (95%-os CI Mean Opciókkal) a Customer Data.xls adatok felhasználásával. A pontok egyedi adatoknak felelnek meg. A markerek a maximális 99%-os és az átlagos 95%-os megbízhatósági határt jelzik.

A hipotézisvizsgálatot mostantól az elégedettségi pontszámok pontosabb átlagolására és az eredmények meghatározására használják majd.

A megbízhatósági intervallumok nagyon fontosak az adatok megértéséhez és a velük kapcsolatos döntések meghozatalához. A CI egy diszkrét arányhoz való kiszámításához használja a SigmaXL > Sablonok és számológépek > Alapvető statisztikai sablonok > 1 intervallum menüpontot, mielőtt megkeresné a konfidenciaintervallumot az Excelben. a következő műveleteket:

  1. Nyissa meg a Client Data.xls fájlt.
  2. Nyomja meg az 1. munkalap fület vagy az F4 billentyűt az utolsó munkalap aktiválásához. Kattintson a SigmaXL > Statisztikai eszközök > Leíró statisztikák elemre.
  3. Jelölje be a „Teljes adattábla használata” jelölőnégyzetet.
  4. Kattintson a "Tovább" gombra.
  5. Válassza az Általános elégedettség lehetőséget, majd kattintson a Numerikus adatváltozók (Y) elemre.
  6. Válassza az „Ügyféltípus” lehetőséget, majd kattintson a „Csoportkategória” (X1) elemre. Az alapértelmezett megbízhatósági szint 95%.
  7. Kattintson az "OK" gombra.

Vegye figyelembe, hogy a 95%-os konfidenciaintervallum azt jelenti: átlagosan a valódi populációs paraméter (átlag, szórás vagy arány) 20-ból 19-szer lesz ebben az intervallumban. . Átlagérték (95% CI). 95%-os konfidencia intervallum a szóráshoz (a Sigma 95%-os CI-je – nem tévesztendő össze a Sigma Process minőségi szintjével).

Statisztikák és megbízhatósági szintek

A konfidenciaintervallum nem olyan szám, amelyben egy paraméter valódi értéke pontosan megtalálható. Valójában egy valószínűségi változó elméletileg felvehet minden lehetséges értéket a fizika törvényein belül. A konfidenciaintervallum lényegében az a régió, amelyben egy populációban vizsgált paraméter valódi (ismeretlen) értéke a választott valószínűséggel a legnagyobb valószínűséggel igaz. Használatakor az intervallum a megbízhatósági küszöb, a hiba és a biztonsági tényező számításán alapul.

Mielőtt meghatározna egy konfidenciaintervallumot az Excelben, meghatározzuk ezeket az elemeket, amelyek a paraméterektől függenek:

  1. A mért jellemzők változékonysága.
  2. Mintaméret: minél nagyobb, annál több nagy pontosság.
  3. Bizalmi szint - s.

A bizalom szintje garantált bizonyosságot jelent. Például 90%-os megbízhatósági szint mellett ez azt jelenti, hogy 10%-os a tévedés kockázata. Általában jó gyakorlat a 95%-os megbízhatósági szint kiválasztása. Így a maximális megbízhatósági szint nagyobb, mint nagyobb méretű minták. A fedezeti mutató közvetlenül a bizalmi küszöbből származó mutató. A táblázatban található néhány példa a leggyakoribb értékekre.

Bizalmi szint s

Határegyüttható n> 30-hoz

Amikor meg kell becsülni egy sokaság átlagértékét a mintájából, egy konfidenciaintervallumot kell meghatározni. Ez a minta méretétől és a változó törvényétől függ. A konfidenciaintervallum kiszámításának képlete az Excelben a következő:

  1. Az intervallum alsó határa = átlagos futásteljesítmény - mező együtthatója * standard hiba.
  2. Felső tartomány határértéke = becsült átlag + mező együttható * standard hiba.
  3. A t értéke a minta méretétől függ: n > 30: a normál biztonsági tényező, z. n<30: коэффициент запаса, называемый t для n-1.

Ebben a helyzetben a megfelelő mértékegységek maguk is átlagértékek. A szórást a kutatónak nem az eredeti és az egyedi megfigyelésektől, hanem az azokból számított átlagoktól kell tudnia. Ennek az eltérésnek neve van - az átlag standard hibája.

Az adatok variabilitásának ábrázolásait grafikonokon használják a mérés hibáinak vagy bizonytalanságának jelzésére. Általános képet adnak arról, hogy egy mérés mennyire pontos, vagy éppen ellenkezőleg, milyen messze van a jelentett valódi értéktől, és hibasávként jelennek meg. Ezek a bizonytalanság egy szórását, egy standard hibát vagy egy meghatározott konfidenciaintervallumot (például 95%-os intervallumot) képviselnek. Ezek a mennyiségek nem azonosak, ezért a választott mértéket fel kell tüntetni a grafikonon vagy a szövegben.

Ha statisztikailag szignifikáns feltételek teljesülnek, a hibasávok két mennyiség összehasonlítására használhatók. A hibasorok jelzik a függvény illeszkedésének elfogadhatóságát, vagyis azt, hogy mennyire írja le jól az adatokat. A kísérleti tudományokkal foglalkozó kutatások minden grafikonon tartalmaznak hibákat, bár a gyakorlat némileg változik, és minden kutatónak megvan a saját hibastílusa.

A hibasávok közvetlen manipulációs interfészként használhatók valószínűségi algoritmusok irányításához közelítő számításokhoz. A hibasávok plusz- vagy mínuszjellel (±) is kifejezhetők. A plusz a felső, a mínusz pedig a hiba alsó határa.

A CI helyes meghatározásához vannak online számológépek, amelyek nagyban leegyszerűsítik a munkát. A meghatározási folyamat az adatok kiválasztásával kezdődik. Ez minden kutatás alapja. A megbízható mintavétel segít önbizalommal hozni üzleti döntéseket. Az első megoldásra váró kérdés a célcsoport helyes meghatározása. Ha a kutató ezen a csoporton kívüli emberekkel végez felmérést, lehetetlen a feladat sikeres végrehajtása. A következő lépés annak eldöntése, hogy hány emberrel kell interjút készítenie.

A szakértők tudják, hogy egy kicsi, reprezentatív minta annak a csoportnak a véleményét és viselkedését tükrözi, amelyből a mintát választották. Minél nagyobb a minta, annál pontosabban reprezentálja a célcsoportot. A pontosság javulásának mértéke azonban csökken a minta méretének növekedésével. Például 250-ről 1000-re növelve a pontosság megduplázódik. Döntse el a minta méretét olyan tényezők alapján, mint a rendelkezésre álló idő, a költségvetés és a szükséges pontosság mértéke.

Három tényező határozza meg a CI méretét ehhez a megbízhatósági szinthez:

  • minta nagysága;
  • minta százalékos aránya;
  • népesség.

Ha a felmérésben résztvevők 99%-a "igen"-t, 1%-a pedig "nem"-et mondott, a hiba valószínűsége kicsi, függetlenül a minta méretétől. Ha azonban a százalékos arány 51% és 49%, akkor sokkal nagyobb a hibalehetőség. Az extrém válaszokban könnyebb magabiztosnak lenni, mint az átlagosban. Egy adott pontossági szinthez szükséges mintanagyság meghatározásakor a legrosszabb eset százalékos arányát (50%) kell használni.

Az alábbiakban az online mintaméret-kalkulátor képlete található a konfidenciaintervallum kiszámításához Excelben.

A konfidenciaintervallum-számítások feltételezik, hogy a releváns sokaságból valódi véletlenszerű minta van. Hacsak a felmérés nem véletlenszerű, az intervallumokra nem lehet támaszkodni. A nem véletlenszerű minták általában az eljárás hibáiból származnak.

Vonaldiagramok készítése

A megbízhatósági intervallum diagram elkészítése az Excelben viszonylag egyszerű. Először készítse el saját vonaldiagramját. Ezután a kijelölt sor mellett válassza a Diagrameszközök > Elrendezés > Hibapanel > Speciális panelbeállítások menüpontot. A megjelenő előugró menüből választhat pozitív vagy negatív hibasávokat, vagy mindkettőt. Kiválaszthat egy stílust, és kiválaszthatja a megjeleníteni kívánt mennyiséget. Ez lehet fix érték, százalék, szórás vagy egyéni tartomány.

Ha az adatok alapértelmezett szórása minden ponthoz tartozik, válasszon egy egyénit, és kattintson az Érték meghatározása gombra. Ezután egy másik előugró menü jelenik meg, és kiválaszthat egy cellatartományt a pozitív és negatív panelekhez egyaránt.

  1. Készítse elő az adatokat. Először is, az átlagon kívül ki kell számítania a szórást (vagy hibát).
  2. Ezután a 4. sorban ki kell számolni a csoport felső határát, azaz B4 esetén a számítás a következő lesz: =B2+B3 Az 5. sorban a tartomány alsó határát kell kiszámítani, azaz B5 esetén a számítás a következő lesz: : =B2-B4
  3. Hozzon létre egy diagramot. Jelölje ki a táblázat 1., 2., 4. és 5. sorát, majd kattintson a Beszúrás > Grafikon > Vonaldiagram elemre. Az Excel vonaldiagramot hoz létre.
  4. Távolítsa el a jelmagyarázatot és a rácsvonalakat.
  5. Ezután kattintson a jobb gombbal a felső tartomány csoportjára, és válassza a Diagramtípus módosítása lehetőséget.
  6. Formátum megbízhatósági tartományok. A diagram befejezéséhez egyszerűen formázza a felső sorozatot világoskék kitöltéssel (a kék vonalnak megfelelően), az alsó sorozatot pedig fehér kitöltéssel.

Könnyű látni a hibahatárokat ezen a diagramon, de ha sok az adat, akkor zsúfoltnak tűnik. Első pillantásra a megbízhatósági határ sokkal nyilvánvalóbb a minta átlagát tekintve, és a minták számának növekedésével egyre szigorúbb lesz.

A véletlenszerű hibák elemzése a véletlen hibák elméletén alapul, amely bizonyos garanciával lehetővé teszi a mért érték tényleges értékének kiszámítását és az esetleges hibák kiértékelését.

A véletlenszerű hibák elmélete a következő feltevéseken alapul:

nagyszámú mérésnél egyformán gyakran előfordulnak azonos nagyságrendű, de eltérő előjelű véletlenszerű hibák;

a nagy hibák ritkábban fordulnak elő, mint a kicsik (a hiba valószínűsége a nagyságának növekedésével csökken);

végtelenül nagy számú mérés esetén a mért mennyiség valódi értéke megegyezik az összes mérési eredmény számtani átlagával;

egyik vagy másik mérési eredmény véletlen eseményként való megjelenését a normáleloszlási törvény írja le.

A gyakorlatban különbséget tesznek az általános és a minta mérési sorozat között.

A lakosság alatt magában foglalja a lehetséges mérési értékek vagy lehetséges hibaértékek teljes készletét
.

A mintapopulációhoz mérések száma minden konkrét esetben korlátozott és szigorúan meghatározott. Azt hiszik, hogy ha
, akkor ennek a méréskészletnek az átlagértéke elég közel van a valódi értékéhez.

1. Intervallumbecslés megbízhatósági valószínűség segítségével

Nagy minta és normál eloszlás esetén a mérés általános értékelési jellemzője a diszperzió
és variációs együttható :

;
. (1.1)

A diszperzió a mérés homogenitását jellemzi. A magasabb
, annál nagyobb a mérések szórása.

A variabilitást a variációs együttható jellemzi. A magasabb , annál nagyobb a mérések variabilitása az átlagértékekhez képest.

A mérési eredmények megbízhatóságának felmérésére bevezetjük a konfidenciaintervallum és a konfidenciavalószínűség fogalmát.

Megbízható intervallumnak nevezzük értékeket , amelybe az igazi érték esik adott valószínűséggel mért mennyiség.

Bizalom valószínűsége egy mérés (megbízhatósága) annak a valószínűsége, hogy a mért érték valódi értéke egy adott konfidenciaintervallumba esik, pl. a zónához
. Ezt az értéket az egység törtrészében vagy százalékban határozzák meg

,

Ahol
- Laplace integrál funkció ( táblázat 1.1 )

A Laplace-integrálfüggvényt a következő kifejezés határozza meg:

.

Ennek a függvénynek az érve garancia tényező :

1.1. táblázat

Laplace integrál függvény

Ha bizonyos adatok alapján megbízhatósági valószínűséget állapítanak meg (gyakran egyenlőnek veszik
), akkor be van állítva a mérések pontossága (megbízhatósági intervallum
) az arány alapján

.

A konfidencia intervallum fele az

, (1.3)

Ahol
- a Laplace-függvény argumentuma, ha
(táblázat 1.1 );

- Hallgatói funkciók, ha
(táblázat 1.2 ).

Így a konfidencia intervallum egy adott minta mérésének pontosságát, a konfidenciavalószínűség pedig a mérés megbízhatóságát jellemzi.

Példa

Kész
átlagos rugalmassági modulusú autópálya-szakasz útfelületének szilárdságának mérése
és a szórás számított értéke
.

Szükséges határozza meg a szükséges pontosságot mérések számára különböző szinteken megbízhatósági valószínűség
, figyelembe véve az értékeket Által táblázat 1.1 .

Ebben az esetben ennek megfelelően |

Ezért a ebből a termékbőlés mérési módszerrel, a konfidenciaintervallum megközelítőleg növekszik alkalommal, ha növeli csak rajta
.



Publikációk a témában