Interval povjerenja je formula za izračunavanje fizičara. Konstrukcija intervala povjerenja za matematička očekivanja opće populacije. Metoda intervala povjerenja

Zadnje ažuriranje: 3. ožujka 2020
Primjer datoteke

Konstruirajmo interval pouzdanosti u MS EXCEL -u za procjenu srednje vrijednosti raspodjele u slučaju poznate važnosti varijance.

Naravno izbor razinu povjerenja u potpunosti ovisi o problemu koji se rješava. Dakle, stupanj povjerenja zračnog putnika u pouzdanost zrakoplova, nesumnjivo, trebao bi biti veći od stupnja povjerenja kupca u pouzdanost žarulje.

Izjava o problemu

Pretpostavimo da iz opće populacije uzevši uzorak veličina n. Pretpostavlja se da standardna devijacija ova distribucija je poznata. Na temelju ovoga je potrebno uzorkovanje procijeniti nepoznato srednja raspodjela(μ,) i konstruirati odgovarajuće dvostranointerval pouzdanosti .

Bodovna procjena

Kao što je poznato iz, statistika(mi to označavamo X srijeda) je nepristrana procjena srednje vrijednosti ovaj opće populacije i ima raspodjelu N (μ; σ 2 / n).

Bilješka : Što učiniti ako trebate graditi interval pouzdanosti u slučaju distribucije koja nijenormalan? U ovom slučaju dolazi do spašavanja, koje kaže da s dovoljno velikom veličinom uzorkovanje n iz distribucije ne bitinormalan , uzorak distribucije statistike X av htjeti približno dopisivati normalna distribucija s parametrima N (μ; σ 2 / n).

Tako, bodovna procjenasrednjidistribucijske vrijednosti mi imamo - ovo srednja vrijednost uzorka, tj. X srijeda... Sada prijeđimo na interval pouzdanosti.

Iscrtavanje intervala povjerenja

Obično, poznavajući distribuciju i njezine parametre, možemo izračunati vjerojatnost da će slučajna varijabla uzeti vrijednost iz intervala koji smo naveli. Učinimo sada suprotno: pronađite interval u kojem će slučajna varijabla pasti s zadanom vjerojatnošću. Na primjer, iz svojstava normalna distribucija poznato je da je s vjerojatnošću od 95%slučajna varijabla raspoređena po normalan zakon, bit će u intervalu od približno +/- 2 od Srednja vrijednost(vidi članak o). Taj će nam interval poslužiti kao prototip interval pouzdanosti .

Sada shvatimo znamo li distribuciju , izračunati ovaj interval? Da bismo odgovorili na pitanje, moramo naznačiti oblik raspodjele i njene parametre.

Znamo oblik distribucije - jest normalna distribucija(sjetite se o čemu govorimo distribucija uzorkastatistikaX srijeda).

Ne znamo parametar μ (samo ga treba procijeniti pomoću interval pouzdanosti), ali imamo njegovu procjenu X srijeda, izračunati na osnovu uzorkovanje, koji se može koristiti.

Drugi parametar je standardna devijacija srednje vrijednosti uzorkasmatrat ćemo to poznatim, jednako je σ / √n.

Jer ne znamo μ, tada ćemo konstruirati interval +/- 2 standardna odstupanja ne od Srednja vrijednost, i prema njegovoj poznatoj procjeni X srijeda... Oni. pri izračunu interval pouzdanosti to NEĆEMO pretpostaviti X srijeda spada u raspon +/- 2 standardna odstupanja od μ s vjerojatnošću od 95%, te ćemo pretpostaviti da je interval +/- 2 standardna odstupanja iz X srijeda s vjerojatnošću od 95% pokriti će μ - prosjek opće populacije, iz kojih je preuzet uzorak... Ove dvije izjave su ekvivalentne, ali druga nam izjava omogućuje konstrukciju interval pouzdanosti .

Dodatno, poboljšajmo interval: slučajna varijabla raspoređena po normalan zakon, s vjerojatnošću od 95% spada u interval +/- 1.960 standardna odstupanja, ne +/- 2 standardna odstupanja... To se može izračunati pomoću formule = NORM.ST.OBR ((1 + 0,95) / 2), cm primjer datoteke Razmak listova .

Sada možemo formulirati vjerojatnu izjavu koja će nam poslužiti za formiranje interval pouzdanosti: “Vjerojatnost da prosjek stanovništva je od prosječan uzorak unutar 1.960 " standardna odstupanja prosječne vrijednosti uzorka " jednaka je 95% ".

Vrijednost vjerojatnosti navedena u izjavi ima poseban naziv koji je povezan s razina značajnosti α (alfa) jednostavnim izrazom razini povjerenja = 1 . U našem slučaju razina značaja α =1-0,95=0,05 .

Sada, na temelju ove vjerojatne tvrdnje, zapisujemo izraz za izračunavanje interval pouzdanosti :

gdje je Z α / 2 standardnormalna distribucija(takva vrijednost slučajne varijable z , što P (z >= Z α / 2 ) = α / 2).

Bilješka : Gornji α / 2-kvantil određuje širinu interval pouzdanosti v standardna odstupanjasrednja vrijednost uzorka. Gornji α / 2-kvantil standardnormalna distribucija uvijek veći od 0, što je vrlo zgodno.

U našem slučaju, pri α = 0,05, gornji α / 2-kvantil jednak je 1.960. Za ostale razine značajnosti α (10%; 1%) gornji α / 2-kvantilZ α / 2 može se izračunati pomoću formule = STANDARDNI ST.OBR (1-α / 2) ili ako je poznato razini povjerenja , = NORM.ST.OBR ((1 + razina povjerenja) / 2) .

Obično pri izgradnji intervali pouzdanosti za procjenu srednje vrijednosti samo koristiti gornji α /2- kvantil i nemojte koristiti niži α /2- kvantil... To je moguće jer standardnormalna distribucija simetrično oko osi x ( njegovu gustoću distribucije simetričan u odnosu na prosjek, tj. 0) . Stoga nema potrebe za kalkulacijom niži α / 2-kvantil(jednostavno se naziva α / 2-kvantil), jer jednaka je gornji α /2- kvantil sa znakom minus.

Podsjetimo da je, unatoč obliku raspodjele veličine x, odgovarajuća slučajna varijabla X srijeda distribuirani približnofino N (μ; σ 2 / n) (vidi članak o). Stoga je u općem slučaju gornji izraz za interval pouzdanosti je samo približan. Ako je količina x raspoređena po normalan zakon N (μ; σ 2 / n), tada je izraz za interval pouzdanosti je točan.

Izračun intervala povjerenja u MS EXCEL -u

Riješimo problem. Vrijeme odziva elektronička komponenta na ulazni signal važna je karakteristika uređaja. Inženjer želi iscrtati interval pouzdanosti za prosječno vrijeme odziva na razini pouzdanosti od 95%. Inženjer iz prethodnog iskustva zna da je standardna devijacija vremena odziva 8 ms. Poznato je da je inženjer izvršio 25 mjerenja kako bi procijenio vrijeme odziva, prosječna vrijednost bila je 78 ms.

Riješenje: Inženjer želi znati vrijeme odziva elektroničkog uređaja, ali razumije da vrijeme odziva nije fiksna, već slučajna varijabla koja ima svoju distribuciju. Stoga je najbolje na što može računati da odredi parametre i oblik ove raspodjele.

Nažalost, iz izjave o problemu ne znamo oblik raspodjele vremena odziva (ne mora biti normalan). , ova distribucija je također nepoznata. Poznat samo po njemu standardna devijacijaσ = 8. Stoga, iako ne možemo izračunati vjerojatnosti i izgraditi interval pouzdanosti .

Međutim, unatoč činjenici da ne znamo distribuciju vrijemezaseban odgovor, znamo da prema CPT , distribucija uzorkaprosječno vrijeme odziva je otprilike normalan(pretpostavit ćemo da su uvjeti CPT izvode se jer veličina uzorkovanje dovoljno velik (n = 25)) .

Štoviše, prosječno ove distribucije je prosjek raspodjelu jednog odgovora, tj. μ. A standardna devijacija ove raspodjele (σ / √n) može se izračunati formulom = 8 / ROOT (25).

Također je poznato da je inženjer primio bodovna procjena parametar μ jednak 78 msec (X usp.). Stoga sada možemo izračunati vjerojatnosti, budući da znamo oblik distribucije ( normalan) i njegovih parametara (X cf i σ / √n).

Inženjer želi znati očekivana vrijednostμ raspodjele vremena odziva. Kao što je gore spomenuto, ovaj μ jednak je matematičko očekivanje distribucije uzorka srednjeg vremena odziva... Ako koristimo normalna distribucija N (X cf; σ / √n), tada će željeni μ biti u rasponu +/- 2 * σ / √n s vjerojatnošću od oko 95%.

Razina značajnosti jednak je 1-0,95 = 0,05.

Na kraju, pronađite lijevu i desnu granicu interval pouzdanosti... Lijeva granica: = 78-STANDARDNI ST.OBR (1-0.05 / 2) * 8 / ROOT (25) = 74,864 Desna granica: = 78 + NORM.ST.OBR (1-0,05 / 2) * 8 / ROOT (25) = 81,136

Lijeva granica: = NORM.OBR (0,05 / 2; 78; 8 / ROOT (25)) Desna granica: = NORM.INV (1-0,05 / 2; 78; 8 / ROOT (25))

Odgovor : interval pouzdanosti na razina povjerenja 95% i σ =8 ms jednako je 78 +/- 3,136 ms.

V. primjer datoteke na radnom listu Sigma poznat je obrazac za proračun i konstrukciju bilateralniinterval pouzdanosti za proizvoljno uzorci s danim σ i razina značaja .

CONFIDENCE.NORM () funkcija

Ako su vrijednosti uzorkovanje su u rasponu B20: B79 , a razina značaja jednak 0,05; zatim formula MS EXCEL: = PROSJEČNO (B20: B79) -POVJERENJE.NORMA (0,05, σ, COUNT (B20: B79)) vratit će lijevu granicu interval pouzdanosti .

Ista se granica može izračunati formulom: = PROSJEČNO (B20: B79) -NORM.ST.INV (1-0.05 / 2) * σ / KORIJEN (BROJ (B20: B79))

Bilješka: Funkcija CONFIDENCE.NORM () pojavila se u MS EXCEL 2010. U ranijim verzijama MS EXCEL -a, korištena je funkcija CONFIDENCE.NORM ().

U prethodnim pododjeljcima razmatrali smo pitanje procjene nepoznatog parametra a jedan broj. Ta se procjena naziva "točka". U nizu zadataka potrebno je ne samo pronaći parametar a odgovarajuću brojčanu vrijednost, ali i procijeniti njezinu točnost i pouzdanost. Želite znati do kakvih grešaka zamjena parametara može dovesti a svoju bodovnu procjenu a i s kojim stupnjem sigurnosti možemo očekivati ​​da će ove pogreške ostati unutar poznatih granica?

Problemi ove vrste posebno su relevantni za mali broj opažanja, kada se procjenjuje točka i u u velikoj mjeri slučajno i približna zamjena a može dovesti do ozbiljnih pogrešaka.

Dati ideju o točnosti i pouzdanosti procjene a,

u matematičkoj statistici koriste se takozvani intervali pouzdanosti i vjerojatnosti pouzdanosti.

Neka parametar a iz iskustva nepristrana procjena a. U ovom slučaju želimo procijeniti moguću pogrešku. Dodijelimo neku dovoljno veliku vjerojatnost p (na primjer, p = 0,9, 0,95 ili 0,99) tako da se događaj s vjerojatnosti p može smatrati praktički pouzdanim, a mi ćemo pronaći takvu vrijednost s za koju

Zatim raspon praktički mogućih vrijednosti pogreške nastale prilikom zamjene a na a, bit će ± s; velike pogreške u apsolutnoj vrijednosti pojavit će se samo s malom vjerojatnošću a = 1 - p. Prepišimo (14.3.1) kao:

Jednakost (14.3.2) znači da s vjerojatnošću p nepoznata vrijednost parametra a spada u interval

Istodobno, valja primijetiti jednu okolnost. Ranije smo više puta razmatrali vjerojatnost da slučajna varijabla padne u zadani ne-slučajni interval. Ovdje je situacija drugačija: količina a nije slučajno, ali interval / p je slučajan. Nasumično je njegov položaj na osi apscise određen njegovim središtem a; duljina intervala 2s također je općenito slučajna, budući da se vrijednost s u pravilu izračunava iz eksperimentalnih podataka. Stoga bi u ovom slučaju bilo bolje vrijednost p tumačiti ne kao vjerojatnost "pogađanja" točke a u interval / p, i kao vjerojatnost da će slučajni interval / p pokriti točku a(slika 14.3.1).

Riža. 14.3.1

Obično se naziva vjerojatnost p razina povjerenja, a interval / p je interval pouzdanosti. Granice intervala Ako. a x = a- s i a 2 = a + ali zvao granice povjerenja.

Dajmo još jedno tumačenje pojma intervala povjerenja: može se smatrati intervalom vrijednosti parametara a, kompatibilni s eksperimentalnim podacima i ne proturječe im. Doista, ako pristanemo smatrati događaj s vjerojatnosti a = 1-p praktički nemogućim, tada su vrijednosti parametra a za koje a - a> s, moraju se priznati kao kontradiktorni eksperimentalnim podacima i onima za koje | a - a a t na 2.

Neka parametar a postoji nepristrana procjena a. Kad bismo poznavali zakon raspodjele količine a, problem pronalaženja intervala pouzdanosti bio bi sasvim jednostavan: bilo bi dovoljno pronaći takvu vrijednost s za koju

Poteškoća je u tome što zakon raspodjele procjene a ovisi o zakonu raspodjele količine x i, prema tome, na njegovim nepoznatim parametrima (osobito na samom parametru a).

Da bi se zaobišla ova poteškoća, može se primijeniti sljedeća gruba aproksimacija: zamijeniti nepoznate parametre u izrazu za s s njihovim točkastim procjenama. Uz relativno veliki broj eksperimenata NS(oko 20 ... 30) ova tehnika obično daje rezultate zadovoljavajuće u smislu točnosti.

Kao primjer, razmotrimo problem intervala povjerenja za matematička očekivanja.

Neka se proizvodi NS X,čije su karakteristike matematičko očekivanje T i varijance D- nepoznato. Za ove parametre dobivene su sljedeće procjene:

Za matematička očekivanja potrebno je konstruirati interval pouzdanosti / p, koji odgovara vjerojatnosti pouzdanosti p T veličinama X.

Pri rješavanju ovog problema koristit ćemo se činjenicom da je količina T predstavlja iznos NS neovisne identično distribuirane slučajne varijable X h a prema središnjem graničnom teoremu za dovoljno velike NS njegov zakon distribucije je blizu normalnog. U praksi, čak i uz relativno mali broj članova (oko 10 ... 20), zakon raspodjele zbroja može se smatrati približno normalnim. Poći ćemo od činjenice da je količina T distribuira prema normalnom zakonu. Karakteristike ovog zakona - matematička očekivanja i varijance - jednake su T i

(vidi poglavlje 13 pododjeljak 13.3). Pretpostavimo da je količina D poznajemo i nalazimo takvu vrijednost Ep, za koju

Primjenjujući formulu (6.3.5) u Poglavlju 6, izražavamo vjerojatnost s lijeve strane (14.3.5) u smislu normalne distribucijske funkcije

gdje je standardna devijacija procjene T.

Iz jednadžbe

nalazimo vrijednost Sp:

gdje je arg F * (h) inverzna funkcija od F * (NS), oni. takva vrijednost argumenta za koju je normalna funkcija raspodjele jednaka NS.

Disperzija D, kroz koje se izražava vrijednost a 1P, ne znamo točno; kao približnu vrijednost možete koristiti procjenu D(14.3.4) i staviti približno:

Tako je problem izgradnje intervala pouzdanosti približno riješen, što je jednako:

gdje je gp definiran formulom (14.3.7).

Kako bi se izbjegla inverzna interpolacija u tablicama funkcije F * (l) pri izračunavanju s p, prikladno je sastaviti posebnu tablicu (tablica 14.3.1.), Koja daje vrijednosti veličine

ovisno o str. Veličina (p za normalni zakon određuje broj standardnih odstupanja koja se moraju odgoditi desno i lijevo od središta raspršenja kako bi vjerojatnost udara u rezultirajuće područje bila jednaka p.

Kroz vrijednost 7 p, interval pouzdanosti izražava se kao:

Tablica 14.3.1

Primjer 1. Provedeno je 20 pokusa na vrijednosti X; rezultati su prikazani u tablici. 14.3.2.

Tablica 14.3.2

Potrebno je pronaći procjenu matematičkog očekivanja veličine x i izgraditi interval pouzdanosti koji odgovara razini pouzdanosti p = 0,8.

Riješenje. Imamo:

Odabirom ishodišta l: = 10, prema trećoj formuli (14.2.14), nalazimo nepristranu procjenu D :

Prema tablici. 14.3,1 nalaz

Granice povjerenja:

Interval pouzdanosti:

Vrijednosti parametara T, koji leže u ovom intervalu u skladu su s eksperimentalnim podacima danim u tablici. 14.3.2.

Interval pouzdanosti za varijansu može se konstruirati na sličan način.

Neka se proizvodi NS neovisni pokusi na slučajnoj varijabli x s nepoznatim parametrima iz i A, te za varijancu D dobiva se nepristrana procjena:

Potrebno je ugrubo konstruirati interval pouzdanosti za varijansu.

Iz formule (14.3.11) se vidi da je količina D predstavlja

zbroj NS slučajne varijable oblika. Ove količine nisu

neovisni, budući da bilo koji od njih uključuje količinu T, ovisni o svima ostalima. Međutim, može se pokazati da s povećanjem NS zakon raspodjele njihovog zbroja također je blizu normalnom. Praktično u NS= 20 ... 30 to se već može smatrati normalnim.

Pretpostavimo da je to tako i pronadimo karakteristike ovog zakona: matematička očekivanja i varijance. Od partiture D- dakle, nepristrano M [D] = D.

Izračunavanje varijance DD povezan je s relativno složenim izračunima, pa predstavljamo njegov izraz bez izlaza:

gdje je q 4 četvrti središnji moment veličine X.

Da biste koristili ovaj izraz, morate u njega unijeti vrijednosti 4 i D(barem približno). Umjesto D možete koristiti njegovu procjenu D. U načelu, četvrti središnji trenutak također se može zamijeniti procjenom, na primjer, vrijednošću oblika:

ali takva će zamjena dati iznimno nisku točnost, budući da se općenito, uz ograničen broj eksperimenata, momenti visokog reda određuju s velikim pogreškama. Međutim, u praksi se često događa da oblik zakona raspodjele količine x unaprijed poznato: nepoznati su samo njegovi parametri. Tada možete pokušati izraziti q 4 u smislu D.

Uzmimo najčešći slučaj kada je količina x distribuira prema normalnom zakonu. Tada se njegov četvrti središnji trenutak izražava u smislu varijance (vidi Poglavlje 6, pododsjek 6.2);

a formula (14.3.12) daje ili

Zamjenjuje (14.3.14) nepoznato D njegovu ocjenu D, dobivamo: odakle

Moment c 4 možemo izraziti u smislu D također u nekim drugim slučajevima, kada je raspodjela količine x nije normalno, ali je poznat njegov izgled. Na primjer, za zakon jednolike gustoće (vidi 5. poglavlje) imamo:

gdje je (a, P) interval u kojem je postavljen zakon.

Stoga,

Formulom (14.3.12) dobivamo: odakle otprilike nalazimo

U slučajevima kada oblik zakona o distribuciji 26 nije poznat, ipak se preporučuje upotreba formule (14.3.16) pri gruboj procjeni vrijednosti a /), osim ako postoje posebni razlozi za vjerovanje da se ovaj zakon jako razlikuje od normalno (ima primjetan pozitivan ili negativan višak) ...

Ako se na ovaj ili onaj način dobije približna vrijednost a /), tada je moguće konstruirati interval pouzdanosti za varijansu na isti način na koji smo ga izgradili za matematičko očekivanje:

gdje se vrijednost, ovisno o zadanoj vjerojatnosti p, nalazi prema tablici. 14.3.1.

Primjer 2. Nađite približno 80% interval pouzdanosti za varijansu slučajne varijable x pod uvjetima iz primjera 1, ako je poznato da količina x distribuirani prema zakonu bliskom normalnom.

Riješenje. Vrijednost ostaje ista kao u tablici. 14.3.1:

Prema formuli (14.3.16)

Koristeći formulu (14.3.18), nalazimo interval pouzdanosti:

Odgovarajući raspon vrijednosti standardne devijacije: (0,21; 0,29).

14.4. Točne metode za konstruiranje intervala pouzdanosti za parametre slučajne varijable raspoređene prema normalnom zakonu

U prethodnom pododjeljku pogledali smo približno približne metode za konstruiranje intervala pouzdanosti za očekivanja i varijance. Ovdje ćemo dati ideju o točnim metodama za rješavanje istog problema. Ističemo da je za točno pronalaženje intervala povjerenja apsolutno potrebno unaprijed znati oblik zakona raspodjele količine X, dok za primjenu približnih metoda to nije potrebno.

Ideja koja stoji iza točnih metoda za konstruiranje intervala povjerenja je sljedeća. Svaki interval pouzdanosti nalazi se iz uvjeta koji izražava vjerojatnost ispunjenja nekih nejednakosti, koje uključuju procjenu koja nas zanima a. Zakon o raspodjeli procjena a u općem slučaju ovisi o nepoznatim parametrima veličine X. Međutim, ponekad je moguće prenijeti nejednakosti iz slučajne varijable a na neku drugu funkciju promatranih vrijednosti X n X 2, ..., X str.čiji zakon raspodjele ne ovisi o nepoznatim parametrima, već ovisi samo o broju eksperimenata i o obliku zakona distribucije za veličinu X. Slučajne varijable ove vrste igraju važnu ulogu u matematičkoj statistici; oni su detaljno proučeni za slučaj normalne raspodjele količine X.

Na primjer, dokazano je da za normalnu raspodjelu količine x slučajna vrijednost

pokorava se tzv Zakon o distribuciji studenata s NS- 1 stupanj slobode; gustoća ovog zakona ima oblik

gdje je G (h) poznata gama funkcija:

Također je dokazano da je slučajna varijabla

ima "distribuciju% 2" sa NS- 1 stupanj slobode (vidi Poglavlje 7), čija je gustoća izražena formulom

Ne zadržavajući se na izvedenicama distribucija (14.4.2) i (14.4.4), pokazat ćemo kako se one mogu primijeniti pri izgradnji intervala pouzdanosti za parametre ty D.

Neka se proizvodi NS neovisni pokusi na slučajnoj varijabli X, distribuirani prema normalnom zakonu s nepoznatim parametrima thio. Za ove parametre dobivene su procjene

Potrebno je izgraditi intervale pouzdanosti za oba parametra koji odgovaraju vjerojatnosti pouzdanosti p.

Najprije konstruirajmo interval pouzdanosti za matematička očekivanja. Naravno, ovaj interval se uzima simetrično s obzirom na T; označimo sa s p polovicu duljine intervala. Veličina s p mora biti odabrana tako da je uvjet

Pokušajmo prijeći s lijeve strane jednakosti (14.4.5) iz slučajne varijable T na slučajnu varijablu T, distribuira se prema Studentovom zakonu. Da bismo to učinili, množimo obje strane nejednakosti | m-w? |

pozitivnom vrijednošću: ili, koristeći zapis (14.4.1),

Pronađimo broj / p takav da se vrijednost / p pronađe iz uvjeta

Iz formule (14.4.2) se vidi da je (1) parna funkcija, pa (14.4.8) daje

Jednakost (14.4.9) određuje vrijednost / p ovisno o p. Ako imate na raspolaganju tablicu vrijednosti integrala

tada se vrijednost / p može pronaći obrnutom interpolacijom u tablici. Međutim, prikladnije je unaprijed sastaviti tablicu vrijednosti / p. Takva tablica data je u dodatku (tablica 5). Ova tablica prikazuje vrijednosti ovisno o vjerojatnosti pouzdanosti p i broju stupnjeva slobode NS- 1. Utvrdivši / p prema tablici. 5 i pod pretpostavkom

naći ćemo polovinu širine intervala pouzdanosti / p i samog intervala

Primjer 1. Napravio je 5 neovisnih pokusa na slučajnoj varijabli X, normalno distribuirani s nepoznatim parametrima T i oko. Rezultati pokusa prikazani su u tablici. 14.4.1.

Tablica 14.4.1

Pronađite ocjenu T za matematičko očekivanje i konstruiramo interval pouzdanosti od 90% / p (tj. interval koji odgovara vjerojatnosti pouzdanosti p = 0,9).

Riješenje. Imamo:

Prema tablici 5 prijave za NS - 1 = 4 i p = 0,9 nalazimo gdje

Interval povjerenja bit će

Primjer 2. Za uvjete primjera 1 pododjeljka 14.3, pretpostavljajući vrijednost x distribuira normalno, pronaći točan interval pouzdanosti.

Riješenje. Prema tablici 5. nalazimo aplikacije za NS - 1 = 19ir =

0,8 / p = 1,328; odavde

Uspoređujući s rješenjem primjera 1 pododjeljka 14.3 (e p = 0,072), uvjereni smo da je odstupanje vrlo beznačajno. Ako točnost držimo do drugog decimalnog mjesta, tada se intervali pouzdanosti pronađeni točnim i približnim metodama podudaraju:

Prijeđimo na konstruiranje intervala pouzdanosti za varijansu. Razmotrite nepristranu procjenu varijance

i izraziti slučajnu varijablu D kroz vrijednost V.(14.4.3) koji ima raspodjelu x 2 (14.4.4):

Poznavanje zakona raspodjele količine V, može se pronaći interval / (1, u koji pada s zadanom vjerojatnošću p.

Zakon o distribuciji k n _ x (v) količina I 7 ima oblik prikazan na Sl. 14.4.1.

Riža. 14.4.1

Postavlja se pitanje: kako odabrati interval / p? Ako je zakon raspodjele količine V. bio simetričan (poput normalnog zakona ili Studentove distribucije), bilo bi prirodno uzeti interval / p simetričan s obzirom na matematička očekivanja. U ovom slučaju, zakon k n _ x (v) asimetrična. Dogovorimo se da odaberemo interval / p tako da su vjerojatnosti izlaza količine V. izvan intervala desno i lijevo (zasjenjena područja na slici 14.4.1) bila su ista i jednaka

Za konstruiranje intervala / p s ovim svojstvom upotrijebit ćemo tablicu. 4 dodatka: u njemu su navedeni brojevi y) takav da

za vrijednost V, koja ima x 2 -razdiobu s r stupnjevima slobode. U našem slučaju r = n- 1. Ispravimo r = n- 1 i pronađite u odgovarajućem retku tablice. 4 dva značenja x 2 - jedan odgovara vjerojatnosti drugi - vjerojatnosti Označimo ove

značenje u 2 i xl? Interval ima u 2, njegova lijeva i y ~ desni kraj.

Pronađimo sada željeni interval pouzdanosti / | za varijancu s granicama D, i D 2, koji pokriva točku D s vjerojatnošću p:

Konstruirajmo takav interval / (, = (?> B A), koji pokriva točku D ako i samo ako je količina V. spada u interval / str. Pokažimo da je interval

zadovoljava ovaj uvjet. Doista, nejednakosti su ekvivalentne nejednakostima

a te su nejednakosti zadovoljene s vjerojatnosti p. Dakle, interval pouzdanosti za varijansu je pronađen i izražen formulom (14.4.13).

Primjer 3. Nađite interval pouzdanosti za varijansu pod uvjetima iz primjera 2 pododsjeka 14.3, ako je poznato da je vrijednost x normalno distribuirani.

Riješenje. Imamo ... Prema tablici 4. dodatka

nalazimo kod r = n - 1 = 19

Koristeći formulu (14.4.13), nalazimo interval pouzdanosti za varijansu

Odgovarajući interval za standardnu ​​devijaciju: (0,21; 0,32). Ovaj interval samo malo premašuje interval (0,21; 0,29) koji se približnom metodom dobiva u primjeru 2 pododjeljka 14.3.

  • Slika 14.3.1 razmatra interval pouzdanosti koji je simetričan oko a. Općenito, kao što ćemo vidjeti kasnije, ovo nije obavezno.

Interval pouzdanosti(CI; na engleskom jeziku interval pouzdanosti - CI) dobiven u studiji s uzorkom daje mjeru točnosti (ili nesigurnosti) rezultata studije kako bi se izveli zaključci o populaciji svih takvih pacijenata (opća populacija). Točna definicija 95% CI može se formulirati na sljedeći način: 95% takvih intervala sadržavat će pravu vrijednost u populaciji. Ova je interpretacija nešto manje točna: CI je raspon vrijednosti unutar kojih se može biti 95% siguran da sadrži pravu vrijednost. Prilikom korištenja CI -a naglasak je na kvantificiranju učinka, za razliku od vrijednosti P koja se dobiva testiranjem statističke značajnosti. P-vrijednost ne mjeri nikakvu veličinu, već služi kao mjera jačine dokaza nasuprot nultoj hipotezi o "bez učinka". Vrijednost P sama po sebi ne govori nam ništa o veličini razlike, pa čak ni o njezinom smjeru. Stoga su neovisne vrijednosti P apsolutno neinformativne u člancima ili sažecima. Nasuprot tome, CI ukazuje i na količinu učinka neposrednog interesa, poput korisnosti liječenja, i na snagu dokaza. Stoga je JI izravno povezan s praksom EBM -a.

Pristup procjene Statistička analiza, ilustriran CI -om, ima za cilj izmjeriti iznos učinka od interesa (osjetljivost dijagnostičkog testa, učestalost predviđenih slučajeva, smanjenje relativnog rizika u liječenju itd.), kao i izmjeriti nesigurnost u ovom utjecaj. Najčešće je CI raspon vrijednosti s obje strane procjene, u kojem će vjerovatno ležati prava vrijednost, a u to možete biti sigurni 95%. Dogovor o proizvoljnoj uporabi vjerojatnosti od 95%, kao i vrijednost P<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

CI se temelji na ideji da ista studija provedena na drugim uzorcima pacijenata ne bi dovela do identičnih rezultata, već da bi njihovi rezultati bili raspoređeni oko prave, ali nepoznate vrijednosti. Drugim riječima, CI to opisuje kao "varijabilnost ovisnu o uzorku". CI ne odražava dodatnu nesigurnost zbog drugih uzroka; osobito ne uključuje učinke selektivnog gubitka pacijenata u praćenju, lošu usklađenost ili netočno mjerenje ishoda, nedostatak zasljepljivanja itd. CI stoga uvijek podcjenjuje ukupnu količinu nesigurnosti.

Izračunavanje intervala povjerenja

Tablica A1.1. Standardne pogreške i intervali pouzdanosti za neka klinička mjerenja

Obično se CI izračunava iz promatrane procjene kvantitativne mjere, kao što je razlika (d) između dva omjera i standardna pogreška (SE) u procjeni te razlike. Tako dobiven približno 95% CI je d ± 1,96 SE. Formula se mijenja ovisno o prirodi mjere ishoda i opsegu CI. Na primjer, u randomiziranom, placebom kontroliranom ispitivanju acelularnog cjepiva protiv hripavca, 72 od 1.670 (4,3%) dojenčadi koje su primile cjepivo razvilo je hripavac, a 240 od ​​1665 (14,4%) kontrola. Razlika u postocima, poznata kao apsolutno smanjenje rizika, iznosi 10,1%. SE ove razlike iznosi 0,99%. Sukladno tome, 95% CI iznosi 10,1% + 1,96 x 0,99%, tj. od 8,2 do 12,0.

Unatoč različitim filozofskim pristupima, CI i testovi statističke značajnosti matematički su blisko povezani.

Dakle, vrijednost P je "značajna", tj. R<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

Nesigurnost (nesigurnost) procjene, izražena u CI, uvelike je povezana s kvadratnim korijenom veličine uzorka. Mali uzorci pružaju manje informacija od velikih, a CI je u manjem uzorku odgovarajuće širi. Na primjer, članak koji uspoređuje karakteristike tri testa koji se koriste za dijagnosticiranje infekcije Helicobacter pylori izvijestio je o osjetljivosti od 95,8% testa na dah uree (95% CI 75-100). Iako broj od 95,8% izgleda impresivno, mali uzorak od 24 odrasla pacijenta s I. pylori znači da postoji značajna nesigurnost u ovoj procjeni, što pokazuje široki CI. Doista, donja granica od 75% mnogo je niža od procjene od 95,8%. Ako bi se ista osjetljivost primijetila na uzorku od 240 ljudi, tada bi 95% CI bio 92,5-98,0, što daje veća jamstva da je test visoko osjetljiv.

U randomiziranim kontroliranim ispitivanjima (RCT), neznačajni rezultati (tj. Oni s P> 0,05) posebno su osjetljivi na pogrešno tumačenje. CI je ovdje posebno koristan jer pokazuje koliko su rezultati dosljedni s klinički korisnim istinskim učinkom. Na primjer, u RCT -u koji je uspoređivao šavove i spajajuće anastomoze s debelim crijevom, infekcija rane razvila se u 10,9% odnosno 13,5% pacijenata (P = 0,30). 95% CI za ovu razliku iznosi 2,6% (-2 do +8). Čak i u ovoj studiji od 652 pacijenta ostaje vjerojatnost da postoji skromna razlika u učestalosti infekcija koja je posljedica dva postupka. Što je manje istraživanja, to je više neizvjesnosti. Sung i sur. proveo je RCT za usporedbu infuzije oktreotida sa hitnom skleroterapijom za akutno varikozno krvarenje u 100 pacijenata. U skupini oktreotida stopa zaustavljanja krvarenja bila je 84%; u skleroterapijskoj skupini - 90%, što daje P = 0,56. Imajte na umu da su stope tekućeg krvarenja slične onima kod infekcije rane u spomenutoj studiji. U ovom slučaju, međutim, 95% CI za razliku između intervencija iznosi 6% (-7 do +19). Ovaj je interval prilično širok u usporedbi s razlikom od 5% koja bi bila od kliničkog interesa. Jasno je da studija ne isključuje značajnu razliku u učinkovitosti. Stoga zaključak autora “infuzija oktreotida i skleroterapija jednako su učinkoviti u liječenju krvarenja iz proširenih vena” definitivno nije valjan. U ovakvim slučajevima, gdje, kao i ovdje, 95% CI za apsolutno smanjenje rizika (ARR) uključuje nulu, CI za broj potreban za liječenje (NNT) prilično je teško protumačiti. ... NPLP i njegov CI izvedeni su iz recipročne vrijednosti ACP -a (pomnožene sa 100 ako se daju kao postoci). Ovdje dobivamo BPHP = 100: 6 = 16,6 s 95% CI od -14,3 do 5,3. Kao što možete vidjeti iz fusnote "d" u tablici. A1.1, ovaj CI uključuje vrijednosti BPHP od 5,3 do beskonačnosti i vrijednosti BPHP od 14,3 do beskonačnosti.

CI se mogu konstruirati za najčešće korištene statističke procjene ili usporedbe. Za RCT -ove uključuje razliku između srednjih udjela, relativnih rizika, omjera vjerojatnosti i NPP -a. Slično, CI se mogu dobiti za sve glavne procjene izvedene u studijama o točnosti dijagnostičkih testova - osjetljivost, specifičnost, prediktivnu vrijednost pozitivnog rezultata (svi su to jednostavni omjeri) i omjere vjerojatnosti - procjene dobivene u meta -analizama i studije usporedbe s kontrolom. Računalni program za osobna računala koji pokriva mnoge od ovih upotreba ID -a dostupan je s drugim izdanjem Statistike s povjerenjem. Makroni za izračunavanje CI za omjere dostupni su besplatno za Excel i statističke programe SPSS i Minitab na http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/proportions, htm.

Višestruke procjene učinka liječenja

Iako su CI poželjni za rezultate primarne studije, oni nisu potrebni za sve rezultate. CI se bavi klinički relevantnim usporedbama. Na primjer, kada se uspoređuju dvije skupine, točan je CI koji je izgrađen za razlikovanje grupa, kao što je prikazano u gornjim primjerima, a ne CI koji se može izgraditi za procjenu u svakoj skupini. Ne samo da je beskorisno davati posebne CI -ove za ocjene u svakoj skupini, već i ovo predstavljanje može dovesti u zabludu. Slično, ispravan pristup pri usporedbi učinkovitosti liječenja u različitim podskupinama je izravno uspoređivanje dviju (ili više) podskupina. Pogrešno je pretpostaviti da je liječenje učinkovito samo u jednoj podskupini ako njezin CI isključuje nikakav učinak, a drugi ne. CI su također korisni pri usporedbi rezultata u više podskupina. Na sl. A 1.1 prikazuje relativni rizik od eklampsije u žena s preeklampsijom u podskupini žena iz RCT-a magnezijevog sulfata kontroliranog placebom.

Riža. A1.2. Šumska parcela prikazuje rezultate 11 randomiziranih kliničkih ispitivanja cjepiva protiv goveđeg rotavirusa za prevenciju proljeva u odnosu na placebo. U procjeni relativnog rizika od proljeva korišten je interval pouzdanosti od 95%. Veličina crnog kvadrata proporcionalna je količini informacija. Osim toga, prikazana je kumulativna procjena učinkovitosti liječenja i interval pouzdanosti od 95% (označen dijamantom). Meta-analiza koristila je model slučajnih učinaka koji premašuje neke od prethodno utvrđenih; na primjer, to bi mogla biti veličina koja se koristi za izračunavanje veličine uzorka. Za stroži kriterij, cijeli raspon CI trebao bi pokazati koristi veće od unaprijed utvrđenog minimuma.

Već smo raspravljali o pogrešci u kojoj se nedostatak statističke značajnosti uzima kao pokazatelj da su dva tretmana jednako učinkovita. Jednako je važno ne izjednačavati statističku značajnost s kliničkom važnošću. Klinička važnost može se zaključiti kada je ishod statistički značajan i ako je veličina procjene učinkovitosti liječenja

Istraživanja mogu pokazati jesu li rezultati statistički značajni, a koji klinički važni, a koji nisu. Na sl. A1.2 prikazuje rezultate četiri ispitivanja, za koje je cijeli CI<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

Interval povjerenja za očekivanu vrijednost - ovo je takav interval izračunat iz podataka, koji s poznatom vjerojatnošću sadrži matematička očekivanja opće populacije. Prirodna procjena matematičkog očekivanja je aritmetička sredina njegovih promatranih vrijednosti. Stoga ćemo dalje u lekciji koristiti izraze "prosjek", "srednja vrijednost". U zadacima izračuna intervala pouzdanosti najčešće je potreban odgovor tipa "Interval povjerenja srednje [vrijednosti u određenom problemu] je od [niže vrijednosti] do [veće vrijednosti]". Uz pomoć intervala pouzdanosti moguće je procijeniti ne samo prosječne vrijednosti, već i specifičnu težinu određene značajke opće populacije. Srednje vrijednosti, varijansa, standardna devijacija i pogreška, kroz koje ćemo doći do novih definicija i formula, rastavljaju se u lekciji Karakteristike uzorka i populacije .

Točke i intervalne procjene srednje vrijednosti

Ako se prosječna vrijednost opće populacije procijeni brojem (točkom), tada se za procjenu nepoznate prosječne vrijednosti opće populacije uzima specifični prosjek, koji se izračunava iz uzorka promatranja. U ovom slučaju, vrijednost prosječne vrijednosti uzorka - slučajna varijabla - ne podudara se s prosječnom vrijednošću opće populacije. Stoga je prilikom specificiranja srednje vrijednosti uzorka potrebno istodobno naznačiti pogrešku uzorkovanja. Kao mjera pogreške uzorkovanja koristi se standardna pogreška koja se izražava u istim mjernim jedinicama kao srednja vrijednost. Stoga se često koriste sljedeće oznake :.

Ako se procjena srednje vrijednosti mora pridružiti određenoj vjerojatnosti, tada se parametar od interesa za opću populaciju mora procijeniti ne za jedan broj, već za interval. Interval povjerenja je interval u kojem s određenom vjerojatnošću P nalazi se vrijednost procijenjenog pokazatelja opće populacije. Interval povjerenja, u kojem je vjerojatnost P = 1 - α pronađena je slučajna varijabla, izračunata na sljedeći način:

,

α = 1 - P, koji se može pronaći u dodatku gotovo svake knjige o statistici.

U praksi, populacijska sredina i varijansa nisu poznate, pa se varijacija populacije zamjenjuje varijansom uzorka, a prosječna populacija zamjenjuje se srednjom vrijednosti uzorka. Stoga se interval pouzdanosti u većini slučajeva izračunava na sljedeći način:

.

Formula intervala povjerenja može se koristiti za procjenu prosječne populacije ako

  • poznata je standardna devijacija stanovništva;
  • ili standardna devijacija populacije nije poznata, ali je veličina uzorka veća od 30.

Prosječna vrijednost uzorka je nepristrana procjena prosječne populacije. Zauzvrat, varijansa uzorka nije nepristrana procjena varijance populacije. Za dobivanje nepristrane procjene varijance opće populacije u formuli varijance uzorka, veličina uzorka n treba zamijeniti sa n-1.

Primjer 1. Prikupljeni su podaci iz 100 nasumično odabranih kafića u jednom gradu da je prosječan broj zaposlenih u njima 10,5 sa standardnom devijacijom 4,6. Odredite interval povjerenja od 95% broja radnika kafića.

gdje je kritična vrijednost standardne normalne distribucije za razinu značajnosti α = 0,05 .

Tako se interval povjerenja od 95% za prosječan broj radnika kafića kretao od 9,6 do 11,4.

Primjer 2. Za slučajni uzorak iz opće populacije od 64 opažanja izračunate su sljedeće ukupne vrijednosti:

zbroj vrijednosti u opažanjima,

zbroj kvadrata odstupanja vrijednosti od srednje vrijednosti .

Izračunajte 95% interval pouzdanosti za očekivanje.

izračunajte standardnu ​​devijaciju:

,

izračunajte prosječnu vrijednost:

.

Zamijenite vrijednosti u izrazu za interval pouzdanosti:

gdje je kritična vrijednost standardne normalne distribucije za razinu značajnosti α = 0,05 .

Dobivamo:

Tako se interval pouzdanosti od 95% za matematička očekivanja ovog uzorka kretao od 7.484 do 11.266.

Primjer 3. Za slučajni uzorak iz opće populacije od 100 opažanja izračunata je srednja vrijednost 15,2 i standardna devijacija 3,2. Izračunajte 95% interval pouzdanosti za očekivanje, zatim 99% interval pouzdanosti. Ako veličina uzorka i njegova varijacija ostanu nepromijenjeni, a koeficijent pouzdanosti se poveća, hoće li se interval pouzdanosti suziti ili proširiti?

Zamijenite ove vrijednosti u izraz za interval pouzdanosti:

gdje je kritična vrijednost standardne normalne distribucije za razinu značajnosti α = 0,05 .

Dobivamo:

.

Tako se interval pouzdanosti od 95% za srednju vrijednost ovog uzorka kretao od 14,57 do 15,82.

Ove vrijednosti ponovno zamjenjujemo izrazom za interval pouzdanosti:

gdje je kritična vrijednost standardne normalne distribucije za razinu značajnosti α = 0,01 .

Dobivamo:

.

Tako se interval pouzdanosti od 99% za prosjek ovog uzorka kretao od 14,37 do 16,02.

Kao što vidite, s povećanjem koeficijenta pouzdanosti povećava se i kritična vrijednost standardne normalne raspodjele, pa se stoga početna i krajnja točka intervala nalaze dalje od srednje vrijednosti, a time i interval pouzdanosti jer se matematičko očekivanje povećava.

Procjene točaka i intervala specifične težine

Specifična težina neke značajke uzorka može se tumačiti kao točkasta procjena specifične težine str ista značajka u općoj populaciji. Ako ovu vrijednost treba povezati s vjerojatnosti, tada bi se trebao izračunati interval pouzdanosti specifične težine str osobina u općoj populaciji s vjerojatnosti P = 1 - α :

.

Primjer 4. U nekom gradu postoje dva kandidata A i B kandidirati se za gradonačelnika. Nasumično je intervjuirano 200 stanovnika grada, od kojih je 46% odgovorilo da će glasovati za kandidata A, 26% - za kandidata B a 28% ne zna za koga će glasovati. Odredite interval povjerenja od 95% za udio stanovnika grada koji podržavaju kandidata A.

Konstantin Krawchik jasno objašnjava što je interval pouzdanosti u medicinskim istraživanjima i kako ga koristiti.

Katren-Stil nastavlja objavljivati ​​ciklus Konstantina Kravchika o medicinskoj statistici. U dva prethodna članka autor se bavio objašnjenjem pojmova kao što su i.

Konstantin Kravčik

Analitički matematičar. Specijalist statističkih istraživanja u medicini i humanističkim znanosti

Grad Moskva

Vrlo često u člancima o kliničkim ispitivanjima možete pronaći tajanstveni izraz: "interval pouzdanosti" (95% CI ili 95% CI - interval pouzdanosti). Na primjer, članak može glasiti: "Za procjenu važnosti razlika korišten je Studentov t-test s izračunom intervala pouzdanosti od 95%."

Kolika je vrijednost "95% intervala pouzdanosti" i zašto je izračunati?

Što je interval povjerenja? - Ovo je raspon u kojem su pravi prosjeci u populaciji. I što, postoje "neistinite" prosječne vrijednosti? U određenom smislu, da, postoje. Objasnili smo da je nemoguće izmjeriti parametar interesa u cijeloj populaciji, pa su istraživači zadovoljni s ograničenim uzorkom. U ovom uzorku (na primjer, prema tjelesnoj težini) postoji jedna prosječna vrijednost (određena težina), prema kojoj sudimo o prosječnoj vrijednosti u cijeloj općoj populaciji. Međutim, malo je vjerojatno da će se prosječna težina uzorka (osobito mala) podudarati s prosječnom težinom u općoj populaciji. Stoga je ispravnije izračunati i koristiti raspon prosječnih vrijednosti opće populacije.

Na primjer, zamislite da 95% CI (95% CI) za hemoglobin iznosi 110 do 122 g / L. To znači da će s vjerojatnosti od 95%prava prosječna vrijednost hemoglobina u općoj populaciji biti u rasponu od 110 do 122 g / l. Drugim riječima, ne znamo prosječni hemoglobin u općoj populaciji, ali sa 95% vjerojatnosti možemo naznačiti raspon vrijednosti za ovu osobinu.

Interval povjerenja posebno je relevantan za razliku u sredstvima između skupina, ili kako se to naziva, u veličini učinka.

Recimo da smo uspoređivali učinkovitost dva pripravka željeza: jednog koji je već dugo na tržištu i drugog koji je tek registriran. Nakon tijeka terapije, procijenjena je koncentracija hemoglobina u ispitivanim skupinama pacijenata, a statistički je program izračunao da je razlika između srednjih vrijednosti dviju skupina s 95% -tnom vjerojatnošću u rasponu od 1,72 do 14,36 g / l (Tablica 1).

Tab. 1. Kriterij za neovisne uzorke
(uspoređene grupe prema razini hemoglobina)

To treba tumačiti na sljedeći način: u nekih pacijenata opće populacije koji uzimaju novi lijek hemoglobin će u prosjeku biti veći za 1,72–14,36 g / l nego u onih koji su uzimali već poznati lijek.

Drugim riječima, u općoj populaciji razlika u srednjim vrijednostima hemoglobina u skupinama sa 95% -tnom vjerojatnošću je unutar ovih granica. Na istraživaču će procijeniti je li to puno ili malo. Poanta svega ovoga je da ne radimo s jednom prosječnom vrijednošću, već s rasponom vrijednosti, stoga pouzdanije procjenjujemo razliku u parametrima među skupinama.

U statističkim paketima, prema nahođenju istraživača, možete neovisno suziti ili proširiti granice intervala pouzdanosti. Smanjujući vjerojatnost intervala povjerenja, sužavamo raspon sredstava. Na primjer, pri 90% CI, raspon srednjih vrijednosti (ili razlika u sredstvima) bit će uži nego kod 95%.

Nasuprot tome, povećanje vjerojatnosti na 99% proširuje raspon vrijednosti. Prilikom usporedbe skupina, donja granica CI -ja može prijeći nultu oznaku. Na primjer, ako smo interval pouzdanosti proširili na 99%, tada su granice intervala bile od –1 do 16 g / L. To znači da u općoj populaciji postoje skupine, razlika između sredina između kojih je za proučavani atribut jednak 0 (M = 0).

Pomoću intervala pouzdanosti možete provjeriti statističke hipoteze. Ako interval pouzdanosti prijeđe nulu, tada je nulta hipoteza, koja pretpostavlja da se skupine ne razlikuju u proučavanom parametru, točna. Gore je opisan primjer kada smo granice proširili na 99%. Negdje u općoj populaciji pronašli smo skupine koje se ni po čemu nisu razlikovale.

95% interval pouzdanosti razlike u hemoglobinu, (g / l)


Na slici, linija prikazuje interval pouzdanosti od 95% za razliku u srednjim vrijednostima hemoglobina između dviju skupina. Linija prelazi nultu oznaku, stoga postoji razlika između srednjih vrijednosti jednakih nuli, što potvrđuje nultu hipotezu da se skupine ne razlikuju. Raspon razlika između skupina je od –2 do 5 g / l, što znači da se hemoglobin može ili smanjiti za 2 g / l ili povećati za 5 g / l.

Interval pouzdanosti vrlo je važna metrika. Zahvaljujući njemu možete vidjeti jesu li razlike u skupinama doista nastale zbog razlike u sredstvima ili zbog velikog uzorka, budući da su s velikim uzorkom šanse za pronalaženje razlika veće nego s malim.

U praksi bi to moglo izgledati ovako. Uzeli smo uzorak od 1000 ljudi, izmjerili razinu hemoglobina i ustanovili da je interval pouzdanosti za razliku u sredstvima od 1,2 do 1,5 g / L. Razina statističke značajnosti u ovom slučaju str

Vidimo da se koncentracija hemoglobina povećala, ali gotovo neprimjetno, pa se statistička značajnost pojavila upravo zbog veličine uzorka.

Interval povjerenja može se izračunati ne samo za srednje vrijednosti, već i za proporcije (i omjere rizika). Na primjer, zanima nas interval pouzdanosti udjela pacijenata koji su postigli remisiju tijekom uzimanja razvijenog lijeka. Pretpostavimo da 95% CI za omjere, odnosno za udio takvih pacijenata, leži u rasponu od 0,60-0,80. Dakle, možemo reći da naš lijek ima terapeutski učinak u 60 do 80% slučajeva.