Pasitikėjimo intervalas yra fiziko skaičiavimo formulė. Pasitikėjimo intervalo konstravimas, atsižvelgiant į matematinius bendros populiacijos lūkesčius. Pasitikėjimo intervalo metodas

Paskutinį kartą atnaujinta: 2020 m. Kovo 3 d
Failo pavyzdys

Sukurkime patikimumo intervalą MS EXCEL, kad įvertintume vidutinę pasiskirstymo vertę žinomos svarbos dispersija.

Žinoma pasirinkimas pasitikėjimo lygis visiškai priklauso nuo problemos sprendimo. Taigi, neabejotinai, lėktuvo keleivio pasitikėjimo orlaivio patikimumu laipsnis turėtų būti didesnis nei pirkėjo pasitikėjimo lemputės patikimumo laipsniu.

Pareiškimas apie problemą

Tarkime, kad nuo bendros populiacijos paėmęs pavyzdys dydis n. Manoma, kad standartinis nuokrypisšis pasiskirstymas žinomas. Remiantis tuo būtina mėginių ėmimasįvertinti nežinomą vidutinis pasiskirstymas(μ,) ir sukonstruokite atitinkamą dvipusispasitikėjimo intervalas .

Taško įvertinimas

Kaip žinoma iš, statistika(mes tai žymime X trečiadienis) yra nešališkas vidurkio įvertinimas tai bendros populiacijos ir turi skirstinį N (μ; σ 2 / n).

Pastaba : Ką daryti, jei reikia statyti pasitikėjimo intervalas paskirstymo atveju, kad nėranormalus?Šiuo atveju jis ateina į gelbėjimą, kuris sako, kad su pakankamai dideliu dydžiu mėginių ėmimas n iš paskirstymo nebuvimasnormalus , imties statistikos pasiskirstymas X vid valia maždaug atitikti normalus skirstinys su parametrais N (μ; σ 2 / n).

Taigi, taško sąmatąviduryspasiskirstymo vertes mes turime - tai imties vidurkis, t.y. X trečiadienis... Dabar pereikime prie pasitikėjimo intervalas.

Pasitikėjimo intervalo brėžimas

Paprastai, žinodami pasiskirstymą ir jo parametrus, galime apskaičiuoti tikimybę, kad atsitiktinis kintamasis paims reikšmę iš mūsų nurodyto intervalo. Dabar darykime priešingai: surask intervalą, kuriuo atsitiktinis kintamasis pateks su tam tikra tikimybe. Pavyzdžiui, iš savybių normalus skirstinysžinoma, kad esant 95%tikimybei atsitiktinis kintamasis pasiskirstęs normali teisė, bus maždaug +/- 2 diapazone nuo vidutinė vertė(žr. straipsnį apie). Šis intervalas mums bus prototipas pasitikėjimo intervalas .

Dabar išsiaiškinkime, ar žinome pasiskirstymą , apskaičiuoti šį intervalą? Norėdami atsakyti į klausimą, turime nurodyti pasiskirstymo formą ir jos parametrus.

Mes žinome platinimo formą - ji yra normalus skirstinys(prisiminkime, kad mes kalbame apie mėginių paskirstymasstatistikaX trečiadienis).

Mes nežinome parametro μ (jį reikia tik įvertinti naudojant pasitikėjimo intervalas), bet mes turime jo sąmatą X trečiadienis, apskaičiuotas remiantis mėginių ėmimas, kuriomis galima naudotis.

Antrasis parametras yra imties vidurkio standartinis nuokrypislaikysime tai žinoma, jis lygus σ / √n.

Kadangi mes nežinome μ, tada sukonstruosime intervalą +/- 2 standartiniai nuokrypiai ne iš vidutinė vertė ir iš jo žinomo įvertinimo X trečiadienis... Tie. skaičiuojant pasitikėjimo intervalas mes to nemanysime X trečiadienis patenka į +/- 2 standartiniai nuokrypiai nuo μ su 95%tikimybe, ir mes manysime, kad intervalas +/- 2 standartiniai nuokrypiai nuo X trečiadienis su 95% tikimybe apims μ - visų gyventojų vidurkis, iš kurio jis paimtas pavyzdys... Šie du teiginiai yra lygiaverčiai, tačiau antrasis teiginys leidžia mums sukonstruoti pasitikėjimo intervalas .

Be to, patiksliname intervalą: atsitiktinis kintamasis, paskirstytas per normali teisė, tikimybė 95% patenka į intervalą +/- 1,960 standartiniai nuokrypiai, ne +/- 2 standartiniai nuokrypiai... Tai galima apskaičiuoti naudojant formulę = NORM.ST.OBR ((1 + 0,95) / 2), cm. pavyzdinis failas Lapų tarpai .

Dabar galime suformuluoti tikimybinį teiginį, kuris mums padės pasitikėjimo intervalas: „Tikimybė, kad gyventojų vidurkis yra iš vidutinis pavyzdys per 1 960 colių imties standartiniai nuokrypiai " yra lygus 95% “.

Pareiškime minima tikimybės vertė turi specialų pavadinimą kuris yra susijęs su reikšmingumo lygis α (alfa) paprasta išraiška pasitikėjimo lygis = 1 . Mūsų atveju reikšmingumo lygis α =1-0,95=0,05 .

Dabar, remdamiesi šiuo tikimybiniu teiginiu, užrašome skaičiavimo išraišką pasitikėjimo intervalas :

kur Z α / 2 standartasnormalus skirstinys(tokia atsitiktinio kintamojo vertė z , P (z >= Z α / 2 ) = α / 2).

Pastaba : Viršutinė α / 2-kvantilė nustato plotį pasitikėjimo intervalas v standartiniai nuokrypiaiimties vidurkis. Viršutinė α / 2-kvantilė standartasnormalus skirstinys visada didesnis nei 0, o tai labai patogu.

Mūsų atveju α = 0,05, viršutinis α / 2-kvantilis yra lygus 1,960. Kiti reikšmingumo lygiai α (10%; 1%) viršutinis α / 2-kvantilisZ α / 2 galima apskaičiuoti naudojant formulę = STANDARTINIS ST.OBR (1-α / 2) arba jei žinoma pasitikėjimo lygis , = NORM.ST.OBR ((1 + pasitikėjimo lygis) / 2) .

Paprastai statant pasitikėjimo intervalai vidurkiui įvertinti naudoti tik viršutinė α /2- kvantilis ir nenaudokite apatinis α /2- kvantilis... Tai įmanoma, nes standartasnormalus skirstinys simetriškai aplink x ašį ( jo pasiskirstymo tankis simetriškas jo atžvilgiu vidutinis, t.y. 0) . Todėl nereikia skaičiuoti mažesnis α / 2-kvantilis(jis tiesiog vadinamas α / 2-kvantilis), nes jis yra lygus viršutinė α /2- kvantilis su minuso ženklu.

Prisiminkite, kad, nepaisant dydžio x pasiskirstymo formos, atitinkamas atsitiktinis kintamasis X trečiadienis platinamas maždauggerai N (μ; σ 2 / n) (žr. Straipsnį apie). Todėl bendruoju atveju aukščiau pateikta išraiška pasitikėjimo intervalas yra tik apytikslis. Jei kiekis x paskirstomas normali teisė N (μ; σ 2 / n), tada išraiška pasitikėjimo intervalas yra tikslus.

Pasitikėjimo intervalo apskaičiavimas MS EXCEL

Išspręskime problemą. Atsakymo laikas elektroninis komponentasįėjimo signalas yra svarbi prietaiso charakteristika. Inžinierius nori sudaryti 95% patikimumo intervalo vidutinio atsako laiko patikimumo intervalą. Iš ankstesnės patirties inžinierius žino, kad standartinis atsako laiko nuokrypis yra 8 ms. Yra žinoma, kad inžinierius atliko 25 matavimus, kad įvertintų atsako laiką, vidutinė vertė buvo 78 ms.

Sprendimas: Inžinierius nori žinoti elektroninio prietaiso atsako laiką, tačiau supranta, kad atsako laikas yra ne fiksuotas, o atsitiktinis kintamasis, kuris turi savo pasiskirstymą. Taigi geriausia, kuo jis gali pasikliauti, yra nustatyti šio pasiskirstymo parametrus ir formą.

Deja, iš problemos teiginio mes nežinome atsako laiko pasiskirstymo formos (ji neturi būti) normalus). , šis pasiskirstymas taip pat nežinomas. Žinomas tik jam standartinis nuokrypisσ = 8. Todėl kol negalėsime apskaičiuoti tikimybių ir statyti pasitikėjimo intervalas .

Tačiau, nepaisant to, kad mes nežinome pasiskirstymo laikasatskiras atsakymas, mes žinome, kad pagal CPT , mėginių paskirstymasvidutinis atsako laikas yra maždaug normalus(manysime, kad sąlygos CPT atliekami, nes dydis mėginių ėmimas pakankamai didelis (n = 25)) .

Be to, Vidutinisšio paskirstymo yra vidutinis vieno atsako paskirstymas, t.y. μ. A standartinis nuokrypisšio skirstinio (σ / √n) galima apskaičiuoti pagal formulę = 8 / ROOT (25).

Taip pat žinoma, kad inžinierius gavo taško sąmatą parametras μ lygus 78 ms (X plg.). Todėl dabar galime apskaičiuoti tikimybes, nes mes žinome platinimo formą ( normalus) ir jo parametrus (X cf ir σ / √n).

Inžinierius nori žinoti tikėtina vertėμ atsako laiko pasiskirstymo. Kaip minėta aukščiau, šis μ yra lygus vidutinio atsako laiko imties pasiskirstymo matematiniai lūkesčiai... Jei naudosime normalus skirstinys N (X cf; σ / √n), tada norimas μ bus diapazone +/- 2 * σ / √n su maždaug 95%tikimybe.

Reikšmingumo lygis yra lygus 1-0,95 = 0,05.

Galiausiai raskite kairę ir dešinę sieną pasitikėjimo intervalas... Kairioji siena: = 78-STANDARTINIS ST.OBR (1-0.05 / 2) * 8 / ROOT (25) = 74,864 Dešinė siena: = 78 + NORM.ST.OBR (1-0.05 / 2) * 8 / ROOT (25) = 81.136

Kairioji siena: = NORM.OBR (0,05 / 2; 78; 8 / ROOT (25)) Dešinė siena: = NORM.INV (1-0.05 / 2; 78; 8 / ROOT (25))

Atsakymas : pasitikėjimo intervalas adresu patikimumo lygis 95% ir σ =8 ms yra lygus 78 +/- 3,136 ms.

V pavyzdinis failas „Sigma“ darbalapyježinoma skaičiavimo ir konstravimo forma dvišalispasitikėjimo intervalas už savavališkumą pavyzdžiai su duotu σ ir reikšmingumo lygis .

CONFIDENCE.NORM () funkcija

Jei vertybės mėginių ėmimas yra diapazone B20: B79 , a reikšmingumo lygis lygus 0,05; tada MS EXCEL formulė: = VIDUTINIS (B20: B79) -TRUST.NORM (0,05, σ, COUNT (B20: B79)) grąžins kairę sieną pasitikėjimo intervalas .

Tą pačią ribą galima apskaičiuoti pagal formulę: = VIDUTINIS (B20: B79) -NORM.ST.INV (1-0.05 / 2) * σ / ŠAKNIS (SKAIČIUS (B20: B79))

Pastaba: Funkcija CONFIDENCE.NORM () pasirodė programoje MS EXCEL 2010. Ankstesnėse MS EXCEL versijose buvo naudojama funkcija CONFIDENCE ().

Ankstesniuose poskyriuose mes svarstėme nežinomo parametro įvertinimo klausimą a vienas skaičius. Šis įvertinimas vadinamas „tašku“. Atliekant daugybę užduočių, reikia ne tik rasti parametrą a tinkama skaitinė vertė, tačiau taip pat įvertinkite jos tikslumą ir patikimumą. Norite sužinoti, kokias klaidas gali sukelti parametrų pakeitimas a jo taškinis įvertis a ir kokiu tikrumu galime tikėtis, kad šios klaidos išliks žinomose ribose?

Tokios problemos ypač aktualios nedaugeliui stebėjimų, kai įvertinamas taškas ir į didžiąja dalimi tai atsitiktinė ir apytikslis pakeitimas a gali sukelti rimtų klaidų.

Suteikti idėją apie vertinimo tikslumą ir patikimumą a,

matematinėje statistikoje naudojami vadinamieji pasitikėjimo intervalai ir patikimumo tikimybės.

Leiskite nustatyti parametrą a iš patirties nešališkas įvertinimas a. Norime įvertinti galimą klaidą šiuo atveju. Priskirkime pakankamai didelę tikimybę p (pvz., P = 0,9, 0,95 arba 0,99), kad įvykis su tikimybe p galėtų būti laikomas praktiškai patikimu, ir suraskime tokią reikšmę s, kuriai

Tada praktiškai galimų klaidos verčių diapazonas, atsirandantis keičiant a ant a, bus ± s; didelės absoliučios vertės klaidos atsiras tik su maža tikimybe a = 1 - p. Perrašykime (14.3.1) taip:

Lygybė (14.3.2) reiškia, kad su tikimybe p nežinoma parametro vertė a patenka į intervalą

Šiuo atveju reikia pažymėti vieną aplinkybę. Anksčiau mes ne kartą svarstėme atsitiktinio kintamojo patekimo į tam tikrą neatsitiktinį intervalą tikimybę. Čia situacija kitokia: kiekis a neatsitiktinis, bet intervalas / p yra atsitiktinis. Atsitiktinai jo padėtis abscisės ašyje, nustatoma pagal jos centrą a; intervalo 2s ilgis apskritai taip pat yra atsitiktinis, nes s vertė paprastai apskaičiuojama pagal eksperimentinius duomenis. Todėl šiuo atveju geriau būtų p reikšmę interpretuoti ne kaip tikimybę „pataikyti“ į tašką aį intervalą / p ir kaip tikimybę, kad atsitiktinis intervalas / p apims tašką a(14.3.1 pav.).

Ryžiai. 14.3.1

Dažniausiai vadinama tikimybė p pasitikėjimo lygis, o intervalas / p yra pasitikėjimo intervalas. Intervalo ribos Jei. a x = a- smėlis a 2 = a + bet paskambino pasitikėjimo ribos.

Pateikime dar vieną patikimumo intervalo sąvokos interpretaciją: ji gali būti laikoma parametrų verčių intervalu a, suderinamas su eksperimentiniais duomenimis ir jiems neprieštarauja. Iš tiesų, jei sutinkame, kad įvykis, kurio tikimybė a = 1-p, yra praktiškai neįmanomas, tai tos parametro a vertės, kurioms a - a> s, turi būti pripažinti prieštaraujančiais eksperimentiniams duomenims, ir tie, kuriems | a - a a t na 2.

Leiskite nustatyti parametrą a yra nešališkas įvertinimas a. Jei žinotume kiekio pasiskirstymo dėsnį a, pasitikėjimo intervalo paieškos problema būtų labai paprasta: užtektų rasti tokią s reikšmę, kuriai

Sunkumas yra tas, kad sąmatos pasiskirstymo įstatymas a priklauso nuo kiekio paskirstymo dėsnio X ir dėl to nežinomų jo parametrų (ypač paties parametro) a).

Norėdami išspręsti šią problemą, galite taikyti tokį apytikslį apytikslį: nežinomus s išraiškos parametrus pakeiskite jų taškiniais įvertinimais. Su palyginti daug eksperimentų NS(apie 20 ... 30) ši technika dažniausiai duoda patenkinamus rezultatus tikslumo požiūriu.

Pavyzdžiui, apsvarstykite matematinių lūkesčių pasitikėjimo intervalo problemą.

Tegul jis gaminamas NS X, kurių charakteristikos yra matematiniai lūkesčiai T ir dispersija D- nežinoma. Šiems parametrams buvo gauti šie įvertinimai:

Matematiniams lūkesčiams reikia sukurti patikimumo intervalą / p, atitinkantį patikimumo tikimybę p T dydžių X.

Spręsdami šią problemą, naudosime tai, kad kiekis T reiškia sumą NS nepriklausomi identiškai pasiskirstę atsitiktiniai kintamieji X val ir pagal centrinę ribos teoremą pakankamai didelei NS jo platinimo dėsnis artimas normaliam. Praktiškai, net ir turint palyginti nedidelį terminų skaičių (apie 10 ... 20), sumos paskirstymo dėsnis gali būti laikomas maždaug normaliu. Mes remiamės tuo, kad kiekis T platinamas pagal įprastą teisę. Šio dėsnio charakteristikos - matematiniai lūkesčiai ir dispersija - yra atitinkamai vienodi T ir

(žr. 13 skyriaus 13.3 poskirsnį). Tarkime, kad kiekis D mes žinome ir randame tokią vertę Ep, dėl kurios

Taikydami 6 skyriaus formulę (6.3.5), tikimybę (14.3.5) kairėje pusėje išreiškiame normaliojo pasiskirstymo funkcija

kur yra standartinis sąmatos nuokrypis T.

Iš lygties

randame Sp vertę:

kur arg Ф * (х) yra verse * atvirkštinė funkcija (NS), tie. tokia argumento vertė, kurios normaliojo skirstinio funkcija yra lygi NS.

Dispersija D, per kurią išreiškiama vertė a 1P, mes tiksliai nežinome; kaip apytikslę vertę galite naudoti įvertinimą D(14.3.4) ir įdėti maždaug:

Taigi pasitikėjimo intervalo sudarymo problema buvo maždaug išspręsta, kuri yra lygi:

kur gp apibrėžiama pagal formulę (14.3.7).

Siekiant išvengti atvirkštinės interpoliacijos funkcijos Ф * (л) lentelėse skaičiuojant s p, patogu sudaryti specialią lentelę (14.3.1 lentelė), kurioje pateikiamos kiekio vertės

priklausomai nuo p. Kiekis (p normaliam įstatymui nustato standartinių nuokrypių, kurie turi būti atidėti į dešinę ir kairę nuo sklaidos centro, skaičių, kad tikimybė pataikyti į gautą plotą būtų lygi p.

Per 7 p reikšmę patikimumo intervalas išreiškiamas taip:

14.3.1 lentelė

1 pavyzdys. Atlikta 20 eksperimentų su verte X; rezultatai pateikti lentelėje. 14.3.2.

14.3.2 lentelė

Būtina rasti matematinio kiekio lūkesčio įvertinimą X ir sukurkite patikimumo intervalą, atitinkantį p = 0,8 patikimumo lygį.

Sprendimas. Mes turime:

Pasirinkę kaip kilmę l: = 10, pagal trečiąją formulę (14.2.14) randame nešališką įvertį D :

Pagal lentelę. 14.3,1 rasti

Pasitikėjimo ribos:

Pasitikėjimo intervalas:

Parametrų reikšmės T,Šiame intervale esantys duomenys atitinka lentelėje pateiktus eksperimentinius duomenis. 14.3.2.

Pasitikėjimo intervalas dispersijai gali būti sudarytas panašiai.

Tegul jis gaminamas NS nepriklausomi atsitiktinio kintamojo eksperimentai X su nežinomais parametrais nuo ir A, ir dėl dispersijos D gaunamas nešališkas įvertinimas:

Būtina apytiksliai sudaryti dispersijos patikimumo intervalą.

Iš formulės (14.3.11) matyti, kad kiekis D atstovauja

suma NS formos atsitiktiniai kintamieji. Šie kiekiai nėra

nepriklausomas, nes bet kuris iš jų apima kiekį T, priklausomas nuo visų kitų. Tačiau galima parodyti, kad didėjant NS jų sumos paskirstymo dėsnis taip pat artimas normaliai. Praktiškai adresu NS= 20 ... 30 tai jau galima laikyti normalia.

Tarkime, kad taip yra, ir suraskime šio dėsnio ypatybes: matematinius lūkesčius ir dispersiją. Nuo balo D- tada nešališkas M [D] = D.

Skaičiuojant dispersiją D D yra susijęs su gana sudėtingais skaičiavimais, todėl pateikiame jo išraišką be išvesties:

kur q 4 yra ketvirtas centrinis kiekio momentas X.

Norėdami naudoti šią išraišką, turite pakeisti reikšmes 4 ir D(bent apytiksliai). Vietoj D galite naudoti jo sąmatą D. Iš esmės ketvirtąjį centrinį momentą taip pat galima pakeisti įvertinimu, pavyzdžiui, formos reikšme:

tačiau toks pakeitimas suteiks itin mažą tikslumą, nes apskritai, atliekant ribotą eksperimentų skaičių, aukšto lygio momentai nustatomi su didelėmis klaidomis. Tačiau praktikoje dažnai atsitinka, kad kiekio pasiskirstymo dėsnio forma Xžinoma iš anksto: nežinomi tik jo parametrai. Tada galite pabandyti išreikšti q 4 terminais D.

Paimkime dažniausią atvejį, kai kiekis X platinamas pagal įprastą teisę. Tada jo ketvirtasis centrinis momentas išreiškiamas dispersija (žr. 6 skyriaus 6.2 poskirsnį);

ir formulė (14.3.12) suteikia arba

Pakeitus (14.3.14) nežinomą D jo įvertinimas D, gauname: iš kur

Akimirka c 4 gali būti išreikšta D taip pat kai kuriais kitais atvejais, kai paskirstomas kiekis X nėra normalu, tačiau jo išvaizda žinoma. Pavyzdžiui, dėl vienodo tankio dėsnio (žr. 5 skyrių) turime:

kur (a, P) yra dėsnio nustatymo intervalas.

Vadinasi,

Pagal formulę (14.3.12) gauname: iš kur randame maždaug

Tais atvejais, kai 26 platinimo dėsnio forma nežinoma, vis tiek rekomenduojama naudoti formulę (14.3.16) apytiksliai apskaičiuojant a /) vertę, nebent yra ypatingų priežasčių manyti, kad šis įstatymas labai skiriasi nuo normalus (turi pastebimą teigiamą ar neigiamą perteklių) ...

Jei vienaip ar kitaip gaunama apytikslė a /) vertė, tai galima sukurti dispersijos patikimumo intervalą taip pat, kaip mes jį sukūrėme matematiniams lūkesčiams:

kur reikšmė, priklausomai nuo pateiktos tikimybės p, randama pagal lentelę. 14.3.1.

2 pavyzdys. Raskite atsitiktinio kintamojo dispersijos maždaug 80% patikimumo intervalą X 1 pavyzdžio sąlygomis, jei žinoma, kad kiekis X platinamas pagal artimą normaliam įstatymą.

Sprendimas. Vertė išlieka tokia pati kaip lentelėje. 14.3.1:

Pagal formulę (14.3.16)

Naudodami formulę (14.3.18), randame pasitikėjimo intervalą:

Atitinkamas standartinio nuokrypio verčių diapazonas: (0,21; 0,29).

14.4. Tikslūs atsitiktinio kintamojo parametrų, paskirstytų pagal įprastą įstatymą, patikimumo intervalų sudarymo metodai

Ankstesniame poskyryje apžvelgėme apytikslius lūkesčių ir dispersijos pasitikėjimo intervalų sudarymo metodus. Čia mes suteiksime idėją apie tikslius tos pačios problemos sprendimo būdus. Pabrėžiame, kad norint tiksliai rasti pasitikėjimo intervalus, būtina iš anksto žinoti kiekio pasiskirstymo įstatymo formą X, kadangi taikant apytikslius metodus tai nebūtina.

Tikslių pasitikėjimo intervalų sudarymo metodų idėja yra tokia. Bet koks pasitikėjimo intervalas randamas pagal sąlygą, išreiškiančią tikimybę įvykdyti tam tikras nelygybes, įskaitant mus dominančio įvertinimo įvertinimą a. Sąmatų paskirstymo įstatymas a bendruoju atveju priklauso nuo nežinomų kiekio parametrų X. Tačiau kartais nelygybę galima perkelti iš atsitiktinio kintamojo aį kai kurias kitas stebimų verčių funkcijas X n X 2, ..., X psl. kurio paskirstymo dėsnis nepriklauso nuo nežinomų parametrų, o priklauso tik nuo eksperimentų skaičiaus ir nuo kiekio pasiskirstymo dėsnio formos X. Tokie atsitiktiniai kintamieji vaidina svarbų vaidmenį matematinėje statistikoje; jie buvo išsamiai ištirti normaliam kiekio pasiskirstymui X.

Pavyzdžiui, buvo įrodyta, kad normaliam kiekio paskirstymui X atsitiktinė vertė

paklūsta vadinamiesiems Studentų platinimo įstatymas su NS- 1 laisvės laipsnis; šio dėsnio tankis turi formą

kur Г (х) yra žinoma gama funkcija:

Taip pat buvo įrodyta, kad atsitiktinis kintamasis

turi „paskirstymą% 2“ su NS- 1 laisvės laipsnis (žr. 7 skyrių), kurio tankis išreiškiamas formule

Nesigilindami į skirstinių darinius (14.4.2) ir (14.4.4), parodome, kaip jie gali būti taikomi kuriant parametrų patikimumo intervalus tai D.

Tegul jis gaminamas NS nepriklausomi atsitiktinio kintamojo eksperimentai X, platinamas pagal įprastą įstatymą su nežinomais parametrais tio.Šiems parametrams buvo gauti įverčiai

Būtina sudaryti abiejų parametrų patikimumo intervalus, atitinkančius patikimumo tikimybę p.

Pirmiausia sukonstruokime matematinių lūkesčių pasitikėjimo intervalą. Natūralu, kad šis intervalas yra simetriškas T; žymėkite s p puse intervalo ilgio. Reikšmė s p turi būti pasirinkta taip, kad sąlyga

Pabandykime iš atsitiktinio kintamojo perduoti kairę lygybės pusę (14.4.5) Tį atsitiktinį kintamąjį T, platinamas pagal Studento įstatymus. Norėdami tai padaryti, padauginame abi nelygybės puses | m-w? |

pagal teigiamą vertę: arba, naudojant žymėjimą (14.4.1),

Raskime tokį skaičių / p, kad reikšmė / p būtų rasta iš sąlygos

Iš formulės (14.4.2) matyti, kad (1) yra lyginė funkcija, todėl (14.4.8) suteikia

Lygybė (14.4.9) nustato / p reikšmę, priklausomai nuo p. Jei turite integralo reikšmių lentelę

tada / p reikšmę galima rasti atvirkštine interpoliacija lentelėje. Tačiau patogiau iš anksto sudaryti / p reikšmių lentelę. Tokia lentelė pateikta priede (5 lentelė). Šioje lentelėje parodytos vertės, priklausančios nuo pasitikėjimo tikimybės p ir laisvės laipsnių skaičiaus NS- 1. Nustatę / p pagal lentelę. 5 ir darant prielaidą

rasime pusę pasitikėjimo intervalo pločio / p ir paties intervalo

1 pavyzdys. Atliko 5 nepriklausomus atsitiktinio kintamojo eksperimentus X, paprastai paskirstomas nežinomais parametrais T ir apie. Eksperimentų rezultatai pateikti lentelėje. 14.4.1.

14.4.1 lentelė

Raskite pažymį T matematiniam lūkesčiui ir sukurkite jam 90% patikimumo intervalą / p (t. y. intervalą, atitinkantį patikimumo tikimybę p = 0,9).

Sprendimas. Mes turime:

Pagal 5 lentelę pateiktos paraiškos NS - 1 = 4 ir p = 0,9 randame kur

Pasitikėjimo intervalas bus

2 pavyzdys. 14.3 poskirsnio 1 pavyzdžio sąlygomis, darant prielaidą, kad vertė X pasiskirstę normaliai, suraskite tikslų pasitikėjimo intervalą.

Sprendimas. Pagal 5 lentelę randame programų NS - 1 = 19ir =

0,8 / p = 1,328; iš čia

Palyginus su 14.3 poskirsnio 1 pavyzdžio sprendimu (e p = 0,072), mes įsitikinę, kad neatitikimas yra labai nereikšmingas. Jei tikslumą išlaikysime iki antros dešimtosios dalies, tada tikslumo ir apytiksliais metodais rasti pasitikėjimo intervalai sutaps:

Pereikime prie dispersijos patikimumo intervalo sudarymo. Apsvarstykite nešališką dispersijos įvertinimą

ir išreikšti atsitiktinį kintamąjį D per vertę V(14.4.3), kurio pasiskirstymas x 2 (14.4.4):

Žinant kiekio pasiskirstymo dėsnį V, galima rasti intervalą / (1, kuriame jis patenka su duota tikimybe p.

Platinimo įstatymas k n _ x (v) kiekis I 7 yra tokios formos, kaip parodyta fig. 14.4.1.

Ryžiai. 14.4.1

Kyla klausimas: kaip pasirinkti intervalą / p? Jei kiekio paskirstymo dėsnis V buvo simetriškas (kaip ir įprastas dėsnis ar Studento pasiskirstymas), būtų natūralu, kad intervalas / p būtų simetriškas matematinių lūkesčių atžvilgiu. Šiuo atveju įstatymas k n _ x (v) asimetriškas. Sutikime pasirinkti intervalą / p, kad kiekio išvesties tikimybės V už intervalo į dešinę ir į kairę (tamsintos sritys 14.4.1 pav.) buvo vienodos ir lygios

Norėdami sukurti intervalą / p su šia savybe, naudosime lentelę. 4 priedai: jame išvardyti skaičiai y) toks kad

už vertę V, turintis x 2 -pasiskirstymą su r laisvės laipsniais. Mūsų atveju r = n- 1. Ištaisykime r = n- 1 ir suraskite atitinkamoje lentelės eilutėje. 4 dvi reikšmės x 2 - vienas atitinka tikimybę kitas - tikimybės Pažymėkime šias

reikšmę 2 ir xl? Intervalas turi 2 val., jo kairė, ir y ~ teisingas galas.

Dabar suraskime norimą patikimumo intervalą / | dispersijai su ribomis D ir D 2, kuri apima esmę D su tikimybe p:

Sukurkime tokį intervalą / (, = (?> B A), kuris apima tašką D jei ir tik jei kiekis V patenka į intervalą / p. Parodykime tą intervalą

atitinka šią sąlygą. Iš tiesų, nelygybė yra lygus nelygybei

ir šios nelygybės tenkinamos tikimybe p. Taigi dispersijos patikimumo intervalas randamas ir išreiškiamas formule (14.4.13).

3 pavyzdys. Raskite dispersijos patikimumo intervalą pagal 14.3 poskirsnio 2 pavyzdžio sąlygas, jei žinoma, kad reikšmė X paskirstomas normaliai.

Sprendimas. Mes turime ... Pagal priedo 4 lentelę

randame adresu r = n - 1 = 19

Naudodami formulę (14.4.13), randame dispersijos patikimumo intervalą

Atitinkamas standartinio nuokrypio intervalas: (0,21; 0,32). Šis intervalas tik šiek tiek viršija intervalą (0,21; 0,29), gautą 14.3 poskirsnio 2 pavyzdyje apytiksliu metodu.

  • 14.3.1 paveiksle yra patikimumo intervalas, kuris yra simetriškas apie a. Apskritai, kaip pamatysime vėliau, tai neprivaloma.

Pasitikėjimo intervalas(CI; anglų kalba pasitikėjimo intervalas - CI), gautas atliekant tyrimą su imtimi, parodo tyrimo rezultatų tikslumo (arba neapibrėžtumo) matą, kad būtų galima padaryti išvadas apie visų tokių pacientų populiaciją (bendrą populiaciją). Teisingas 95% PI apibrėžimas gali būti suformuluotas taip: 95% tokių intervalų bus pateikta tikroji populiacijos vertė. Šis aiškinimas yra šiek tiek mažiau tikslus: CI yra verčių diapazonas, per kurį galima 95% įsitikinti, kad jame yra tikroji vertė. Naudojant KI, pagrindinis dėmesys skiriamas poveikio kiekybiniam įvertinimui, o ne P reikšmei, gautai tikrinant statistinį reikšmingumą. P reikšmė nematuoja jokio kiekio, bet yra įrodymų stiprumo matas prieš nulinę hipotezę „jokio poveikio“. P reikšmė pati savaime nieko nesako apie skirtumo dydį ar net apie jo kryptį. Todėl nepriklausomos P vertės straipsniuose ar santraukose yra visiškai neinformatyvios. Priešingai, CI nurodo tiek tiesioginio susidomėjimo poveikio dydį, pavyzdžiui, gydymo naudingumą, tiek įrodymų stiprumą. Todėl BĮ yra tiesiogiai susijusi su EBM praktika.

Vertinimo metodas Statistinė analizė, iliustruota KI, siekiama išmatuoti dominančio poveikio dydį (diagnostinio testo jautrumą, prognozuojamų atvejų dažnumą, santykinės gydymo rizikos sumažėjimą ir kt.), taip pat įvertinti šios srities neapibrėžtumą. poveikis. Dažniausiai PI yra verčių diapazonas abiejose sąmatos pusėse, kuriose tikėtina vertė slypi, ir jūs galite būti tuo tikri 95%. Susitarimas savavališkai naudoti 95% tikimybę, taip pat P reikšmę<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

KI yra pagrįstas idėja, kad tas pats tyrimas, atliktas su kitais pacientų mėginiais, nesukeltų identiškų rezultatų, tačiau jų rezultatai būtų paskirstyti pagal tikrąją, bet nežinomą vertę. Kitaip tariant, KI tai apibūdina kaip „nuo mėginio priklausomą kintamumą“. KI neatspindi papildomo neapibrėžtumo dėl kitų priežasčių; visų pirma, į tai neįtraukiamas selektyvaus paciento praradimo poveikis stebint, blogai laikomasi ar netiksliai įvertinant rezultatus, aklumo nebuvimas ir pan. Taigi KI visada nepakankamai įvertina bendrą neapibrėžtumo sumą.

Pasitikėjimo intervalo apskaičiavimas

A1.1 lentelė. Standartinės kai kurių klinikinių matavimų klaidos ir patikimumo intervalai

Paprastai PI apskaičiuojamas pagal stebimą kiekybinio mato įvertinimą, pvz., Skirtumą (d) tarp dviejų proporcijų ir standartinę šio skirtumo įvertinimo paklaidą (SE). Taip gautas apytikslis 95% PI yra d ± 1,96 SE. Formulė keičiasi atsižvelgiant į rezultato mato pobūdį ir KI apimtį. Pavyzdžiui, atsitiktinių imčių, placebu kontroliuojamo ląstelinio kokliušo vakcinos tyrimo metu 72 iš 1670 (4,3%) kūdikių, gavusių vakciną, išsivystė kokliušas ir 240 iš 1665 (14,4%) kontrolinių medžiagų. Procentų skirtumas, žinomas kaip absoliutus rizikos sumažėjimas, yra 10,1%. Šio skirtumo SE yra 0,99%. Atitinkamai 95% PI yra 10,1% + 1,96 x 0,99%, t.y. nuo 8,2 iki 12,0.

Nepaisant skirtingų filosofinių požiūrių, CI ir statistinio reikšmingumo testai yra glaudžiai susiję matematiškai.

Taigi P reikšmė yra „reikšminga“; R<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

Įvertinimo neapibrėžtumas (neapibrėžtumas), išreikštas CI, iš esmės susijęs su imties dydžio kvadratine šaknimi. Maži mėginiai pateikia mažiau informacijos nei dideli mėginiai, o mažesniame pavyzdyje KI yra atitinkamai platesnis. Pavyzdžiui, straipsnyje, kuriame buvo lyginamos trijų tyrimų, naudojamų Helicobacter pylori infekcijai diagnozuoti, charakteristikos, pranešta apie 95,8% karbamido kvėpavimo testo jautrumą (95% PI 75–100). Nors 95,8% skaičius atrodo įspūdingai, nedidelis 24 suaugusių pacientų, sergančių I. pylori, pavyzdys reiškia, kad šiame įvertinime yra didelis neapibrėžtumas, kaip rodo platus PI. Iš tiesų, apatinė 75% riba yra daug mažesnė nei apskaičiuota 95,8%. Jei tas pats jautrumas būtų pastebėtas 240 žmonių mėginyje, tada 95% PI būtų 92,5–98,0, tai suteiktų daugiau garantijų, kad testas yra labai jautrus.

Atsitiktinių imčių kontroliuojamuose tyrimuose (RCT) nereikšmingi rezultatai (t. Y. Tie, kurių P> 0,05) yra ypač jautrūs klaidingam aiškinimui. CI čia ypač naudingas, nes parodo, kaip rezultatai atitinka kliniškai naudingą tikrąjį poveikį. Pavyzdžiui, atliekant RCT, lyginant siūlę ir susegančią anastomozę su gaubtine žarna, žaizdos infekcija išsivystė atitinkamai 10,9% ir 13,5% pacientų (P = 0,30). Šio skirtumo 95% PI yra 2,6% (nuo -2 iki +8). Net atliekant šį tyrimą, kuriame dalyvavo 652 pacientai, išlieka tikimybė, kad infekcijų dažnis dėl šių dviejų procedūrų yra nedidelis. Kuo mažiau tyrimų, tuo daugiau netikrumo. Sung ir kt. atliko RCT, kad palygintų oktreotido infuziją ir skubią skleroterapiją ūminiam kraujavimui iš varikozės 100 pacientų. Oktreotidų grupėje kraujavimo sustabdymo dažnis buvo 84%; skleroterapijos grupėje - 90%, o tai suteikia P = 0,56. Atkreipkite dėmesį, kad nuolatinio kraujavimo dažnis yra panašus į žaizdos infekcijos dažnį minėtame tyrime. Tačiau šiuo atveju 95% PI skirtumui tarp intervencijų yra 6% (nuo -7 iki +19). Šis diapazonas yra gana platus, palyginti su 5% skirtumu, kuris būtų kliniškai įdomus. Akivaizdu, kad tyrimas neatmeta esminio veiksmingumo skirtumo. Todėl autorių išvada „oktreotido infuzija ir skleroterapija yra vienodai veiksmingi gydant kraujavimą iš varikozinių venų“ tikrai negalioja. Tokiais atvejais, kai, kaip ir čia, 95% PI absoliučiai rizikai mažinti (ARR) apima nulį, gydymui būtino skaičiaus (NNT) PI yra gana sunku interpretuoti. NPLP ir jo KI gaunami iš AKR abipusiškumo (padauginus iš 100, jei šios vertės pateikiamos procentais). Čia gauname BPHP = 100: 6 = 16,6, o 95% PI yra nuo -14,3 iki 5,3. Kaip matote iš lentelės išnašos „d“. A1.1, šis CI apima BPHP reikšmes nuo 5,3 iki begalybės ir BPHP reikšmes nuo 14,3 iki begalybės.

KI gali būti sudaryti dažniausiai naudojamiems statistiniams įvertinimams ar palyginimams. Kalbant apie RCT, tai apima skirtumą tarp vidutinių proporcijų, santykinės rizikos, šansų koeficientų ir AE. Panašiai KI galima gauti visiems pagrindiniams įvertinimams, atliktiems atliekant diagnostinių testų tikslumo tyrimus - jautrumą, specifiškumą, teigiamo rezultato nuspėjamąją vertę (visos yra paprastos proporcijos) ir tikimybės koeficientus - įvertinimus, gautus atliekant metaanalizę ir palyginimas su kontroliniais tyrimais. Kompiuterių programa asmeniniams kompiuteriams, apimanti daugelį šių ID naudojimo būdų, prieinama su antruoju „Statistics with Confidence“ leidimu. Makrokomandas, skirtas apskaičiuoti PI proporcijoms, galima nemokamai naudoti „Excel“ ir statistikos programose „SPSS“ ir „Minitab“ adresu http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistika/proporcijos, htm.

Keli gydymo efekto įvertinimai

Nors KI yra pageidautini pirminiams tyrimo rezultatams, jie nėra būtini visiems rezultatams. KI nagrinėja kliniškai svarbius palyginimus. Pavyzdžiui, lyginant dvi grupes, CI, sukurtas siekiant atskirti grupes, kaip parodyta aukščiau esančiuose pavyzdžiuose, yra teisingas, o ne KI, kurį galima sukurti kiekvienos grupės vertinimui. Ne tik nenaudinga kiekvienos grupės reitingams pateikti atskirus KI, šis atvaizdavimas gali būti klaidinantis. Lygiai taip pat teisingas požiūris lyginant gydymo veiksmingumą skirtinguose pogrupiuose yra tiesiogiai palyginti du (ar daugiau) pogrupius. Neteisinga manyti, kad gydymas yra veiksmingas tik viename pogrupyje, jei jo PI neįtraukia jokio poveikio, o kiti ne. KI taip pat naudingi lyginant kelių pogrupių rezultatus. Fig. A 1.1 rodo santykinę eklampsijos riziką moterims, sergančioms preeklampsija, moterų pogrupyje nuo placebu kontroliuojamo magnio sulfato RCT.

Ryžiai. A1.2. Miško sklype pateikiami 11 atsitiktinių imčių galvijų rotaviruso vakcinos, skirtos viduriavimo profilaktikai, klinikinių tyrimų rezultatai, palyginti su placebu. Vertinant santykinę viduriavimo riziką, buvo naudojamas 95% patikimumo intervalas. Juodojo kvadrato dydis yra proporcingas informacijos kiekiui. Be to, parodytas bendras gydymo veiksmingumo balas ir 95% patikimumo intervalas (žymimas deimantu). Metaanalizėje buvo naudojamas atsitiktinių efektų modelis, kuris viršija kai kuriuos iš anksto nustatytus; pavyzdžiui, tai gali būti dydis, naudojamas apskaičiuojant imties dydį. Siekiant griežtesnio kriterijaus, visas KI diapazonas turėtų rodyti naudą, viršijančią iš anksto nustatytą minimumą.

Mes jau aptarėme klaidą, kai statistinio reikšmingumo stoka laikoma nuoroda, kad du gydymo būdai yra vienodai veiksmingi. Lygiai taip pat svarbu nesutapatinti statistinės reikšmės su klinikine reikšme. Klinikinė svarba gali būti laikoma, kai rezultatas yra statistiškai reikšmingas ir gydymo veiksmingumo įvertinimo mastas

Tyrimai gali parodyti, ar rezultatai yra statistiškai reikšmingi, o kurie yra kliniškai svarbūs, o kurie - ne. Fig. A1.2 rodomi keturių bandymų, kuriems taikomas visas KI, rezultatai<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

Tikėtinos vertės patikimumo intervalas - tai toks intervalas, apskaičiuotas pagal duomenis, kuriuose su žinoma tikimybe yra matematiniai visos populiacijos lūkesčiai. Natūralus matematinio lūkesčio įvertis yra jo stebimų verčių aritmetinis vidurkis. Todėl toliau pamokoje naudosime sąvokas „vidutinis“, „vidutinė vertė“. Atliekant patikimumo intervalo skaičiavimo užduotis, dažniausiai reikia atsakyti į tokio tipo atsakymą: „Vidurio pasikliautinas intervalas [konkrečios problemos vertė] yra nuo [mažesnės vertės] iki [didesnės vertės]“. Pasitikėjimo intervalo pagalba galima įvertinti ne tik vidutines vertes, bet ir konkrečios bendros populiacijos ypatybės svorį. Vidutinės vertės, dispersija, standartinis nuokrypis ir paklaida, per kurias pateksime į naujus apibrėžimus ir formules, pamokoje išardomi Imties ir populiacijos ypatybės .

Taško ir intervalo vidurkio įvertinimai

Jei vidutinė visos populiacijos vertė yra įvertinta skaičiumi (tašku), tada nežinomos vidutinės bendros populiacijos vertės įvertis laikomas konkrečiu vidurkiu, kuris apskaičiuojamas iš stebėjimų imties. Šiuo atveju imties vidurkio reikšmė - atsitiktinis kintamasis - nesutampa su vidutine visos populiacijos verte. Todėl, nurodant vidutinę mėginio vertę, būtina kartu nurodyti ir imties paklaidą. Kaip imties paklaidos matas naudojama standartinė paklaida, kuri išreiškiama tais pačiais matavimo vienetais kaip ir vidurkis. Todėl dažnai naudojamas toks žymėjimas :.

Jei vidurkio įvertis turi būti susietas su tam tikra tikimybe, tada visuomenei dominantis parametras turi būti įvertintas ne vienu skaičiumi, o intervalu. Pasitikėjimo intervalas yra intervalas, kuriame su tam tikra tikimybe P randama apskaičiuotos bendros populiacijos rodiklio reikšmė. Pasitikėjimo intervalas, kuriame tikimybė P = 1 - α randamas atsitiktinis kintamasis, apskaičiuojamas taip:

,

α = 1 - P, kurią galima rasti beveik bet kurios statistikos knygos priede.

Praktiškai populiacijos vidurkis ir dispersija nėra žinomi, todėl populiacijos dispersija pakeičiama imties dispersija, o populiacijos vidurkis - imties vidurkiu. Taigi pasitikėjimo intervalas daugeliu atvejų apskaičiuojamas taip:

.

Pasitikėjimo intervalo formulę galima naudoti norint įvertinti populiacijos vidurkį, jei

  • žinomas standartinis visos populiacijos nuokrypis;
  • arba standartinis populiacijos nuokrypis nėra žinomas, tačiau imties dydis yra didesnis nei 30.

Imties vidurkis yra nešališkas populiacijos vidurkio įvertinimas. Savo ruožtu imties dispersija nėra nešališkas gyventojų dispersijos įvertinimas. Norint gauti nešališką bendros populiacijos dispersijos įvertį imties dispersijos formulėje, imties dydis n turėtų būti pakeistas n-1.

1 pavyzdys. Surinkta informacija iš 100 atsitiktinai parinktų miesto kavinių, kad vidutinis darbuotojų skaičius jose yra 10,5, o standartinis nuokrypis - 4,6. Nustatykite 95% kavinių darbuotojų pasitikėjimo intervalą.

kur yra standartinio normaliojo skirstinio kritinė reikšmingumo lygio reikšmė α = 0,05 .

Taigi 95% pasitikėjimo intervalas vidutiniam kavinių darbuotojų skaičiui svyravo nuo 9,6 iki 11,4.

2 pavyzdys. Atsitiktinei imčiai iš bendros 64 stebėjimų populiacijos apskaičiuotos šios bendros vertės:

stebėjimų reikšmių suma,

reikšmių nuokrypio nuo vidurkio kvadratų suma .

Apskaičiuokite 95% patikimumo intervalą.

apskaičiuokite standartinį nuokrypį:

,

apskaičiuokite vidutinę vertę:

.

Pakeiskite reikšmes į patikimumo intervalo išraišką:

kur yra standartinio normaliojo skirstinio kritinė reikšmingumo lygio reikšmė α = 0,05 .

Mes gauname:

Taigi šios imties matematinių lūkesčių 95% patikimumo intervalas svyravo nuo 7,484 iki 11,266.

3 pavyzdys. Atsitiktinės imties iš bendros 100 stebėjimų populiacijos vidutinė vertė buvo 15,2, o standartinis nuokrypis - 3,2. Apskaičiuokite 95% patikimumo intervalą, o tada 99% patikimumo intervalą. Jei imties dydis ir jo kitimas nepasikeis, tačiau pasitikėjimo koeficientas padidės, ar pasitikėjimo intervalas susiaurės ar padidės?

Pakeiskite šias vertes į patikimumo intervalo išraišką:

kur yra standartinio normaliojo skirstinio kritinė reikšmingumo lygio reikšmė α = 0,05 .

Mes gauname:

.

Taigi šios imties vidurkio 95% pasikliautinasis intervalas svyravo nuo 14,57 iki 15,82.

Dar kartą šias reikšmes pakeičiame į patikimumo intervalo išraišką:

kur yra standartinio normaliojo skirstinio kritinė reikšmingumo lygio reikšmė α = 0,01 .

Mes gauname:

.

Taigi 99% patikimumo intervalas šio mėginio vidurkiui svyravo nuo 14,37 iki 16,02.

Kaip matote, didėjant pasitikėjimo koeficientui, didėja ir standartinio normaliojo skirstinio kritinė vertė, todėl intervalo pradžios ir pabaigos taškai yra toliau nuo vidurkio, taigi ir pasitikėjimo intervalas matematiniai lūkesčiai didėja.

Taškinio ir intervalinio savitojo svorio įvertinimai

Kai kurių mėginio savybių specifinis svoris gali būti aiškinamas kaip konkretaus svorio taškas p tas pats bruožas ir populiacijoje. Jei šią vertę reikia susieti su tikimybe, reikia apskaičiuoti savitojo svorio patikimumo intervalą p bendrosios populiacijos bruožas su tikimybe P = 1 - α :

.

4 pavyzdys. Kai kuriuose miestuose yra du kandidatai A ir B kandidatuoti į merus. Atsitiktinai buvo apklausta 200 miesto gyventojų, iš kurių 46% atsakė, kad balsuos už kandidatą A, 26% - kandidatui B ir 28% nežino, už ką balsuos. Nustatykite 95% pasitikėjimo intervalą miesto gyventojų, palaikančių kandidatą, daliai A.

Konstantinas Krawchikas aiškiai paaiškina, koks yra pasitikėjimo intervalas medicinos tyrimuose ir kaip jį naudoti.

Katren-Stil toliau skelbia Konstantino Kravčiko ciklą apie medicinos statistiką. Dviejuose ankstesniuose straipsniuose autorius nagrinėjo tokias sąvokas kaip ir.

Konstantinas Kravčikas

Analitinis matematikas. Medicinos ir humanitarinių mokslų statistinių tyrimų specialistas

Maskvos miestas

Labai dažnai straipsniuose apie klinikinius tyrimus galima rasti paslaptingą frazę: „pasitikėjimo intervalas“ (95% PI arba 95% PI - pasitikėjimo intervalas). Pavyzdžiui, straipsnyje gali būti parašyta: „Norint įvertinti skirtumų reikšmingumą, buvo naudojamas studento t-testas, apskaičiuojant 95% pasikliautinąjį intervalą“.

Kokia yra „95% patikimumo intervalo“ vertė ir kodėl ją apskaičiuoti?

Kas yra pasitikėjimo intervalas? - Tai yra diapazonas, kuriame randamos tikrosios populiacijos priemonės. O ką, yra „netikros“ vidutinės vertės? Tam tikra prasme, taip, yra. Paaiškinome, kad neįmanoma išmatuoti dominančio parametro visoje populiacijoje, todėl tyrėjai patenkina ribotą imtį. Šiame pavyzdyje (pavyzdžiui, pagal kūno svorį) yra viena vidutinė vertė (tam tikras svoris), pagal kurią sprendžiame apie vidutinę visos populiacijos vertę. Tačiau vargu ar vidutinis imties svoris (ypač mažas) sutaps su vidutiniu visos populiacijos svoriu. Todėl teisingiau yra apskaičiuoti ir naudoti bendros populiacijos vidutinių verčių diapazoną.

Pavyzdžiui, įsivaizduokite, kad 95% PI (95% PI) hemoglobinui yra 110–122 g / l. Tai reiškia, kad esant 95%tikimybei, tikroji vidutinė hemoglobino vertė bendroje populiacijoje bus nuo 110 iki 122 g / l. Kitaip tariant, mes nežinome vidutinio hemoglobino kiekio bendroje populiacijoje, tačiau 95% tikimybe galime nurodyti šio požymio verčių diapazoną.

Pasitikėjimo intervalas ypač svarbus grupių vidurkių skirtumui arba, kaip jis vadinamas, poveikio dydžiui.

Tarkime, lygindavome dviejų geležies preparatų efektyvumą: vieną, kuris buvo rinkoje jau seniai, ir tą, kuris buvo ką tik užregistruotas. Po gydymo kurso buvo įvertinta hemoglobino koncentracija tirtose pacientų grupėse, o statistinė programa apskaičiavo, kad skirtumas tarp dviejų grupių vidutinių verčių su 95% tikimybe yra nuo 1,72 iki 14,36 g / l (1 lentelė).

Skirtukas 1. Kriterijus nepriklausomiems mėginiams
(palyginkite grupes pagal hemoglobino lygį)

Tai turėtų būti aiškinama taip: kai kuriems bendros populiacijos pacientams, vartojantiems naują vaistą, hemoglobino kiekis vidutiniškai bus didesnis 1,72–14,36 g / l nei tų, kurie vartojo jau žinomą vaistą.

Kitaip tariant, bendroje populiacijoje vidutinių hemoglobino verčių skirtumas grupėse su 95% tikimybe yra šiose ribose. Tyrėjas turės nuspręsti, ar tai daug, ar mažai. Visa tai yra ta, kad mes dirbame ne su viena vidutine verte, o su verčių diapazonu, todėl patikimiau įvertiname grupių parametrų skirtumą.

Statistiniuose paketuose, tyrėjo nuožiūra, galite savarankiškai susiaurinti arba išplėsti pasitikėjimo intervalo ribas. Mažindami pasitikėjimo intervalo tikimybę, mes susiauriname priemonių diapazoną. Pavyzdžiui, esant 90% PI, priemonių diapazonas (arba vidurkių skirtumas) bus siauresnis nei esant 95%.

Priešingai, tikimybės padidinimas iki 99% išplečia reikšmių diapazoną. Lyginant grupes, apatinė CI riba gali kirsti nulį. Pavyzdžiui, jei patikimumo intervalą išplėtėme iki 99%, intervalo ribos svyravo nuo –1 iki 16 g / l. Tai reiškia, kad bendroje populiacijoje yra grupių, kurių skirtumas tarp vidurkių, tarp kurių tiriamas požymis yra lygus 0 (M = 0).

Naudodami pasitikėjimo intervalą galite patikrinti statistines hipotezes. Jei patikimumo intervalas kerta nulinę vertę, tada nulinė hipotezė, kuri daro prielaidą, kad grupės nesiskiria pagal tiriamą parametrą, yra teisinga. Pavyzdys aprašytas aukščiau, kai išplėtėme ribas iki 99%. Kažkur bendroje populiacijoje radome grupes, kurios niekuo nesiskyrė.

95% hemoglobino skirtumo patikimumo intervalas, (g / l)


Linija rodo 95% patikimumo intervalą, skirtą vidutiniam hemoglobino skirtumui tarp dviejų grupių. Linija praeina nulio ženklą, todėl tarp vidurkių yra skirtumas, lygus nuliui, o tai patvirtina nulinę hipotezę, kad grupės nesiskiria. Skirtumas tarp grupių yra nuo –2 iki 5 g / l, o tai reiškia, kad hemoglobinas gali arba sumažėti 2 g / l, arba padidėti 5 g / l.

Pasitikėjimo intervalas yra labai svarbi metrika. Jo dėka galite pamatyti, ar skirtumai grupėse iš tikrųjų atsirado dėl vidurkio skirtumo, ar dėl didelės imties, nes esant didelei imčiai, tikimybė rasti skirtumų yra didesnė nei naudojant mažą.

Praktiškai tai gali atrodyti taip. Mes paėmėme 1000 žmonių mėginį, išmatavome hemoglobino lygį ir nustatėme, kad vidutinio skirtumo patikimumo intervalas yra nuo 1,2 iki 1,5 g / l. Statistinio reikšmingumo lygis šiuo atveju p

Matome, kad hemoglobino koncentracija padidėjo, bet beveik nepastebimai, todėl statistinis reikšmingumas atsirado būtent dėl ​​imties dydžio.

Pasitikėjimo intervalą galima apskaičiuoti ne tik pagal vidutines vertes, bet ir pagal proporcijas (ir rizikos koeficientus). Pavyzdžiui, mus domina pasitikėjimo intervalas tarp pacientų, pasiekusių remisiją vartojant sukurtą vaistą, proporcijų. Tarkime, kad 95% PI proporcijoms, tai yra tokių pacientų daliai, yra 0,60–0,80. Taigi galime pasakyti, kad mūsų vaistas turi terapinį poveikį nuo 60 iki 80% atvejų.