Intervalul de încredere este o formulă pentru calcularea unui fizician. Construirea intervalului de încredere pentru așteptarea matematică a populației generale. Metoda intervalului de încredere

Ultima actualizare: 3 martie 2020
Exemplu de fișier

Să construim un interval de încredere în MS EXCEL pentru a estima valoarea medie a distribuției în caz de importanță cunoscută varianță.

Desigur alegerea nivelul de încredere depinde complet de problema rezolvată. Astfel, gradul de încredere al pasagerului aerian în fiabilitatea aeronavei, fără îndoială, ar trebui să fie mai mare decât gradul de încredere al cumpărătorului în fiabilitatea becului.

Afirmarea problemei

Să presupunem că din populația generală luând probă marimea n. Se presupune că deviație standard această distribuție este cunoscută. Este necesar pe baza acestui lucru prelevarea de probe evaluează necunoscutul distribuție medie(μ,) și construiți corespunzător bilateralăinterval de încredere .

Estimare punctuală

După cum se știe din, statistici(o denotăm X Miercuri) este un estimare imparțială a mediei acest populația generalăși are distribuția N (μ; σ 2 / n).

Notă : Ce trebuie să faceți dacă trebuie să construiți interval de încredereîn cazul unei distribuții care nu estenormal?În acest caz, vine vorba de salvare, care spune că, cu o dimensiune suficient de mare prelevarea de probe n din distribuție a nu finormal , distribuirea eșantionului de statistici X av voi aproximativ corespunde distributie normala cu parametrii N (μ; σ 2 / n).

Asa de, estimare punctualămijlocvalorile de distribuție avem - asta proba medie, adică X Miercuri... Acum să trecem la interval de încredere.

Trasarea unui interval de încredere

De obicei, cunoscând distribuția și parametrii săi, putem calcula probabilitatea ca o variabilă aleatorie să ia o valoare din intervalul specificat de noi. Acum să facem opusul: găsiți intervalul în care variabila aleatorie va cădea cu o probabilitate dată. De exemplu, din proprietăți distributie normala se știe că, cu o probabilitate de 95%, o variabilă aleatorie distribuită peste lege normala, se va încadra în intervalul de aproximativ +/- 2 din Valoarea medie(vezi articolul despre). Acest interval ne va servi drept prototip interval de încredere .

Acum să ne dăm seama dacă știm distribuția , pentru a calcula acest interval? Pentru a răspunde la întrebare, trebuie să indicăm forma distribuției și parametrii acesteia.

Știm forma de distribuție - este distributie normala(amintiți-vă că vorbim despre distribuția eșantionuluistatisticiX Miercuri).

Nu știm parametrul μ (trebuie doar estimat folosind interval de încredere), dar avem estimarea lui X Miercuri, calculat pe baza eșantionare, care poate fi folosit.

Al doilea parametru este deviația standard a eșantionului mediuo vom considera cunoscută, este egal cu σ / √n.

pentru că nu știm μ, atunci vom construi intervalul +/- 2 abateri standard nu din Valoarea medie, și din estimarea sa cunoscută X Miercuri... Acestea. la calcul interval de încredere NU vom presupune că X Miercuri se încadrează în intervalul +/- 2 abateri standard de la μ cu o probabilitate de 95% și vom presupune că intervalul +/- 2 abateri standard din X Miercuri cu o probabilitate de 95% va acoperi μ - media populației generale, din care se ia probă... Aceste două afirmații sunt echivalente, dar a doua afirmație ne permite să construim interval de încredere .

În plus, clarificăm intervalul: o variabilă aleatorie distribuită peste lege normala, cu o probabilitate de 95% se încadrează în intervalul +/- 1.960 abateri standard, nu +/- 2 abateri standard... Acest lucru poate fi calculat folosind formula = NORM.ST.OBR ((1 + 0,95) / 2), cm. exemplu fișier Spațiere foaie .

Acum putem formula o afirmație probabilistică care ne va servi pentru a forma interval de încredere: „Probabilitatea ca. media populației este de la eșantion mediu la 1.960 " abaterile standard ale eșantionului înseamnă ", este egal cu 95% ".

Valoarea probabilității menționată în declarație are un nume special care este asociat cu nivelul de semnificație α (alfa) printr-o expresie simplă nivel de încredere = 1 . În cazul nostru nivel de semnificație α =1-0,95=0,05 .

Acum, pe baza acestei afirmații probabilistice, notăm o expresie pentru calcul interval de încredere :

unde Z α / 2 standarddistributie normala(o astfel de valoare a variabilei aleatoare z , ce P (z >= Z a / 2 ) = α / 2).

Notă : Α / 2-cuantilă superioară determină lățimea interval de încredere v abateri standardproba medie. Α / 2-cuantilă superioară standarddistributie normalaîntotdeauna mai mare decât 0, ceea ce este foarte convenabil.

În cazul nostru, la α = 0,05, α / 2-cuantilă superioară este egal cu 1.960. Pentru alte niveluri de semnificație α (10%; 1%) α / 2-cuantilă superioarăZ a / 2 poate fi calculat folosind formula = ST.OBR STANDARD (1-α / 2) sau dacă este cunoscut nivel de încredere , = NORM.ST.OBR ((1 + nivel de încredere) / 2) .

De obicei la construirea intervale de încredere pentru estimarea mediei folosiți numai α superioară /2- cuantilși nu folosiți α inferior /2- cuantil... Acest lucru este posibil pentru că standarddistributie normala simetric în jurul axei x ( densitatea sa de distribuție simetric în raport cu medie, adică 0) . Prin urmare, nu este necesar să se calculeze α / 2-cuantilă mai mică(se numește pur și simplu α / 2-cuantil), deoarece este egal α superioară /2- cuantil cu un semn minus.

Reamintim că, în ciuda formei distribuției cantității x, variabila aleatorie corespunzătoare X Miercuri distribuit aproximativamenda N (μ; σ 2 / n) (vezi articolul despre). Prin urmare, în cazul general, expresia de mai sus pentru interval de încredere este doar aproximativ. Dacă cantitatea x este distribuită peste lege normala N (μ; σ 2 / n), apoi expresia pentru interval de încredere este corectă.

Calculul intervalului de încredere în MS EXCEL

Să rezolvăm problema. Timp de raspuns componenta electronica la semnalul de intrare este o caracteristică importantă a dispozitivului. Inginerul dorește să stabilească un interval de încredere pentru timpul mediu de răspuns la un nivel de încredere de 95%. Inginerul știe din experiența anterioară că abaterea standard a timpului de răspuns este de 8 ms. Se știe că inginerul a făcut 25 de măsurători pentru a estima timpul de răspuns, valoarea medie a fost de 78 ms.

Soluţie: Un inginer vrea să știe timpul de răspuns al unui dispozitiv electronic, dar înțelege că timpul de răspuns nu este o variabilă fixă, ci o variabilă aleatorie care are propria distribuție. Deci, cel mai bun pe care se poate baza este să determine parametrii și forma acestei distribuții.

Din păcate, din afirmația problemei, nu știm forma distribuției timpului de răspuns (nu trebuie să fie normal). , această distribuție este, de asemenea, necunoscută. Cunoscut doar pentru el deviație standardσ = 8. Prin urmare, deși nu putem calcula probabilitățile și construi interval de încredere .

Cu toate acestea, în ciuda faptului că nu cunoaștem distribuția timprăspuns separat, știm că conform CPT , distribuția eșantionuluitimpul mediu de răspuns este aproximativ normal(vom presupune că condițiile CPT sunt efectuate deoarece marimea prelevarea de probe suficient de mare (n = 25)) .

În plus, media din această distribuție este in medie distribuirea unui singur răspuns, adică μ. A deviație standard din această distribuție (σ / √n) poate fi calculată prin formula = 8 / ROOT (25).

De asemenea, se știe că inginerul a primit estimare punctuală parametru μ egal cu 78 msec (X cf.). Prin urmare, acum putem calcula probabilitățile, deoarece cunoaștem forma de distribuție ( normal) și parametrii săi (X cf și σ / √n).

Inginerul vrea să știe valorea estimataμ din distribuția timpului de răspuns. După cum sa menționat mai sus, acest μ este egal cu așteptarea matematică a distribuției probei a timpului mediu de răspuns... Dacă folosim distributie normala N (X cf; σ / √n), atunci μ dorit va fi în intervalul +/- 2 * σ / √n cu o probabilitate de aproximativ 95%.

Nivelul de semnificație este egal cu 1-0,95 = 0,05.

În cele din urmă, găsiți marginea stângă și dreapta interval de încredere... Bordura stângă: = 78-STANDARD ST.OBR (1-0.05 / 2) * 8 / ROOT (25) = 74,864 Marginea dreaptă: = 78 + NORM.ST.OBR (1-0.05 / 2) * 8 / ROOT (25) = 81.136

Bordura stângă: = NORM.OBR (0,05 / 2; 78; 8 / ROOT (25)) Marginea dreaptă: = NORM.INV (1-0.05 / 2; 78; 8 / ROOT (25))

Răspuns : interval de încredere la nivel de încredere 95% și σ =8 Domnișoară este egal cu 78 +/- 3,136 msec.

V exemplu de fișier pe foaia de lucru Sigma este cunoscută o formă de calcul și construcție bilateralinterval de încredere pentru arbitrar probe cu un σ dat și nivel de semnificație .

Funcția CONFIDENCE.NORM ()

Dacă valorile prelevarea de probe sunt în raza de acțiune B20: B79 , A nivel de semnificație egal cu 0,05; apoi formula MS EXCEL: = MEDIE (B20: B79) -TRUST.NORM (0,05, σ, COUNT (B20: B79)) va întoarce frontiera stângă interval de încredere .

Aceeași margine poate fi calculată folosind formula: = MEDIE (B20: B79) -NORM.ST.INV (1-0.05 / 2) * σ / ROOT (COUNT (B20: B79))

Notă: Funcția CONFIDENCE.NORM () a apărut în MS EXCEL 2010. În versiunile anterioare ale MS EXCEL, a fost utilizată funcția CONFIDENCE ().

În subsecțiunile anterioare, am analizat problema estimării unui parametru necunoscut A un numar. Această estimare se numește „punct”. Într-o serie de sarcini, este necesar nu numai să se găsească parametrul A o valoare numerică adecvată, dar, de asemenea, evaluați acuratețea și fiabilitatea acesteia. Doriți să știți la ce erori poate duce o înlocuire a parametrilor A estimarea sa punctuală Ași cu ce grad de certitudine ne putem aștepta ca aceste erori să rămână în limite cunoscute?

Problemele de acest fel sunt relevante în special pentru un număr mic de observații, atunci când se estimează punctul si inîn mare măsură, este accidental și înlocuirea aproximativă a lui cu a poate duce la erori grave.

Pentru a da o idee despre acuratețea și fiabilitatea evaluării A,

în statistica matematică se folosesc așa-numitele intervale de încredere și probabilitățile de încredere.

Lăsați parametrul A din experiență estimare imparțială A. Vrem să evaluăm posibila eroare în acest caz. Să atribuim o probabilitate suficient de mare p (de exemplu, p = 0,9, 0,95 sau 0,99) astfel încât un eveniment cu o probabilitate p să poată fi considerat practic de încredere și să găsim o astfel de valoare s pentru care

Apoi gama de valori practic posibile ale erorii apărute la înlocuire A pe A, va fi ± s; erori mari în valoare absolută vor apărea numai cu o probabilitate mică a = 1 - p. Să rescriem (14.3.1) ca:

Egalitatea (14.3.2) înseamnă că, cu probabilitatea p, valoarea necunoscută a parametrului A se încadrează în interval

În acest caz, ar trebui menționată o circumstanță. Anterior, am luat în considerare în mod repetat probabilitatea ca o variabilă aleatorie să cadă într-un anumit interval non-aleatoriu. Aici situația este diferită: cantitatea A nu întâmplător, dar intervalul / p este aleatoriu. În mod aleatoriu poziția sa pe axa absciselor, determinată de centrul său A; lungimea intervalului 2s este, de asemenea, aleatorie în general, deoarece valoarea lui s este calculată, de regulă, din date experimentale. Prin urmare, în acest caz, ar fi mai bine să interpretăm valoarea lui p nu ca probabilitatea de a „atinge” punctul Aîn intervalul / p și ca probabilitate ca intervalul aleatoriu / p să acopere punctul A(fig. 14.3.1).

Orez. 14.3.1

Probabilitatea p se numește de obicei nivel de încredere, iar intervalul / p este interval de încredere. Limite de intervale Dacă. a x = a- s și a 2 = a + dar chemat limite de încredere.

Să oferim încă o interpretare a conceptului de interval de încredere: poate fi considerat ca un interval de valori ale parametrilor A, compatibil cu datele experimentale și nu le contrazice. Într-adevăr, dacă suntem de acord să considerăm un eveniment cu probabilitate a = 1-p practic imposibil, atunci acele valori ale parametrului a pentru care a - a> s, trebuie recunoscute ca fiind în contradicție cu datele experimentale și cu cele pentru care | a - A a t na 2.

Lăsați parametrul A există o estimare imparțială A. Dacă am ști legea distribuției cantității A, problema găsirii intervalului de încredere ar fi foarte simplă: ar fi suficient să găsim o astfel de valoare de s pentru care

Dificultatea este că legea de distribuție a estimării A depinde de legea de distribuție a cantității Xși, prin urmare, asupra parametrilor săi necunoscuți (în special, asupra parametrului în sine A).

Pentru a rezolva această dificultate, se poate aplica următoarea aproximare aproximativă: înlocuiți parametrii necunoscuți în expresia pentru s cu estimările lor punctuale. Cu un număr relativ mare de experimente NS(aproximativ 20 ... 30) această tehnică oferă de obicei rezultate satisfăcătoare în ceea ce privește acuratețea.

Ca exemplu, luați în considerare problema intervalului de încredere pentru așteptarea matematică.

Lasă-l să fie produs NS X, ale cărei caracteristici sunt așteptarea matematică Tși varianță D- necunoscut. Pentru acești parametri, s-au obținut următoarele estimări:

Este necesar să se construiască intervalul de încredere / p, corespunzător probabilității de încredere p, pentru așteptarea matematică T magnitudini X.

La rezolvarea acestei probleme, vom folosi faptul că cantitatea T reprezintă suma NS variabile aleatoare independente distribuite identic X hși conform teoremei limitei centrale pentru suficient de mari NS legea sa de distribuție este aproape de normal. În practică, chiar și cu un număr relativ mic de termeni (aproximativ 10 ... 20), legea de distribuție a sumei poate fi considerată aproximativ normală. Vom pleca de la faptul că cantitatea T distribuite conform legii normale. Caracteristicile acestei legi - așteptarea matematică și varianța - sunt egale, respectiv Tși

(vezi capitolul 13 subsecțiunea 13.3). Să presupunem că cantitatea D cunoaștem și găsim o astfel de valoare Ep, pentru care

Aplicând formula (6.3.5) din capitolul 6, exprimăm probabilitatea în partea stângă a (14.3.5) în funcție de funcția normală de distribuție

unde este deviația standard a estimării T.

Din ecuație

găsim valoarea lui Sp:

unde arg Ф * (х) este funcția inversă a lui Ф * (NS), acestea. o astfel de valoare a argumentului pentru care funcția normală de distribuție este egală cu NS.

Dispersie D, prin care se exprimă valoarea A 1P, nu știm exact; ca valoare aproximativă, puteți utiliza estimarea D(14.3.4) și pune aproximativ:

Astfel, problema construirii unui interval de încredere a fost aproximativ rezolvată, ceea ce este egal cu:

unde gp este definit prin formula (14.3.7).

Pentru a evita interpolare inversă în tabelele funcției Ф * (л) atunci când se calculează s p, este convenabil să compilați un tabel special (Tabelul 14.3.1), care oferă valorile cantității

în funcție de p. Cantitatea (p determină pentru legea normală numărul de abateri standard care trebuie puse deoparte la dreapta și la stânga centrului de împrăștiere pentru ca probabilitatea de a lovi zona rezultată să fie egală cu p.

Prin valoarea de 7 p, intervalul de încredere este exprimat ca:

Tabelul 14.3.1

Exemplul 1. A efectuat 20 de experimente despre valoare X; rezultatele sunt prezentate în tabel. 14.3.2.

Tabelul 14.3.2

Este necesar să se găsească o estimare a pentru așteptările matematice ale cantității Xși construiți un interval de încredere corespunzător unui nivel de încredere de p = 0,8.

Soluţie. Avem:

După ce am ales ca origine l: = 10, conform celei de-a treia formule (14.2.14) găsim estimarea imparțială D :

Conform tabelului. 14.3,1 găsiți

Limite de încredere:

Interval de încredere:

Valorile parametrilor T, situate în acest interval sunt în concordanță cu datele experimentale date în tabel. 14.3.2.

Intervalul de încredere pentru varianță poate fi construit într-un mod similar.

Lasă-l să fie produs NS experimente independente pe o variabilă aleatorie X cu parametri necunoscuți din și A și pentru varianță D se obține estimarea imparțială:

Este necesar să se construiască aproximativ intervalul de încredere pentru varianță.

Din formula (14.3.11) se vede că cantitatea D reprezintă

suma NS variabile aleatorii ale formularului. Aceste cantități nu sunt

independent, deoarece oricare dintre ele include cantitatea T, dependent de toți ceilalți. Cu toate acestea, se poate demonstra că odată cu creșterea NS legea distribuției sumelor lor este, de asemenea, aproape de normal. Practic la NS= 20 ... 30 poate fi deja considerat normal.

Să presupunem că așa este și să găsim caracteristicile acestei legi: așteptarea matematică și varianța. De când scorul D- imparțial, atunci M [D] = D.

Calcularea varianței D D este asociat cu calcule relativ complexe, deci dăm expresia sa fără ieșire:

unde q 4 este al patrulea moment central al cantității X.

Pentru a utiliza această expresie, trebuie să înlocuiți valorile \ u200b \ u200b4 și D(cel puțin aproximativ). In loc de D poți folosi estimarea lui D.În principiu, al patrulea moment central poate fi înlocuit și cu o estimare, de exemplu, cu o valoare a formei:

dar o astfel de înlocuire va oferi o precizie extrem de scăzută, deoarece, în general, cu un număr limitat de experimente, momentele de înaltă ordine sunt determinate cu erori mari. Cu toate acestea, în practică se întâmplă adesea ca forma legii distribuției cantității X cunoscut în prealabil: numai parametrii săi sunt necunoscuți. Apoi, puteți încerca să exprimați q 4 în termeni de D.

Să luăm cel mai frecvent caz când cantitatea X distribuite conform legii normale. Apoi, al patrulea moment central al acestuia este exprimat în termeni de varianță (a se vedea capitolul 6 subsecțiunea 6.2);

iar formula (14.3.12) dă sau

Înlocuirea în (14.3.14) necunoscut D evaluarea lui D, obținem: de unde

Momentul c 4 poate fi exprimat în termeni de D de asemenea, în alte cazuri, când distribuția cantității X nu este normal, dar aspectul său este cunoscut. De exemplu, pentru legea densității uniforme (a se vedea capitolul 5) avem:

unde (a, P) este intervalul la care este stabilită legea.

Prin urmare,

Prin formula (14.3.12) obținem: de unde găsim aproximativ

În cazurile în care forma legii de distribuție a 26 este necunoscută, se recomandă în continuare să se utilizeze formula (14.3.16) atunci când se estimează aproximativ valoarea a /), cu excepția cazului în care există motive speciale pentru a crede că această lege este foarte diferită de normalul (are un exces vizibil pozitiv sau negativ) ...

Dacă valoarea aproximativă a /) este obținută într-un fel sau altul, atunci este posibil să se construiască un interval de încredere pentru varianță în același mod în care l-am construit pentru așteptarea matematică:

unde valoarea, în funcție de probabilitatea dată p, se găsește conform tabelului. 14.3.1.

Exemplul 2. Găsiți un interval de încredere de aproximativ 80% pentru varianța unei variabile aleatorii Xîn condițiile exemplului 1, dacă se știe că cantitatea X distribuite conform unei legi apropiate de normal.

Soluţie. Valoarea rămâne aceeași ca în tabel. 14.3.1:

Conform formulei (14.3.16)

Folosind formula (14.3.18), găsim intervalul de încredere:

Gama corespunzătoare de valori a abaterii standard: (0,21; 0,29).

14.4. Metode exacte pentru construirea intervalelor de încredere pentru parametrii unei variabile aleatorii distribuite conform legii normale

În subsecțiunea anterioară, am analizat metodele aproximativ aproximative pentru construirea intervalelor de încredere pentru așteptare și varianță. Aici vom da o idee despre metodele exacte pentru rezolvarea aceleiași probleme. Subliniem că, pentru a găsi cu precizie intervalele de încredere, este absolut necesar să cunoaștem în prealabil forma legii distribuției cantității X,în timp ce pentru aplicarea metodelor aproximative acest lucru nu este necesar.

Ideea din spatele metodelor exacte pentru construirea intervalelor de încredere este următoarea. Orice interval de încredere se găsește din condiția care exprimă probabilitatea îndeplinirii unor inegalități, care includ estimarea interesului pentru noi A. Legea distribuției estimative Aîn general, depinde de parametrii necunoscuți ai cantității X. Cu toate acestea, uneori este posibil să treci în inegalități dintr-o variabilă aleatorie A la o altă funcție a valorilor observate X n X 2, ..., X pag. a cărei lege de distribuție nu depinde de parametri necunoscuți, ci depinde doar de numărul de experimente și de forma legii de distribuție pentru cantitate X. Variabilele aleatoare de acest fel joacă un rol important în statistica matematică; au fost studiate în detaliu pentru cazul distribuției normale a cantității X.

De exemplu, s-a dovedit că pentru o distribuție normală a cantității X valoare aleatorie

se supune așa-numitelor Legea distribuției studenților cu NS- 1 grade de libertate; densitatea acestei legi are forma

unde Г (х) este funcția gamma cunoscută:

S-a dovedit, de asemenea, că variabila aleatorie

are o "distribuție% 2" cu NS- 1 grade de libertate (a se vedea capitolul 7), a căror densitate este exprimată prin formulă

Fără a ne axa pe derivările distribuțiilor (14.4.2) și (14.4.4), arătăm cum pot fi aplicate atunci când se construiesc intervale de încredere pentru parametri ty D.

Lasă-l să fie produs NS experimente independente pe o variabilă aleatorie X, distribuite conform legii normale cu parametri necunoscuți thio. Pentru acești parametri s-au obținut estimările

Este necesar să se construiască intervale de încredere pentru ambii parametri corespunzători probabilității de încredere p.

Să construim mai întâi intervalul de încredere pentru așteptarea matematică. Bineînțeles, acest interval este luat simetric față de T; se notează cu s p jumătate din lungimea intervalului. Valoarea s p trebuie aleasă astfel încât condiția

Să încercăm să trecem pe partea stângă a egalității (14.4.5) din variabila aleatorie T la o variabilă aleatorie T, distribuite conform legii Studentului. Pentru a face acest lucru, înmulțim ambele părți ale inegalității | m-w? |

cu o valoare pozitivă: sau, folosind notația (14.4.1),

Să găsim un număr / p astfel încât valoarea / p să fie găsită din condiție

Din formula (14.4.2) se vede că (1) este o funcție uniformă, prin urmare (14.4.8) dă

Egalitatea (14.4.9) determină valoarea / p în funcție de p. Dacă aveți la dispoziție un tabel de valori al integralei

atunci valoarea lui / p poate fi găsită prin interpolare inversă în tabel. Cu toate acestea, este mai convenabil să compilați în avans un tabel cu valori / p. Un astfel de tabel este dat în anexă (Tabelul 5). Acest tabel prezintă valorile în funcție de probabilitatea de încredere p și de numărul de grade de libertate NS- 1. După ce s-a determinat / p conform tabelului. 5 și presupunând

vom găsi jumătate din lățimea intervalului de încredere / p și intervalul în sine

Exemplul 1. A făcut 5 experimente independente pe o variabilă aleatorie X, distribuite în mod normal cu parametri necunoscuți Tși despre. Rezultatele experimentelor sunt prezentate în tabel. 14.4.1.

Tabelul 14.4.1

Găsiți o notă T pentru așteptarea matematică și construiți pentru aceasta un interval de încredere de 90% / p (adică intervalul corespunzător probabilității de încredere p = 0,9).

Soluţie. Avem:

Conform tabelului 5 cereri pentru NS - 1 = 4 și p = 0,9 găsim Unde

Intervalul de încredere va fi

Exemplul 2. Pentru condițiile exemplului 1 din subsecțiunea 14.3, presupunând valoarea X distribuite normal, găsiți intervalul exact de încredere.

Soluţie. Conform tabelului 5, găsim aplicații pentru NS - 1 = 19ir =

0,8 / p = 1,328; de aici

Comparând cu soluția din exemplul 1 al subsecțiunii 14.3 (e p = 0,072), suntem convinși că discrepanța este foarte nesemnificativă. Dacă menținem precizia la a doua zecimală, atunci intervalele de încredere găsite prin metode exacte și aproximative coincid:

Să trecem la construirea unui interval de încredere pentru varianță. Luați în considerare estimarea varianței imparțiale

și exprimă variabila aleatorie D prin valoare V(14.4.3) având o distribuție x 2 (14.4.4):

Cunoașterea legii de distribuție a cantității V, se poate găsi intervalul / (1, în care se încadrează cu o probabilitate dată p.

Legea distribuției k n _ x (v) cantitatea I 7 are forma prezentată în Fig. 14.4.1.

Orez. 14.4.1

Se pune întrebarea: cum se alege intervalul / p? Dacă legea de distribuție a cantității V a fost simetric (cum ar fi legea normală sau distribuția lui Student), ar fi firesc să se ia intervalul / p simetric în raport cu așteptările matematice. În acest caz, legea k n _ x (v) asimetric. Să acceptăm să alegem intervalul / p astfel încât probabilitățile de ieșire a cantității Vîn afara intervalului spre dreapta și spre stânga (zonele umbrite din Fig. 14.4.1) erau aceleași și egale

Pentru a construi un interval / p cu această proprietate, vom folosi tabela. 4 anexe: listează numerele y) astfel încât

pentru cantitate V, având x 2 -distribuire cu r grade de libertate. În cazul nostru r = n- 1. Să reparăm r = n- 1 și găsiți în linia corespunzătoare a tabelului. 4 două semnificații x 2 - una corespunzând probabilității cealaltă - probabilități Să le denotăm

sens la 2și xl? Intervalul are la 2, stânga lui și y ~ capătul drept.

Acum să găsim intervalul de încredere dorit / | pentru varianța cu limitele D și D 2, care acoperă punctul D cu probabilitate p:

Să construim un astfel de interval / (, = (?> B A), care acoperă punctul D dacă și numai dacă cantitatea V cade în intervalul / p. Să arătăm că intervalul

îndeplinește această condiție. Într-adevăr, inegalitățile sunt echivalente cu inegalitățile

iar aceste inegalități sunt satisfăcute cu probabilitatea p. Astfel, intervalul de încredere pentru varianță se găsește și se exprimă prin formula (14.4.13).

Exemplul 3. Găsiți intervalul de încredere pentru varianță în condițiile exemplului 2 din subsecțiunea 14.3, dacă se știe că valoarea X distribuite normal.

Soluţie. Avem ... Conform tabelului 4 din anexă

gasim la r = n - 1 = 19

Folosind formula (14.4.13), găsim intervalul de încredere pentru varianță

Intervalul corespunzător pentru deviația standard: (0,21; 0,32). Acest interval depășește puțin intervalul (0,21; 0,29) obținut în exemplul 2 din subsecțiunea 14.3 printr-o metodă aproximativă.

  • Figura 14.3.1 consideră un interval de încredere care este simetric cu a. În general, așa cum vom vedea mai târziu, acest lucru este opțional.

Interval de încredere(CI; în engleză, intervalul de încredere - CI) obținut într-un studiu cu un eșantion oferă o măsură a acurateței (sau incertitudinii) rezultatelor studiului pentru a trage concluzii despre populația tuturor acestor pacienți (populație generală). Definiția corectă a IC 95% poate fi formulată după cum urmează: 95% din astfel de intervale vor conține valoarea adevărată în populație. Această interpretare este oarecum mai puțin precisă: CI este intervalul de valori în cadrul cărora se poate fi 95% sigur că conține adevărata valoare. Atunci când se utilizează IC, accentul se pune pe cuantificarea efectului, spre deosebire de valoarea P care se obține prin testarea semnificației statistice. Valoarea P nu măsoară nicio cantitate, ci servește mai degrabă ca o măsură a puterii dovezilor împotriva ipotezei nule a „fără efect”. Valoarea P de la sine nu ne spune nimic despre magnitudinea diferenței, sau chiar despre direcția ei. Prin urmare, valorile independente ale lui P sunt absolut neinformative în articole sau rezumate. În schimb, CI indică atât efectul dobânzii imediate, cum ar fi utilitatea unui tratament, cât și puterea dovezilor. Prin urmare, JI este direct legat de practica EBM.

Abordare de evaluare a analize statistice, ilustrat de CI, vizează măsurarea efectului dobânzii (sensibilitatea testului de diagnostic, frecvența cazurilor prezise, ​​reducerea riscului relativ în tratament etc.), precum și măsurarea incertitudinii în acest efect. Cel mai adesea, CI reprezintă intervalul de valori de pe ambele părți ale estimării, în care este probabil să se afle adevărata valoare și puteți fi sigur 95% de acest lucru. Acordul de utilizare a probabilității de 95% în mod arbitrar, precum și valoarea P.<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

CI se bazează pe ideea că același studiu efectuat pe alte eșantioane de pacienți nu ar duce la rezultate identice, ci că rezultatele lor ar fi distribuite în jurul unei valori adevărate, dar necunoscute. Cu alte cuvinte, CI descrie acest lucru ca „variabilitate dependentă de eșantion”. IC nu reflectă incertitudine suplimentară din alte cauze; în special, nu include efectele pierderii selective a pacientului în urmărire, conformitatea slabă sau măsurarea inexactă a rezultatului, lipsa orbirii etc. Astfel, CI subestimează întotdeauna cantitatea totală de incertitudine.

Calculul intervalului de încredere

Tabelul A1.1. Erori standard și intervale de încredere pentru unele măsurători clinice

De obicei, CI se calculează dintr-o estimare observată a unei măsuri cantitative, cum ar fi diferența (d) între două proporții și o eroare standard (SE) în estimarea acestei diferențe. CI aproximativ 95% astfel obținut este de d ± 1,96 SE. Formula se modifică în funcție de natura măsurii rezultatului și de domeniul de aplicare al IC. De exemplu, într-un studiu randomizat, controlat cu placebo, cu vaccin acellular contra pertussis, 72 din 1.670 (4,3%) sugari care au primit vaccinul au dezvoltat pertussis și 240 din 1.665 (14,4%) martori. Diferența procentuală, cunoscută sub numele de reducere absolută a riscului, este de 10,1%. SE al acestei diferențe este de 0,99%. În consecință, IC 95% este de 10,1% + 1,96 x 0,99%, adică de la 8,2 la 12,0.

În pofida diferitelor abordări filosofice, testele de semnificație CI și statistice sunt strâns legate matematic.

Astfel, valoarea P este „semnificativă”, adică R<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

Incertitudinea (incertitudinea) estimării, exprimată în CI, este în mare parte legată de rădăcina pătrată a mărimii eșantionului. Eșantioanele mici oferă mai puține informații decât cele mari, iar CI este corespunzător mai largă în eșantionul mai mic. De exemplu, un articol care compara caracteristicile a trei teste care sunt utilizate pentru diagnosticarea infecției cu Helicobacter pylori a raportat o sensibilitate de 95,8% din testul de respirație cu uree (95% CI 75-100). În timp ce numărul de 95,8% pare impresionant, un eșantion mic de 24 de pacienți adulți cu I. pylori înseamnă că există o incertitudine semnificativă în această estimare, după cum se arată în CI largă. Într-adevăr, limita inferioară de 75% este mult mai mică decât estimarea de 95,8%. Dacă aceeași sensibilitate a fost observată la un eșantion de 240 de persoane, atunci IC 95% ar fi de 92,5-98,0, oferind mai multe garanții că testul este extrem de sensibil.

În studiile controlate randomizate (ECA), rezultatele nesemnificative (de exemplu, cele cu P> 0,05) sunt deosebit de susceptibile la interpretări greșite. IC este deosebit de util aici, deoarece arată cât de consistente sunt rezultatele cu efectul real benefic clinic. De exemplu, într-un RCT care compară sutura și capsarea anastomozei cu colonul, infecția plăgii s-a dezvoltat la 10,9% și respectiv 13,5% dintre pacienți (P = 0,30). IC 95% pentru această diferență este de 2,6% (-2 până la +8). Chiar și în acest studiu pe 652 de pacienți, rămâne probabilitatea ca există o diferență modestă în incidența infecțiilor rezultate din cele două proceduri. Cu cât sunt mai puține cercetări, cu atât este mai mare incertitudinea. Sung și colab. a efectuat un RCT pentru a compara perfuzia de octreotidă cu scleroterapia de urgență pentru sângerarea variceală acută la 100 de pacienți. În grupul octreotidic, rata de sângerare a fost de 84%; în grupul de scleroterapie - 90%, ceea ce dă P = 0,56. Rețineți că ratele de sângerare în curs sunt similare cu cele ale infecției plăgii din studiul menționat. Cu toate acestea, în acest caz, IC 95% pentru diferența dintre intervenții este de 6% (-7 până la +19). Acest interval este destul de larg în comparație cu diferența de 5% care ar fi de interes clinic. Este clar că studiul nu exclude o diferență semnificativă de eficacitate. Prin urmare, concluzia autorilor „perfuzia octreotidă și scleroterapia sunt la fel de eficiente în tratarea sângerării varicelor” nu este cu siguranță valabilă. În astfel de cazuri, în care, ca și aici, IC de 95% pentru reducerea riscului absolut (ARR) include zero, CI pentru numărul necesar pentru tratare (NNT) este destul de dificil de interpretat ... NPLP și CI-ul său sunt derivate din reciprocul ACP (înmulțit cu 100 dacă aceste valori sunt date ca procente). Aici obținem BPPD = 100: 6 = 16,6 cu un IC 95% de la -14,3 la 5,3. După cum puteți vedea din nota de subsol „d” din tabel. A1.1, acest CI include valorile BPHP de la 5,3 la infinit și valorile BPHP de la 14,3 la infinit.

IC-urile pot fi construite pentru cele mai frecvent utilizate statistici sau comparații. Pentru ECA, include diferența dintre proporțiile medii, riscurile relative, raporturile de șanse și NPP. În mod similar, IC-urile pot fi obținute pentru toate estimările majore făcute în studiile de precizie a testelor de diagnostic - sensibilitate, specificitate, valoare predictivă pozitivă (toate acestea sunt proporții simple) și rapoarte de probabilitate - estimări din meta-analize și studii de comparare cu control. Un program de calculator pentru computerele personale care acoperă multe dintre aceste utilizări ale ID-ului este disponibil împreună cu cea de-a doua ediție a Statisticilor cu încredere. Macrocomenzile pentru calcularea CI pentru proporții sunt disponibile gratuit pentru Excel și programele statistice SPSS și Minitab la http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics / research / statistics / proportions, htm.

Evaluări multiple ale efectului tratamentului

Deși IC sunt de dorit pentru rezultatele primare ale studiului, ele nu sunt necesare pentru toate rezultatele. CI se ocupă de comparații relevante clinic. De exemplu, atunci când se compară două grupuri, CI care este construit pentru a distinge între grupuri, așa cum se arată în exemplele de mai sus, este corect și nu CI care poate fi construit pentru evaluare în fiecare grup. Nu numai că este inutil să furnizați IC separate pentru evaluările din fiecare grup, această reprezentare poate fi înșelătoare. De asemenea, abordarea corectă atunci când se compară eficacitatea tratamentului în diferite subgrupuri este de a compara direct două (sau mai multe) subgrupuri. Este incorect să presupunem că tratamentul este eficient într-un singur subgrup dacă IC-ul său nu exclude niciun efect, iar altele nu. IC sunt, de asemenea, utile atunci când se compară rezultatele între mai multe subgrupuri. În fig. A 1.1 arată riscul relativ de eclampsie la femeile cu preeclampsie la un subgrup de femei dintr-un ECA controlat cu placebo de sulfat de magneziu.

Orez. A1.2. Graficul forestier prezintă rezultatele a 11 studii clinice randomizate ale vaccinului rotavirus bovin pentru prevenirea diareei versus placebo. În evaluarea riscului relativ de diaree, a fost utilizat un interval de încredere de 95%. Dimensiunea pătratului negru este proporțională cu cantitatea de informații. În plus, sunt prezentate scorul cumulativ al eficacității tratamentului și intervalul de încredere de 95% (notat cu un diamant). Metaanaliza a folosit un model de efecte aleatorii care depășește unele dintre cele prestabilite; de exemplu, ar putea fi dimensiunea utilizată la calcularea mărimii eșantionului. Pentru un criteriu mai strict, întreaga gamă CI ar trebui să prezinte beneficii care depășesc un minim predeterminat.

Am discutat deja eroarea în care lipsa semnificației statistice este luată ca o indicație că două tratamente sunt la fel de eficiente. Este la fel de important să nu se echivaleze semnificația statistică cu semnificația clinică. Importanța clinică poate fi asumată atunci când rezultatul este semnificativ statistic și amploarea evaluării eficacității tratamentului

Cercetările pot arăta dacă rezultatele sunt semnificative statistic și care sunt importante din punct de vedere clinic și care nu. În fig. A1.2 arată rezultatele a patru teste, pentru care întregul CI<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

Interval de încredere pentru valoarea așteptată - acesta este un astfel de interval calculat din date, care, cu o probabilitate cunoscută, conține așteptarea matematică a populației generale. O estimare naturală pentru așteptarea matematică este media aritmetică a valorilor sale observate. Prin urmare, mai departe în lecție, vom folosi termenii „medie”, „valoare medie”. În sarcinile de calcul al intervalului de încredere, este cel mai adesea necesar un răspuns de tipul „Intervalul de încredere al mediei [valoarea într-o anumită problemă] este de la [valoare mai mică] la [valoare mai mare]”. Cu ajutorul intervalului de încredere, este posibil să se estimeze nu numai valorile medii, ci și greutatea specifică a unei anumite caracteristici a populației generale. Valorile medii, varianța, abaterea standard și eroarea, prin care vom ajunge la noi definiții și formule, sunt dezasamblate în lecție Eșantion și caracteristici ale populației .

Estimări punctuale și intervale ale mediei

Dacă valoarea medie a populației generale este estimată cu un număr (punct), atunci estimarea valorii medii necunoscute a populației generale este considerată a fi media specifică, care se calculează din eșantionul de observații. În acest caz, valoarea eșantionului mediu - o variabilă aleatorie - nu coincide cu valoarea medie a populației generale. Prin urmare, atunci când se specifică valoarea medie a eșantionului, este necesar să se indice în același timp eroarea de eșantionare. Ca măsură a erorii de eșantionare, se folosește eroarea standard, care este exprimată în aceleași unități ca media. Prin urmare, se folosește adesea următoarea notație:.

Dacă estimarea mediei trebuie să fie asociată cu o anumită probabilitate, atunci parametrul de interes pentru populația generală trebuie estimat nu cu un număr, ci cu un interval. Intervalul de încredere este intervalul în care, cu o anumită probabilitate P se găsește valoarea indicatorului estimat al populației generale. Interval de încredere, în care probabilitatea P = 1 - α se găsește o variabilă aleatorie, calculată după cum urmează:

,

α = 1 - P, care poate fi găsit în anexa la aproape orice carte de statistici.

În practică, media și varianța populației nu sunt cunoscute, astfel încât varianța populației este înlocuită de varianța eșantionului, iar media populației este înlocuită cu media eșantionului. Astfel, intervalul de încredere în majoritatea cazurilor se calculează după cum urmează:

.

Formula intervalului de încredere poate fi utilizată pentru a estima media populației dacă

  • se cunoaște abaterea standard a populației;
  • sau abaterea standard a populației nu este cunoscută, dar dimensiunea eșantionului este mai mare de 30.

Media eșantionului este estimarea imparțială a mediei populației. La rândul său, varianța eșantionului nu este o estimare imparțială a varianței populației. Pentru a obține o estimare imparțială a varianței populației generale în formula varianței eșantionului, dimensiunea eșantionului n trebuie înlocuit cu n-1.

Exemplul 1. Informații colectate de la 100 de cafenele selectate aleatoriu dintr-un oraș, conform cărora numărul mediu de angajați din acestea este de 10,5, cu o abatere standard de 4,6. Determinați intervalul de încredere de 95% din numărul lucrătorilor din cafenele.

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,05 .

Astfel, intervalul de încredere de 95% pentru numărul mediu de lucrători în cafenele a variat între 9,6 și 11,4.

Exemplul 2. Pentru un eșantion aleatoriu dintr-o populație generală de 64 de observații, au fost calculate următoarele valori totale:

suma valorilor din observații,

suma pătratelor abaterii valorilor de la medie .

Calculați intervalul de încredere de 95% pentru așteptare.

calculați abaterea standard:

,

calculați valoarea medie:

.

Înlocuiți valorile în expresie pentru intervalul de încredere:

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,05 .

Primim:

Astfel, intervalul de încredere de 95% pentru așteptările matematice ale acestui eșantion au variat între 7.484 și 11.266.

Exemplul 3. Pentru un eșantion aleatoriu dintr-o populație generală de 100 de observații, valoarea medie a fost de 15,2, iar abaterea standard a fost de 3,2. Calculați intervalul de încredere de 95% pentru așteptare, apoi intervalul de încredere de 99%. Dacă dimensiunea eșantionului și variația sa rămân neschimbate și coeficientul de încredere crește, intervalul de încredere se va restrânge sau se va lărgi?

Înlocuiți aceste valori în expresia pentru intervalul de încredere:

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,05 .

Primim:

.

Astfel, intervalul de încredere de 95% pentru media acestui eșantion a variat între 14,57 și 15,82.

Încă o dată, substituim aceste valori în expresie pentru intervalul de încredere:

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,01 .

Primim:

.

Astfel, intervalul de încredere de 99% pentru media acestui eșantion a variat de la 14,37 la 16,02.

După cum puteți vedea, cu o creștere a coeficientului de încredere, crește și valoarea critică a distribuției normale standard și, prin urmare, punctele de început și sfârșit ale intervalului sunt situate mai departe de medie și, astfel, intervalul de încredere pentru că speranța matematică crește.

Estimări punctuale și intervale ale greutății specifice

Greutatea specifică a unor caracteristici ale eșantionului poate fi interpretată ca o estimare punctuală a greutății specifice p aceeași trăsătură în populația generală. Dacă această valoare trebuie să fie legată de probabilitate, atunci trebuie calculat intervalul de încredere al greutății specifice p trăsătură la populația generală cu probabilitate P = 1 - α :

.

Exemplul 4. Există doi candidați într-un oraș Ași B candidați la funcția de primar. Au fost intervievați la întâmplare 200 de locuitori ai orașului, dintre care 46% au răspuns că vor vota pentru candidat A, 26% - pentru candidat B iar 28% nu știu pentru cine vor vota. Determinați intervalul de încredere de 95% pentru proporția locuitorilor orașului care susțin candidatul A.

Konstantin Krawchik explică în mod clar ce este un interval de încredere în cercetarea medicală și cum să îl utilizați.

Katren-Stil continuă să publice un ciclu de Konstantin Kravchik despre statistici medicale. În cele două articole anterioare, autorul s-a ocupat de explicația unor concepte precum și.

Konstantin Kravchik

Matematician analitic. Specialist în cercetări statistice în medicină și științe umane

Orașul Moscovei

Foarte des în articolele despre studiile clinice, puteți găsi o frază misterioasă: „interval de încredere” (95% CI sau 95% CI - interval de încredere). De exemplu, articolul poate citi: „Pentru a evalua semnificația diferențelor, testul t Student a fost utilizat cu calculul unui interval de încredere de 95%”.

Care este valoarea „intervalului de încredere de 95%” și de ce ar trebui calculat?

Ce este un interval de încredere? - Acesta este intervalul în care mediile reale sunt în populație. Și ce, există valori medii „neadevărate”? Într-un sens, da, există. Am explicat că este imposibil să se măsoare parametrul de interes pentru întreaga populație, astfel încât cercetătorii sunt mulțumiți de un eșantion limitat. În acest eșantion (de exemplu, după greutatea corporală) există o valoare medie (o anumită greutate), după care judecăm valoarea medie în întreaga populație generală. Cu toate acestea, greutatea medie din eșantion (în special mică) este puțin probabil să coincidă cu greutatea medie din populația generală. Prin urmare, este mai corect să calculați și să folosiți gama valorilor medii ale populației generale.

De exemplu, imaginați-vă că IC 95% (IC 95%) pentru hemoglobină este de 110 până la 122 g / L. Aceasta înseamnă că, cu o probabilitate de 95%, valoarea medie reală a hemoglobinei în populația generală va fi cuprinsă între 110 și 122 g / l. Cu alte cuvinte, nu cunoaștem hemoglobina medie în populația generală, dar putem indica gama de valori pentru această trăsătură cu probabilitate de 95%.

Intervalul de încredere este deosebit de relevant pentru diferența de medii între grupuri sau, așa cum se numește, mărimea efectului.

Să presupunem că am comparat eficacitatea a două preparate de fier: unul care a fost pe piață de mult timp și unul care tocmai a fost înregistrat. După cursul terapiei, a fost evaluată concentrația de hemoglobină în grupurile studiate de pacienți, iar programul statistic a calculat că diferența dintre valorile medii ale celor două grupuri cu o probabilitate de 95% este în intervalul de la 1,72 la 14,36 g / l (Tabelul 1).

Tab. 1. Criteriul pentru eșantioane independente
(se compară grupurile după nivelul de hemoglobină)

Acest lucru ar trebui interpretat după cum urmează: la unii dintre pacienții din populația generală care iau noul medicament, hemoglobina va fi mai mare în medie cu 1,72-14,36 g / l decât la cei care au luat medicamentul deja cunoscut.

Cu alte cuvinte, în populația generală, diferența dintre valorile medii ale hemoglobinei în grupurile cu o probabilitate de 95% se încadrează în aceste limite. Va rămâne la latitudinea cercetătorului să judece dacă este mult sau nu. Ideea tuturor este că lucrăm nu cu o valoare medie, ci cu o gamă de valori, prin urmare, estimăm mai fiabil diferența de parametru între grupuri.

În pachetele statistice, la discreția cercetătorului, puteți restrânge sau extinde în mod independent limitele intervalului de încredere. Reducând probabilitatea intervalului de încredere, restrângem gama mijloacelor. De exemplu, la 90% CI, gama de medii (sau diferența de medii) va fi mai restrânsă decât la 95%.

În schimb, creșterea probabilității la 99% lărgește gama de valori. La compararea grupurilor, limita inferioară a CI poate depăși marca zero. De exemplu, dacă am extins intervalul de încredere la 99%, atunci limitele intervalului au variat de la –1 la 16 g / L. Aceasta înseamnă că în populația generală există grupuri, diferența dintre mijloacele dintre care conform atributului studiat este egală cu 0 (M = 0).

Cu intervalul de încredere, puteți testa ipoteze statistice. Dacă intervalul de încredere trece de zero, atunci ipoteza nulă, care presupune că grupurile nu diferă în parametrul studiat, este corectă. Un exemplu este descris mai sus, când am extins limitele la 99%. Undeva în populația generală, am găsit grupuri care nu difereau în niciun fel.

Interval de încredere de 95% al ​​diferenței de hemoglobină, (g / l)


Linia arată intervalul de încredere de 95% pentru diferența de hemoglobină medie între cele două grupuri. Linia trece de zero, prin urmare, există o diferență între medii egale cu zero, ceea ce confirmă ipoteza nulă că grupurile nu diferă. Intervalul de diferență între grupuri este de la –2 la 5 g / l, ceea ce înseamnă că hemoglobina poate scădea cu 2 g / l sau crește cu 5 g / l.

Intervalul de încredere este o valoare foarte importantă. Datorită lui, puteți vedea dacă diferențele din grupuri s-au datorat într-adevăr diferenței de medii sau datorită unui eșantion mare, deoarece cu un eșantion mare șansele de a găsi diferențe sunt mai mari decât cu unul mic.

În practică, ar putea arăta așa. Am luat un eșantion de 1000 de persoane, am măsurat nivelul de hemoglobină și am constatat că intervalul de încredere pentru diferența dintre medii a fost de la 1,2 la 1,5 g / L. Nivelul de semnificație statistică în acest caz p

Vedem că concentrația hemoglobinei a crescut, dar aproape imperceptibil, prin urmare, semnificația statistică a apărut tocmai datorită dimensiunii eșantionului.

Intervalul de încredere poate fi calculat nu numai pentru valorile medii, ci și pentru proporții (și raporturi de risc). De exemplu, ne interesează intervalul de încredere al proporțiilor pacienților care au obținut remisiunea în timp ce luau un medicament dezvoltat. Să presupunem că IC 95% pentru proporții, adică pentru proporția acestor pacienți, se situează în intervalul 0,60-0,80. Astfel, putem spune că medicamentul nostru are un efect terapeutic de la 60 la 80% din cazuri.