Интервалът на доверие е формула за изчисляване на физик. Конструиране на доверителния интервал за математическите очаквания на общата популация. Метод за интервал на доверие

Последна актуализация: 3 март 2020 г.
Примерен файл

Нека изградим доверителен интервал в MS EXCEL, за да оценим средната стойност на разпределението в случая с известно значениевариация.

Разбира се, изборът ниво на довериенапълно зависи от решаващия се проблем. По този начин степента на увереност на пътника във въздуха в надеждността на самолета несъмнено трябва да бъде по -висока от степента на увереност на купувача в надеждността на крушката.

Декларация за проблема

Да предположим, че от общото населениекато са взели пробаразмер n. Предполага се, че стандартно отклонениетова разпределение е известно. Това е необходимо въз основа на това вземане на пробиоцени непознатото средно разпределение(μ,) и конструирайте съответното двустранендоверителен интервал .

Точкова оценка

Както е известно от, статистика(ние го обозначаваме X ср) е безпристрастна оценка на средната стойносттова общото населениеи има разпределение N (μ; σ 2 / n).

Забележка : Какво да направите, ако трябва да изградите доверителен интервалв случай на разпределение, което не енормално?В този случай идва на помощ, което казва, че с достатъчно голям размер вземане на проби n от разпределението да не бъдешнормално , примерно разпределение на статистиката X прще приблизителносъответстват нормална дистрибуцияс параметри N (μ; σ 2 / n).

Така, точкова оценкасреднаразпределителни стойностиимаме - това средна проба, т.е. X ср... Сега нека да преминем към доверителен интервал.

Начертаване на интервал на доверие

Обикновено, знаейки разпределението и неговите параметри, можем да изчислим вероятността случайната променлива да вземе стойност от посочения от нас интервал. Сега нека направим обратното: намерете интервала, в който случайната променлива ще попадне с дадена вероятност. Например от свойствата нормална дистрибуцияизвестно е, че с вероятност 95%, случайна величина, разпределена по нормален закон, ще попадне в интервал от приблизително +/- 2 от средна стойност(вижте статията за). Този интервал ще ни послужи като прототип доверителен интервал .

Сега нека разберем дали знаем разпределението , да се изчисли този интервал? За да отговорим на въпроса, трябва да посочим формата на разпределението и неговите параметри.

Ние знаем формата за разпространение - това е така нормална дистрибуция(припомнете, че говорим разпределение на пробатастатистикаX ср).

Не знаем параметъра μ (просто трябва да бъде оценен с помощта доверителен интервал), но имаме неговата оценка X ср.,се изчислява въз основа на вземане на проби,които могат да се използват.

Вторият параметър е стандартно отклонение на средната пробаще го считаме за известен, той е равен на σ / √n.

Защото не познаваме μ, тогава ще конструираме интервала +/- 2 стандартни отклоненияне от средна стойност, и от известната му оценка X ср... Тези. при изчисляване доверителен интервалние НЕ ще приемем това X српопада в рамките на +/- 2 стандартни отклоненияот μ с вероятност 95%и ще приемем, че интервалът +/- 2 стандартни отклоненияот X срс вероятност 95% ще покрие μ - средно за общото население,от който е взет проба... Тези две твърдения са еквивалентни, но второто твърдение ни позволява да конструираме доверителен интервал .

В допълнение, нека прецизираме интервала: случайна променлива, разпределена по нормален закон, с вероятност 95% попада в интервала +/- 1.960 стандартни отклонения,не +/- 2 стандартни отклонения... Това може да се изчисли по формулата = NORM.ST.OBR ((1 + 0,95) / 2), см. примерен файл Разстояние между листа .

Вече можем да формулираме вероятностно твърдение, което ще ни послужи за формиране доверителен интервал: „Вероятността това средно населениее от средна пробав рамките на 1,960 " стандартни отклонения на средната проба "е равно на 95% ".

Стойността на вероятността, спомената в изявлението, има специално име която е свързана сниво на значимост α (алфа) чрез прост израз ниво на доверие = 1 . В нашия случай ниво на значимост α =1-0,95=0,05 .

Сега, въз основа на това вероятностно твърдение, ние записваме израз за изчисляване доверителен интервал :

където Z α / 2 стандартнормална дистрибуция(такава стойност на случайната променлива z , Какво P (z >= Z α / 2 ) = α / 2).

Забележка : Горен α / 2-квантилопределя ширината доверителен интервал v стандартни отклонениясредна проба. Горен α / 2-квантил стандартнормална дистрибуциявинаги по -голямо от 0, което е много удобно.

В нашия случай, при α = 0,05, горен α / 2-квантил е равно на 1.960. За други нива на значимост α (10%; 1%) горен α / 2-квантилZ α / 2 може да се изчисли по формулата = СТАНДАРТЕН ST.OBR (1-α / 2)или ако е известно ниво на доверие , = NORM.ST.OBR ((1 + ниво на доверие) / 2) .

Обикновено при изграждането доверителни интервали за оценка на средната стойностизползвайте само горен α /2- квантили не използвайте по -ниско α /2- квантил... Това е възможно, защото стандартнормална дистрибуциясиметрично около оста x ( плътността му на разпределениесиметрично по отношение на средно, т.е. 0) . Следователно няма нужда да се изчислява по-нисък α / 2-квантил(нарича се просто α / 2-квантил), защото той е равен горен α /2- квантилсъс знак минус.

Припомнете си, че въпреки формата на разпределение на величината x, съответната случайна променлива X срразпределени приблизителноглоба N (μ; σ 2 / n) (вижте статията за). Следователно в общия случай горният израз за доверителен интервале само приблизително. Ако количеството х е разпределено по нормален закон N (μ; σ 2 / n), тогава изразът за доверителен интервале точен.

Изчисляване на доверителен интервал в MS EXCEL

Нека решим проблема. Време за реакция електронен компоненткъм входния сигнал е важна характеристика на устройството. Инженерът иска да начертае доверителен интервал за средното време на реакция при 95% ниво на доверие. Инженерът знае от предишен опит, че стандартното отклонение на времето за реакция е 8ms. Известно е, че инженерът е направил 25 измервания, за да оцени времето за реакция, средната стойност е 78 ms.

Решение: Инженер иска да знае времето за реакция на електронно устройство, но разбира, че времето за реакция не е фиксирана, а случайна променлива, която има свое собствено разпределение. Така че най -доброто, на което може да разчита, е да определи параметрите и формата на това разпределение.

За съжаление, от констатацията на проблема не знаем формата на разпределение на времето за реакция (не е задължително нормално). , това разпределение също е неизвестно. Известен само с него стандартно отклонениеσ = 8. Следователно, докато можем да изчислим вероятностите и да изградим доверителен интервал .

Въпреки това, въпреки факта, че не знаем разпространението времеотделен отговор, знаем, че според CPT , разпределение на пробатасредно време за реакцияе приблизително нормално(ще приемем, че условията CPTсе извършват, защото размерът вземане на пробидостатъчно голям (n = 25)) .

Освен това, среднотона това разпределение е средно аритметичноразпределението на единичен отговор, т.е. μ. А стандартно отклонениена това разпределение (σ / √n) може да се изчисли по формулата = 8 / ROOT (25).

Известно е също, че инженерът е получил точкова оценкапараметър μ равен на 78 msec (X вж.). Следователно, сега можем да изчислим вероятностите, тъй като познаваме формата за разпространение ( нормално) и неговите параметри (X cf и σ / √n).

Инженерът иска да знае очакваната стойностμ от разпределението на времето за реакция. Както бе споменато по -горе, този μ е равен на математическото очакване на разпределението на извадката на средното време за реакция... Ако използваме нормална дистрибуция N (X cf; σ / √n), тогава желаната μ ще бъде в диапазона +/- 2 * σ / √n с вероятност от около 95%.

Ниво на значимосте равно на 1-0.95 = 0.05.

Накрая намерете лявата и дясната граница доверителен интервал... Лява граница: = 78-СТАНДАРТЕН ST.OBR (1-0.05 / 2) * 8 / ROOT (25) = 74,864 Дясна граница: = 78 + NORM.ST.OBR (1-0.05 / 2) * 8 / ROOT (25) = 81.136

Лява граница: = NORM.OBR (0,05 / 2; 78; 8 / ROOT (25))Дясна граница: = NORM.INV (1-0.05 / 2; 78; 8 / ROOT (25))

Отговор : доверителен интервалпри ниво на доверие 95% и σ =8 Госпожицае равно на 78 +/- 3.136 мсек.

V примерен файл на работен лист Sigmaизвестен е формуляр за изчисление и изграждане двустраннодоверителен интервалза произволно пробис даден σ и ниво на значимост .

CONFIDENCE.NORM () функция

Ако стойностите вземане на пробиса в диапазона B20: B79 , а ниво на значимостравен на 0,05; след това формулата MS EXCEL: = СРЕДНО (B20: B79) -ДОВЕРИЕ.НОРМА (0,05, σ, БРОЙ (B20: B79))ще върне лявата граница доверителен интервал .

Същата граница може да бъде изчислена по формулата: = СРЕДНО (B20: B79) -NORM.ST.INV (1-0.05 / 2) * σ / ROOT (БРОЙ (B20: B79))

Забележка: Функцията CONFIDENCE.NORM () се появи в MS EXCEL 2010. В по -ранните версии на MS EXCEL се използваше функцията CONFIDENCE ().

В предишните подраздели разгледахме въпроса за оценка на неизвестен параметър аедно число. Тази оценка се нарича "точка". В редица задачи се изисква не само намирането на параметъра аподходяща числена стойност, но също така да се оцени нейната точност и надеждност. Искате да знаете до какви грешки може да доведе заместването на параметър анеговата точкова оценка аи с каква степен на сигурност можем да очакваме тези грешки да останат в известните граници?

Проблемите от този вид са особено актуални за малък брой наблюдения, когато точката се оценява и вдо голяма степен това е случайно и приблизителната подмяна на a с a може да доведе до сериозни грешки.

Да даде представа за точността и надеждността на оценката а,

в математическата статистика се използват така наречените доверителни интервали и вероятности на доверие.

Нека за параметъра аот опит безпристрастна оценка а.Искаме да оценим възможната грешка в този случай. Нека присвоим някаква достатъчно голяма вероятност p (например p = 0,9, 0,95 или 0,99), така че събитие с вероятност p може да се счита за практически надеждно и намираме такава стойност s, за която

След това диапазонът от практически възможни стойности на грешката, възникващи при подмяната аНа а, ще бъде ± s; големи по абсолютна стойност грешки ще се появят само с малка вероятност a = 1 - p. Пренаписваме (14.3.1) като:

Равенството (14.3.2) означава, че с вероятност p неизвестната стойност на параметъра апопада в интервала

В същото време трябва да се отбележи едно обстоятелство. По-рано многократно сме обмисляли вероятността случайна величина да попадне в даден неслучайен интервал. Тук ситуацията е различна: количеството ане е случаен, но интервалът / p е случаен. Случайно позицията му по оста на абсцисата, определена от центъра му а; дължината на интервала 2s също е произволна като цяло, тъй като стойността на s се изчислява, като правило, от експериментални данни. Следователно, в този случай би било по -добре да се тълкува стойността на р, а не като вероятността да се "удари" точката ав интервала / p и като вероятността случайният интервал / p да покрие точката а(фиг. 14.3.1).

Ориз. 14.3.1

Обикновено се извиква вероятността p ниво на увереност, а интервалът / p е доверителен интервал.Интервални граници Ако. a x = a-пясък a 2 = a +но се обади граници на доверие.

Нека да дадем още една интерпретация на концепцията за доверителен интервал: тя може да се разглежда като интервал от стойности на параметрите а,съвместими с експериментални данни и не им противоречат. Всъщност, ако се съгласим да считаме събитие с вероятност a = 1-p практически невъзможно, тогава тези стойности на параметъра a, за които а - а> s, трябва да бъдат признати като противоречащи на експерименталните данни и тези, за които | a - а a t na 2.

Нека за параметъра аима безпристрастна оценка а.Ако знаехме закона за разпределение на количеството а, проблемът с намирането на доверителния интервал би бил съвсем прост: би било достатъчно да се намери такава стойност на s, за която

Трудността е, че законът за разпределение на оценката азависи от закона за разпределение на количеството хи следователно върху неговите неизвестни параметри (по -специално върху самия параметър а).

За да заобиколите тази трудност, може да се приложи следното грубо приближение: заменете неизвестните параметри в израза за s с техните точкови оценки. С относително голям брой експерименти NS(около 20 ... 30) тази техника обикновено дава задоволителни резултати по отношение на точността.

Като пример, помислете за проблема за доверителния интервал за математическите очаквания.

Нека се произвежда NS Х,чиито характеристики са математическите очаквания Tи вариация д- неизвестно. За тези параметри бяха получени следните оценки:

Необходимо е да се изгради доверителния интервал / p, съответстващ на доверителната вероятност p, за математическото очакване Tвеличини Х.

При решаването на този проблем ще използваме факта, че количеството Tпредставлява сумата NSнезависими идентично разпределени случайни променливи X чи според централната гранична теорема за достатъчно големи NSнеговият закон за разпределение е близо до нормалното. На практика, дори при относително малък брой членове (около 10 ... 20), законът за разпределение на сумата може да се счита приблизително за нормален. Ще изходим от факта, че количеството Tразпределени съгласно нормалния закон. Характеристиките на този закон - математическите очаквания и вариацията - са съответно равни Tи

(виж глава 13 подраздел 13.3). Да предположим, че количеството дние знаем и намираме такава стойност Ep, за която

Прилагайки формула (6.3.5) в глава 6, ние изразяваме вероятността от лявата страна на (14.3.5) по отношение на нормалната функция на разпределение

където е стандартното отклонение на оценката T.

От уравнението

намираме стойността на Sp:

където arg Ф * (х) е обратната функция на Ф * (NS),тези. такава стойност на аргумента, за която нормалната функция за разпределение е равна на NS.

Дисперсия Д,чрез която се изразява стойността а 1P, не знаем точно; като приблизителна стойност, можете да използвате прогнозата д(14.3.4) и поставете приблизително:

По този начин проблемът за изграждане на доверителен интервал е приблизително решен, което е равно на:

където gp е дефинирано по формула (14.3.7).

За да се избегне обратна интерполация в таблиците на функцията Ф * (l) при изчисляване на s p, е удобно да се състави специална таблица (Таблица 14.3.1), която дава стойностите на количеството

в зависимост от стр. Количеството (p определя за нормалния закон броя на стандартните отклонения, които трябва да бъдат отделени вдясно и вляво от центъра на разсейване, за да може вероятността от удара в получената област да бъде равна на p.

Чрез стойността на 7 p доверителният интервал се изразява като:

Таблица 14.3.1

Пример 1. Проведени са 20 експеримента за стойността Х;резултатите са показани в таблицата. 14.3.2.

Таблица 14.3.2

Необходимо е да се намери оценка на математическото очакване на количеството хи изграждане на доверителен интервал, съответстващ на ниво на доверие p = 0,8.

Решение.Ние имаме:

След като избрахме за начало l: = 10, съгласно третата формула (14.2.14) намираме безпристрастната оценка д :

Според таблицата. 14.3,1 находка

Граници на доверие:

Доверителен интервал:

Стойности на параметрите T,лежащи в този интервал са в съответствие с експерименталните данни, дадени в табл. 14.3.2.

Доверителният интервал за дисперсията може да бъде конструиран по подобен начин.

Нека се произвежда NSнезависими експерименти върху случайна променлива хс неизвестни параметри от и А и за вариацията дсе получава безпристрастната оценка:

Изисква се приблизително да се изгради доверителния интервал за дисперсията.

От формула (14.3.11) се вижда, че количеството дпредставлява

сумата NSслучайни променливи на формата. Тези количества не са

независими, тъй като всеки от тях включва количеството T,зависим от всички останали. Може обаче да се покаже, че с увеличаване NSзаконът за разпределение на тяхната сума също е близък до нормалния. Практически при NS= 20 ... 30 вече може да се счита за нормално.

Да приемем, че това е така, и да намерим характеристиките на този закон: математически очаквания и вариация. От резултата д- безпристрастно, значи M [D] = D.

Изчисляване на дисперсия D Dе свързано със сравнително сложни изчисления, затова даваме неговия израз без изход:

където q 4 е четвъртият централен момент на величината Х.

За да използвате този израз, трябва да замените стойностите 4 и д(поне приблизително). Вместо дможете да използвате неговата оценка Д.По принцип четвъртият централен момент може също да бъде заменен с оценка, например със стойност на формата:

но такава подмяна ще даде изключително ниска точност, тъй като като цяло, с ограничен брой експерименти, моментите от висок порядък се определят с големи грешки. На практика обаче често се случва формата на закона за разпределение на количеството хизвестен предварително: неизвестни са само параметрите му. Тогава можем да се опитаме да изразим q 4 чрез Д.

Нека вземем най -честия случай, когато количеството хразпределени съгласно нормалния закон. Тогава четвъртият му централен момент се изразява чрез вариация (виж глава 6, подраздел 6.2);

и формула (14.3.12) дава или

Замяна в (14.3.14) на неизвестното днеговата оценка д, получаваме: откъде

Моментът c 4 може да се изрази чрез дсъщо и в някои други случаи, когато разпределението на количеството хне е нормално, но външният му вид е известен. Например, за закона за еднаква плътност (виж глава 5) имаме:

където (a, P) е интервалът, на който е зададен законът.

Следователно,

По формулата (14.3.12) получаваме: откъдето откриваме приблизително

В случаите, когато формата на закона за разпределение на 26 е неизвестна, все пак се препоръчва да се използва формула (14.3.16) при груба оценка на стойността на a /), освен ако няма специални причини да се смята, че този закон е много различен от нормалното (има забележим положителен или отрицателен излишък) ...

Ако приблизителната стойност на a /) се получи по един или друг начин, тогава е възможно да се изгради доверителен интервал за дисперсията по същия начин, по който ние го изградихме за математическото очакване:

където стойността, в зависимост от дадената вероятност p, се намира според таблицата. 14.3.1.

Пример 2. Намерете приблизително 80% доверителен интервал за дисперсията на случайна величина хпри условията на пример 1, ако е известно, че количеството хразпределени съгласно закон, близък до нормалния.

Решение.Стойността остава същата като в таблицата. 14.3.1:

Съгласно формулата (14.3.16)

Използвайки формулата (14.3.18), намираме доверителния интервал:

Съответният диапазон от стойности на стандартното отклонение: (0,21; 0,29).

14.4. Точни методи за изграждане на доверителни интервали за параметрите на случайна величина, разпределени съгласно нормалния закон

В предишния подраздел разгледахме приблизително приблизителни методи за изграждане на доверителни интервали за очакване и вариация. Тук ще дадем представа за точните методи за решаване на същия проблем. Подчертаваме, че за да се намерят точно доверителните интервали, е абсолютно необходимо предварително да се знае формата на закона за разпределение на количеството Х,докато за прилагането на приблизителни методи това не е необходимо.

Идеята зад точните методи за изграждане на доверителни интервали е следната. Всеки доверителен интервал се намира от условието, изразяващо вероятността за изпълнение на някои неравенства, които включват оценката, която ни интересува а.Закон за разпределението на оценките ав общия случай зависи от неизвестните параметри на количеството Х.Понякога обаче е възможно да се преминат в неравенства от случайна променлива акъм някаква друга функция на наблюдаваните стойности X n X 2, ..., X стр.чийто закон на разпределение не зависи от неизвестни параметри, а зависи само от броя на експериментите и от формата на закона за разпределение за количеството Х.Случайни променливи от този вид играят важна роля в математическата статистика; те са проучени най -подробно за случая на нормалното разпределение на количеството Х.

Например, беше доказано, че за нормално разпределение на количеството хслучайна стойност

се подчинява на т.нар Закон за разпределение на ученицис NS- 1 степен на свобода; плътността на този закон има формата

където Г (х) е известната гама функция:

Доказано е също, че случайната променлива

има "разпределение% 2" с NS- 1 степен на свобода (виж глава 7), чиято плътност се изразява с формулата

Без да се спираме на деривациите на разпределения (14.4.2) и (14.4.4), ние показваме как те могат да бъдат приложени при конструиране на доверителни интервали за параметрите ти Д.

Нека се произвежда NSнезависими експерименти върху случайна променлива Х,разпределени по нормалния закон с неизвестни параметри тио.За тези параметри бяха получени оценките

Изисква се изграждане на доверителни интервали и за двата параметъра, съответстващи на вероятността за доверие p.

Нека първо построим доверителния интервал за математическото очакване. Естествено, този интервал се приема симетричен по отношение на T; означаваме с s p половината от дължината на интервала. Стойността s p трябва да бъде избрана така, че условието

Нека се опитаме да преминем от лявата страна на равенството (14.4.5) от случайната променлива Tкъм случайна променлива T,разпределени съгласно студентския закон. За да направите това, умножаваме двете страни на неравенството | m-w? |

с положителна стойност: или, използвайки нотацията (14.4.1),

Нека намерим число / p такова, че стойността / p да се намери от условието

От формула (14.4.2) се вижда, че (1) е четна функция, следователно (14.4.8) дава

Равенството (14.4.9) определя стойността на / p в зависимост от p. Ако имате на ваше разположение таблица със стойности на интеграла

тогава стойността на / p може да бъде намерена чрез обратна интерполация в таблицата. Въпреки това е по -удобно предварително да се състави таблица с / p стойности. Такава таблица е дадена в приложението (Таблица 5). Тази таблица показва стойностите в зависимост от вероятността на доверие р и броя на степента на свобода NS- 1. След определяне на / p съгласно таблицата. 5 и приемайки

ще намерим половината ширина на доверителния интервал / p и самия интервал

Пример 1. Направени са 5 независими експеримента върху случайна променлива Х,нормално разпределени с неизвестни параметри Tи около. Резултатите от експериментите са показани в таблица. 14.4.1.

Таблица 14.4.1

Намерете оценка Tза математическото очакване и да се изгради 90% доверителен интервал / p за него (т.е. интервалът, съответстващ на доверителната вероятност p = 0,9).

Решение.Ние имаме:

Съгласно таблица 5 от заявлението за NS - 1 = 4 и p = 0.9 намираме където

Доверителният интервал ще бъде

Пример 2. За условията на пример 1 от подраздел 14.3, приемайки стойността хразпределени нормално, намерете точния доверителен интервал.

Решение.Според таблица 5 намираме приложения за NS - 1 = 19ir =

0,8 / р = 1,328; оттук

Сравнявайки с решението на пример 1 от подраздел 14.3 (e p = 0.072), ние сме убедени, че несъответствието е много незначително. Ако запазим точността до втория знак след десетичната запетая, тогава доверителните интервали, открити по точни и приблизителни методи, съвпадат:

Нека преминем към изграждането на доверителен интервал за вариацията. Помислете за безпристрастната оценка на дисперсията

и изрази случайната променлива дчрез стойността V(14.4.3) с разпределение x 2 (14.4.4):

Познаване на закона за разпределение на количеството V,може да се намери интервала / (1, в който той попада с дадена вероятност p.

Закон за разпространението k n _ x (v)количество I 7 има формата, показана на фиг. 14.4.1.

Ориз. 14.4.1

Възниква въпросът: как да изберем интервала / p? Ако законът за разпределение на количеството Vе симетрично (като нормалния закон или разпределението на Студент), би било естествено интервалът / p да се вземе симетричен по отношение на математическото очакване. В този случай законът k n _ x (v)асиметрични. Нека се съгласим да изберем интервала / p така, че вероятностите за извеждане на количеството Vизвън интервала вдясно и вляво (сенчестите области на фиг. 14.4.1) бяха еднакви и равни

За да конструираме интервал / p с такова свойство, ще използваме таблица. 4 приложения: в него са изброени числа у)такова, че

за стойността V,с x 2 -разпределение с r степени на свобода. В нашия случай r = n- 1. Нека поправим r = n- 1 и намерете в съответния ред на таблицата. 4 две значения x 2 -едното съответства на вероятността другото - вероятностите Нека ги обозначим

смисъл в 2и xl?Интервалът има в 2,лявата му страна и y ~десен край.

Сега нека намерим желания доверителен интервал / | за дисперсията с граници D, и D 2,която обхваща точката дс вероятност p:

Нека конструираме такъв интервал / (, = (?> B A), който обхваща точката дако и само ако количеството Vпопада в интервала / стр. Нека покажем, че интервалът

отговаря на това условие. Наистина, неравенствата са еквивалентни на неравенствата

и тези неравенства се задоволяват с вероятност р. По този начин доверителният интервал за дисперсията се намира и се изразява с формулата (14.4.13).

Пример 3. Намерете доверителния интервал за дисперсията при условията на пример 2 от подраздел 14.3, ако е известно, че стойността хразпределени нормално.

Решение.Ние имаме ... Съгласно таблица 4 от приложението

намираме при r = n - 1 = 19

Използвайки формулата (14.4.13), намираме доверителния интервал за дисперсията

Съответстващ интервал за стандартно отклонение: (0,21; 0,32). Този интервал само малко надвишава интервала (0.21; 0.29), получен в пример 2 от подраздел 14.3 по приблизителен метод.

  • Фигура 14.3.1 разглежда доверителен интервал, който е симетричен спрямо a. Като цяло, както ще видим по -късно, това не е необходимо.

Доверителен интервал(CI; на английски език, доверителен интервал - CI), получен в проучване с извадка, дава мярка за точността (или несигурността) на резултатите от изследването, за да се направят изводи за популацията на всички такива пациенти (обща популация). Правилното определение на 95% ДИ може да бъде формулирано по следния начин: 95% от тези интервали ще съдържат истинската стойност в популацията. Това тълкуване е малко по -малко точно: CI е диапазонът от стойности, в рамките на който човек може да бъде 95% сигурен, че съдържа истинската стойност. Когато се използват CI, акцентът е върху количественото определяне на ефекта, за разлика от стойността P, която се получава чрез тестване за статистическа значимост. Стойността P не измерва никаква величина, а по -скоро служи като мярка за силата на доказателствата срещу нулевата хипотеза за „без ефект“. Стойността P сама по себе си не ни казва нищо за големината на разликата или дори за нейната посока. Следователно независимите стойности на P са абсолютно неинформативни в статии или резюмета. Обратно, CI показва както размера на ефекта от непосредствен интерес, като полезността на лечението, така и силата на доказателствата. Следователно СИ е пряко свързано с практиката на EBM.

Подход за оценка на Статистически анализ, илюстрирана от CI, е насочена към измерване на размера на интересуващия ефект (чувствителност на диагностичния тест, честотата на прогнозираните случаи, намаляване на относителния риск при лечението и т.н.), както и измерване на несигурността в това ефект. Най -често CI е диапазонът от стойности от двете страни на оценката, в който истинската стойност вероятно ще се крие и можете да сте сигурни на 95% в това. Споразумението да се използва произволно вероятността от 95%, както и стойността P<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

CI се основава на идеята, че същото изследване, проведено върху други проби от пациенти, няма да доведе до идентични резултати, но че техните резултати ще бъдат разпределени около истинска, но неизвестна стойност. С други думи, CI описва това като „променливост, зависима от извадката“. CI не отразява допълнителна несигурност поради други причини; по -специално, той не включва ефектите от селективната загуба на пациент при проследяване, лошото съответствие или неточното измерване на резултата, липсата на заслепяване и т.н. Следователно CI винаги подценява общия размер на несигурността.

Изчисляване на доверителния интервал

Таблица А1.1. Стандартни грешки и доверителни интервали за някои клинични измервания

Обикновено CI се изчислява от наблюдавана оценка на количествена мярка, като например разликата (d) между две пропорции и стандартна грешка (SE) в оценката на тази разлика. Приблизително 95% CI така получен е d ± 1,96 SE. Формулата се променя според естеството на мярката за резултат и обхвата на CI. Например, в рандомизирано, плацебо-контролирано изпитване на ваксина срещу ацелуларна коклюш, 72 от 1670 (4,3%) бебета, които са получили ваксината, развиват коклюш и 240 от 1665 (14,4%) контроли. Разликата в проценти, известна като намаляване на абсолютния риск, е 10,1%. SE на тази разлика е 0,99%. Съответно 95% ДИ е 10,1% + 1,96 х 0,99%, т.е. от 8,2 до 12,0.

Въпреки различните философски подходи, CI и тестовете за статистическа значимост са тясно свързани математически.

По този начин стойността P е "значителна"; R<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

Несигурността (несигурността) на оценката, изразена в CI, е до голяма степен свързана с квадратния корен на размера на извадката. Малките извадки предоставят по -малко информация от големите, а CI съответно е по -широк в по -малката извадка. Например, статия, сравняваща характеристиките на три теста, които се използват за диагностициране на инфекция с Helicobacter pylori, съобщава за чувствителност от 95,8% от дихателния тест за карбамид (95% CI 75-100). Докато броят от 95,8% изглежда впечатляващ, малка извадка от 24 възрастни пациенти с I. pylori означава, че има значителна несигурност в тази оценка, както е показано от широкия CI. Всъщност долната граница от 75% е много по -ниска от прогнозата за 95,8%. Ако същата чувствителност се наблюдава при извадка от 240 души, тогава 95% ДИ би бил 92,5-98,0, което дава повече гаранции, че тестът е силно чувствителен.

В рандомизирани контролирани проучвания (РКИ), незначителните резултати (т.е. тези с Р> 0,05) са особено податливи на погрешно тълкуване. CI е особено полезен тук, защото показва колко последователни са резултатите с клинично благоприятния истински ефект. Например, в RCT, сравняващ конци срещу зашиващи анастомози с дебелото черво, инфекцията на раната се развива съответно при 10,9% и 13,5% от пациентите (Р = 0,30). 95% CI за тази разлика е 2,6% (-2 до +8). Дори в това проучване на 652 пациенти остава вероятността да има умерена разлика в честотата на инфекциите в резултат на двете процедури. Колкото по -малко изследвания, толкова по -голяма е несигурността. Sung et al. извърши RCT, за да сравни инфузията на октреотид с спешната склеротерапия за остро варикозно кървене при 100 пациенти. В групата на октреотид процентът на спиране на кървенето е 84%; в групата на склеротерапията - 90%, което дава Р = 0,56. Имайте предвид, че честотата на продължаващото кървене е подобна на тази на инфекция на раната в споменатото проучване. В този случай обаче 95% CI за разликата в интервенцията е 6% (-7 до +19). Този диапазон е доста широк в сравнение с 5% разлика, която би представлявала клиничен интерес. Ясно е, че изследването не изключва значителна разлика в ефективността. Следователно заключението на авторите „инфузията с октреотид и склеротерапията са еднакво ефективни при лечението на кървене от разширени вени“ определено не е валидно. В случаи като този, където, както тук, 95% CI за абсолютно намаляване на риска (ARR) включва нула, CI за броя, необходим за лечение (NNT) е доста трудно да се тълкува. ... NPLP и неговият CI са получени от реципрочното на ACP (умножено по 100, ако е дадено като проценти). Тук получаваме BPHP = 100: 6 = 16,6 с 95% CI от -14,3 до 5,3. Както можете да видите от бележката под линия "d" в таблицата. А1.1, този CI включва стойностите на BPHP от 5.3 до безкрайност и стойностите на BPHP от 14.3 до безкрайност.

CI могат да бъдат конструирани за най -често използваните статистически оценки или сравнения. За РКИ тя включва разликата между средните пропорции, относителните рискове, коефициентите на шансовете и АЕЦ. По подобен начин CI могат да бъдат получени за всички основни оценки, направени в проучванията за точността на диагностичните тестове - чувствителност, специфичност, прогнозна стойност на положителен резултат (всички те са прости пропорции) и коефициенти на вероятност - оценки, получени в мета -анализи и сравнително-контролни проучвания. Компютърна програма за персонални компютри, която обхваща много от тези употреби на ID, е налична с второто издание на Статистика с увереност. Макроси за изчисляване на CI за пропорции са достъпни безплатно за Excel и статистическите програми SPSS и Minitab на http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/пропорции, htm.

Множество оценки на ефекта от лечението

Въпреки че КИ са желателни за резултатите от първичното изследване, те не са необходими за всички резултати. CI се занимава с клинично значими сравнения. Например, когато се сравняват две групи, правилната CI е тази, създадена, за да прави разлика между групите, както е показано в горните примери, а не CI, която може да бъде изградена за оценката във всяка група. Не само че е безполезно да се предоставят отделни КИ за рейтинги във всяка група, това представяне може да бъде подвеждащо. По същия начин, правилният подход при сравняване на ефикасността на лечението в различни подгрупи е да се сравнят директно две (или повече) подгрупи. Неправилно е да се приеме, че лечението е ефективно само в една подгрупа, ако нейният CI изключва никакъв ефект, а други не. CI са също полезни при сравняване на резултатите в множество подгрупи. На фиг. А 1.1 показва относителния риск от еклампсия при жени с прееклампсия в подгрупа жени от плацебо контролирана RCT на магнезиев сулфат.

Ориз. А1.2. Горският участък показва резултатите от 11 рандомизирани клинични изпитвания на ротавирусна ваксина за говедата за предотвратяване на диария в сравнение с плацебо. При оценката на относителния риск от диария е използван 95% доверителен интервал. Размерът на черния квадрат е пропорционален на количеството информация. Освен това са показани кумулативната оценка на ефикасността на лечението и 95% доверителен интервал (означен с диамант). Мета-анализът използва модел на случайни ефекти, който надхвърля някои от предварително установените; например може да бъде размерът, използван при изчисляване на размера на извадката. За по -строг критерий целият диапазон на CI трябва да показва ползи, надвишаващи предварително определен минимум.

Вече обсъждахме грешката, при която липсата на статистическа значимост се приема като индикация, че две лечения са еднакво ефективни. Също толкова важно е да не се приравнява статистическата значимост с клиничната значимост. Клинично значение може да се заключи, когато резултатът е статистически значим и степента на оценката на ефикасността на лечението

Изследванията могат да покажат дали резултатите са статистически значими и кои са клинично важни и кои не. На фиг. А1.2 показва резултатите от четири теста, за които цялата CI<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

Доверителен интервал за очакваната стойност - това е такъв интервал, изчислен от данните, който с известна вероятност съдържа математическите очаквания на общата популация. Естествена оценка за математическото очакване е средната аритметична стойност на наблюдаваните от него стойности. Затова по -нататък в урока ще използваме термините „средна“, „средна стойност“. В задачите за изчисляване на доверителния интервал най -често се изисква отговор от типа "Доверителният интервал на средната стойност [стойността в конкретен проблем] е от [по -ниска стойност] до [по -висока стойност]". С помощта на доверителния интервал е възможно да се изчислят не само средните стойности, но и специфичното тегло на определена характеристика на общата популация. Средните стойности, вариация, стандартно отклонение и грешка, чрез които ще стигнем до нови определения и формули, се разглобяват в урока Характеристики на пробата и популацията .

Точкови и интервални оценки на средната стойност

Ако средната стойност на генералната съвкупност се оценява с число (точка), тогава оценката на неизвестната средна стойност на генералната съвкупност се приема като специфична средна стойност, която се изчислява от извадката от наблюдения. В този случай стойността на средната извадка - случайна величина - не съвпада със средната стойност на генералната съвкупност. Следователно, когато се посочва средната стойност на пробата, е необходимо едновременно да се посочи грешката при вземане на проби. Като мярка за грешка при извадката се използва стандартната грешка, която се изразява в същите единици като средната стойност. Затова често се използва следната нотация :.

Ако се изисква оценката на средната стойност да бъде свързана с определена вероятност, тогава интересният параметър за общата популация трябва да бъде оценен не с едно число, а с интервал. Доверителният интервал е интервалът, в който с определена вероятност Pе установена стойността на прогнозния показател за общата популация. Доверителен интервал, в който вероятността P = 1 - α е намерена случайна величина, изчислена, както следва:

,

α = 1 - P, които могат да бъдат намерени в приложението към почти всяка книга по статистика.

На практика средната стойност и вариацията на популацията не са известни, така че вариацията на популацията се заменя с вариацията на извадката, а средната стойност на населението се заменя със средната стойност на извадката. По този начин доверителният интервал в повечето случаи се изчислява, както следва:

.

Формулата на доверителния интервал може да се използва за оценка на средната популация, ако

  • стандартното отклонение на общата популация е известно;
  • или стандартното отклонение на популацията не е известно, но размерът на извадката е по -голям от 30.

Средната извадка е безпристрастната оценка на средната популация. От своя страна, вариацията на извадката не е безпристрастна оценка на вариацията на населението. За да се получи безпристрастна оценка на дисперсията на общата популация във формулата за вариация на извадката, размерът на извадката нтрябва да се замени с н-1.

Пример 1.Събрана информация от 100 произволно избрани кафенета в един град, че средният брой на служителите в тях е 10,5 със стандартно отклонение 4,6. Определете доверителния интервал от 95% от броя на работниците в кафенето.

където е критичната стойност на стандартното нормално разпределение за нивото на значимост α = 0,05 .

Така доверителният интервал от 95% за средния брой работници в кафене варира от 9,6 до 11,4.

Пример 2.За произволна извадка от обща популация от 64 наблюдения бяха изчислени следните общи стойности:

сумата от стойностите в наблюденията,

сумата от квадратите на отклонението на стойностите от средната стойност .

Изчислете 95% доверителен интервал за очакванията.

изчислете стандартното отклонение:

,

изчислете средната стойност:

.

Заменете стойностите в израза за доверителния интервал:

където е критичната стойност на стандартното нормално разпределение за нивото на значимост α = 0,05 .

Получаваме:

По този начин 95% доверителният интервал за математическите очаквания на тази извадка варира от 7.484 до 11.266.

Пример 3.За произволна извадка от обща популация от 100 наблюдения средната стойност е 15,2, а стандартното отклонение е 3,2. Изчислете 95% доверителен интервал за очакваното, след това 99% доверителен интервал. Ако размерът на извадката и нейното изменение останат непроменени, но коефициентът на доверие се увеличи, доверителният интервал ще се стесни или разшири?

Заменете тези стойности в израза за доверителния интервал:

където е критичната стойност на стандартното нормално разпределение за нивото на значимост α = 0,05 .

Получаваме:

.

По този начин 95% доверителен интервал за средната стойност на тази проба варира от 14,57 до 15,82.

Още веднъж заместваме тези стойности в израза за доверителния интервал:

където е критичната стойност на стандартното нормално разпределение за нивото на значимост α = 0,01 .

Получаваме:

.

Така доверителният интервал от 99% за средната стойност на тази проба варира от 14,37 до 16,02.

Както можете да видите, с увеличаване на доверителния коефициент, критичната стойност на стандартното нормално разпределение също се увеличава и следователно началната и крайната точка на интервала са разположени по -далеч от средната стойност и по този начин доверителния интервал защото математическите очаквания се увеличават.

Точкови и интервални оценки на специфичното тегло

Специфичното тегло на някои характеристики на пробата може да се интерпретира като точкова оценка на специфичното тегло стрсъщата характеристика в общата популация. Ако тази стойност трябва да бъде свързана с вероятността, тогава трябва да се изчисли доверителният интервал на специфичното тегло стрчерта в общата популация с вероятност P = 1 - α :

.

Пример 4.В някой град има двама кандидати Аи Бсе кандидатира за кмет. На случаен принцип бяха интервюирани 200 жители на града, от които 46% отговориха, че ще гласуват за кандидата А, 26% - за кандидата Би 28% не знаят за кого ще гласуват. Определете 95% доверителен интервал за дела на жителите на града, които подкрепят кандидата А.

Константин Кравчик ясно обяснява какво представлява доверителният интервал в медицинските изследвания и как да го използваме.

Katren-Stil продължава да публикува цикъл на Константин Кравчик за медицинската статистика. В предишните две статии авторът се е занимавал с обяснението на понятия като и.

Константин Кравчик

Аналитичен математик. Специалист по статистически изследвания в медицината и хуманитарните науки

Град Москва

Много често в статии за клинични изпитвания можете да намерите мистериозна фраза: "доверителен интервал" (95% CI или 95% CI - доверителен интервал). Например статията може да гласи: „За да се оцени значимостта на разликите, беше използван t-тестът на Студент с изчисляване на 95% доверителен интервал.“

Каква е стойността на "95% доверителен интервал" и защо да се изчислява?

Какво е интервал на доверие? - Това е диапазонът, в който истинските средни стойности са в популацията. И какво, има "неверни" средни стойности? В известен смисъл, да, има. В обяснихме, че е невъзможно да се измери интересуващия параметър в цялата популация, така че изследователите се задоволяват с ограничена извадка. В тази извадка (например по телесно тегло) има една средна стойност (определено тегло), по която съдим за средната стойност в цялата обща популация. Средното тегло в извадката (особено малко) е малко вероятно да съвпадне със средното тегло в общата популация. Следователно е по -правилно да се изчисли и използва диапазонът от средните стойности на общата популация.

Например, представете си, че 95% CI (95% CI) за хемоглобина е 110 до 122 g / L. Това означава, че с вероятност от 95%истинската средна стойност на хемоглобина в общата популация ще бъде в диапазона от 110 до 122 g / l. С други думи, ние не знаем средния хемоглобин в общата популация, но можем да посочим диапазона от стойности за тази черта с 95% вероятност.

Доверителният интервал е особено важен за разликата в средствата между групите или, както се нарича, размера на ефекта.

Да речем, че сравнявахме ефективността на два препарата от желязо: този, който е на пазара от дълго време и този, който току -що беше регистриран. След курса на терапията се оценява концентрацията на хемоглобина в изследваните групи пациенти и статистическата програма изчислява, че разликата между средните стойности на двете групи с 95% вероятност е в диапазона от 1,72 до 14,36 g / л (Таблица 1).

Раздел. 1. Критерий за независими извадки
(групите се сравняват по нива на хемоглобина)

Това трябва да се тълкува по следния начин: при някои от пациентите от общата популация, които приемат новото лекарство, хемоглобинът ще бъде средно по -висок с 1,72–14,36 g / l, отколкото при тези, които са приемали вече познатото лекарство.

С други думи, в общата популация разликата в средните стойности на хемоглобина в групи с 95% вероятност е в тези граници. Изследователят ще прецени дали това е много или не. Въпросът на всичко това е, че работим не с една средна стойност, а с диапазон от стойности, поради което по -надеждно оценяваме разликата в параметъра между групите.

В статистическите пакети, по преценка на изследователя, можете независимо да стесните или разширите границите на доверителния интервал. Намалявайки вероятността от доверителния интервал, стесняваме обхвата на средните стойности. Например, при 90% CI, диапазонът от средни стойности (или разлика в средните стойности) ще бъде по -тесен, отколкото при 95%.

Обратно, увеличаването на вероятността до 99% разширява диапазона от стойности. При сравняване на групи, долната граница на CI може да премине нулевата марка. Например, ако разширим доверителния интервал до 99%, тогава границите на интервала варират от –1 до 16 g / L. Това означава, че в общата популация има групи, разликата между средните стойности, между които според изследвания атрибут е равна на 0 (M = 0).

Използвайки доверителния интервал, можете да проверите статистически хипотези. Ако доверителният интервал пресича нулевата стойност, тогава нулевата хипотеза, която приема, че групите не се различават по изследвания параметър, е вярна. Пример е описан по -горе, когато разширихме границите до 99%. Някъде в общата популация открихме групи, които не се различаваха по никакъв начин.

95% доверителен интервал на разликата в хемоглобина, (g / l)


На фигурата линията показва 95% доверителен интервал за разликата в средните стойности на хемоглобина между двете групи. Линията преминава нулевата марка, следователно има разлика между средните равни на нула, което потвърждава нулевата хипотеза, че групите не се различават. Обхватът на разликата между групите е от –2 до 5 g / l, което означава, че хемоглобинът може или да намалее с 2 g / l, или да се увеличи с 5 g / l.

Доверителният интервал е много важен показател. Благодарение на него можете да видите дали разликите в групите наистина се дължат на разликата в средствата или поради голяма извадка, тъй като при голяма извадка шансовете за намиране на разлики са по -големи, отколкото при малка.

На практика може да изглежда така. Взехме проба от 1000 души, измерихме нивото на хемоглобина и установихме, че доверителният интервал за разликата в средното е от 1,2 до 1,5 g / L. Нивото на статистическа значимост в този случай стр

Виждаме, че концентрацията на хемоглобина се е увеличила, но почти незабележимо, следователно статистическата значимост се появява именно поради размера на извадката.

Доверителният интервал може да бъде изчислен не само за средни стойности, но и за пропорции (и съотношения на риска). Например, ние се интересуваме от доверителния интервал на пропорциите на пациентите, постигнали ремисия, докато приемат разработено лекарство. Да приемем, че 95% CI за пропорции, тоест за дела на такива пациенти, се намира в диапазона от 0,60-0,80. По този начин можем да кажем, че нашето лекарство има терапевтичен ефект от 60 до 80% от случаите.