Довірчий інтервал формула розрахунку фізика. Побудова довірчого інтервалу для математичного очікування генеральної сукупності. Метод довірчих інтервалів

Оновлене 3 березня 2020 р
файл прикладу

Побудуємо в MS EXCEL довірчий інтервал для оцінки середнього значення розподілу в разі відомого значеннядисперсії.

Зрозуміло, вибір рівня довіриповністю залежить від розв'язуваної задачі. Так, ступінь довіри авіапасажирів до надійності літака, безсумнівно, повинна бути вище ступеня довіри покупця до надійності електричної лампочки.

формулювання завдання

Припустимо, що з генеральної сукупностімає взята вибіркарозміру n. Передбачається, що стандартне відхиленняцього розподілу відомо. Необхідно на підставі цієї вибіркиоцінити невідоме середнє значення розподілу(Μ,) і побудувати відповідний двостороннійдовірчий інтервал .

точкова оцінка

Як відомо з, статистика(Позначимо її Х ср) є несмещенной оцінкою середньогоцієї генеральної сукупностіі має розподіл N (μ; σ 2 / n).

Примітка : Що робити, якщо потрібно побудувати довірчий інтервалв разі розподілу, яке не єнормальним?У цьому випадку на допомогу приходить, в якій мовиться, що при досить великому розмірі вибірки n з розподілу що не єнормальним , вибіркове розподіл статистики Х србуде приблизновідповідати нормальному розподілуз параметрами N (μ; σ 2 / n).

Отже, точкова оцінкасередньогозначення розподілуу нас є - це середнє значення вибірки, Тобто Х ср. тепер займемося довірчим інтервалом.

Побудова довірчого інтервалу

Зазвичай, знаючи розподіл і його параметри, ми можемо обчислити вірогідність того, що випадкова величина прийме значення з заданого нами інтервалу. Зараз зробимо навпаки: знайдемо інтервал, в який випадкова величина потрапить із заданою вірогідністю. Наприклад, з властивостей нормального розподілувідомо, що з імовірністю 95%, випадкова величина, розподілена по нормальному закону, Потрапить в інтервал приблизно +/- 2 від середнього значення(Див. Статтю про). Цей інтервал, послужить нам прототипом для довірчого інтервалу .

Тепер розберемося, чи знаємо ми розподіл , щоб обчислити цей інтервал? Для відповіді на питання ми повинні вказати форму розподілу і його параметри.

Форму розподілу ми знаємо - це нормальний розподіл(Нагадаємо, що мова йде про вибірковому розподілістатистикиХ ср).

Параметр μ нам невідомий (його якраз треба оцінити за допомогою довірчого інтервалу), Але у нас є його оцінка Х ср,обчислена на основі вибірки,яку можна використовувати.

Другий параметр - стандартне відхилення вибіркового середньоговважатимемо відомим, Він дорівнює σ / √n.

Оскільки ми не знаємо μ, то будемо будувати інтервал +/- 2 стандартні відхиленняне від середнього значення, А від відомої його оцінки Х ср. Тобто при розрахунку довірчого інтервалуми НЕ будемо вважати, що Х српотрапить в інтервал +/- 2 стандартні відхиленнявід μ з імовірністю 95%, а будемо вважати, що інтервал +/- 2 стандартні відхиленнявід Х срз імовірністю 95% накриє μ - середнє генеральної сукупності,з якого взята вибірка. Ці два твердження еквівалентні, але друге твердження нам дозволяє побудувати довірчий інтервал .

Крім того, уточнимо інтервал: випадкова величина, розподілена по нормальному закону, З імовірністю 95% потрапляє в інтервал +/- 1,960 стандартних відхилень,а не +/- 2 стандартні відхилення. Це можна розрахувати за допомогою формули = НОРМ.СТ.ОБР ((1 + 0,95) / 2), См. файл прикладу Лист Інтервал .

Тепер ми можемо сформулювати розподіл усіх твердження, яке послужить нам для формування довірчого інтервалу: «Імовірність того, що середнє генеральної сукупностізнаходиться від середнього вибіркив межах 1,960 « стандартних відхилень вибіркового середнього », Дорівнює 95% ».

Значення ймовірності, згадане в твердженні, має спеціальну назву , Який пов'язаний зрівнем значущості α (альфа) простим виразом рівень довіри = 1 . У нашому випадку рівень значущості α =1-0,95=0,05 .

Тепер на основі цього імовірнісного затвердження запишемо вираз для обчислення довірчого інтервалу :

де Z α / 2 стандартногонормального розподілу(Таке значення випадкової величини z , що P (z >= Z α / 2 ) = Α / 2).

Примітка : Верхній α / 2-квантильвизначає ширину довірчого інтервалув стандартних відхиленняхвибіркового середнього. Верхній α / 2-квантиль стандартногонормального розподілузавжди більше 0, що дуже зручно.

У нашому випадку при α = 0,05, верхній α / 2-квантиль дорівнює 1,960. Для інших рівнів значущості α (10%; 1%) верхній α / 2-квантильZ α / 2 можна обчислити за допомогою формули = НОРМ.СТ.ОБР (1-α / 2)або, якщо відомий рівень довіри , = НОРМ.СТ.ОБР ((1 + ур.доверія) / 2) .

Зазвичай при побудові довірчих інтервалів для оцінки середньоговикористовують тільки верхній α /2- квантильі не використовують нижній α /2- квантиль. Це можливо тому, що стандартненормальний розподілсиметрично щодо осі х ( щільність його розподілусиметрична щодо середнього, тобто 0) . Тому, немає потреби обчислювати нижній α / 2-квантиль(Його називають просто α / 2-квантиль), Тому що він дорівнює верхньому α /2- квантильзі знаком мінус.

Нагадаємо, що, не дивлячись на форму розподілу величини х, відповідна випадкова величина Х сррозподілена приблизнонормально N (μ; σ 2 / n) (див. Статтю про). Отже, в загальному випадку, вищевказане вираз для довірчого інтервалує лише наближеним. Якщо величина х розподілена по нормальному закону N (μ; σ 2 / n), то вираз для довірчого інтервалує точним.

Розрахунок довірчого інтервалу в MS EXCEL

Вирішимо задачу. Час відгуку електронного компонентана вхідний сигнал є важливою характеристикою пристрою. Інженер хоче побудувати довірчий інтервал для середнього часу відгуку при рівні довіри 95%. З попереднього досвіду інженер знає, що стандартне відхилення час відгуку складає 8 мсек. Відомо, що для оцінки часу відгуку інженер зробив 25 вимірів, середнє значення склало 78 мсек.

РішенняІнженер хоче знати час відгуку електронного пристрою, але він розуміє, що час відгуку є не фіксованою, а випадковою величиною, яка має своє розподіл. Так що, краще, на що він може розраховувати, це визначити параметри і форму цього розподілу.

На жаль, з умови задачі форма розподілу часу відгуку нам не відома (воно не обов'язково має бути нормальним). , Цього розподілу також невідомо. Відомо тільки його стандартне відхиленняσ = 8. Тому, поки ми не можемо порахувати ймовірності і побудувати довірчий інтервал .

Однак, не дивлячись на те, що ми не знаємо розподіл часуокремого відгуку, Ми знаємо, що згідно ЦПТ , вибіркове розподілсереднього часу відгукує приблизно нормальним(Будемо вважати, що умови ЦПТвиконуються, тому що розмір вибіркидосить великий (n = 25)) .

Більш того, середнєцього розподілу дорівнює середнім значеннямрозподілу одиничного відгуку, тобто μ. А стандартне відхиленняцього розподілу (σ / √n) можна обчислити за формулою = 8 / КОРІНЬ (25).

Також відомо, що інженером була отримана точкова оцінкапараметра μ рівна 78 мсек (Х ср). Тому, тепер ми можемо обчислювати ймовірності, тому що нам відома форма розподілу ( нормальне) І його параметри (Х ср і σ / √n).

Інженер хоче знати математичне очікуванняμ розподілу часу відгуку. Як було сказано вище, це μ одно математичного сподівання вибіркового розподілу середнього часу відгуку. Якщо ми скористаємося нормальним розподілом N (Х ср; σ / √n), то шукане μ буде перебувати в інтервалі +/- 2 * σ / √n з ймовірністю приблизно 95%.

рівень значущостідорівнює 1-0,95 = 0,05.

Нарешті, знайдемо ліву і праву межу довірчого інтервалу. Ліва межа: = 78-НОРМ.СТ.ОБР (1-0,05 / 2) * 8 / КОРІНЬ (25) = 74,864 Права межа: = 78 + НОРМ.СТ.ОБР (1-0,05 / 2) * 8 / КОРІНЬ (25) = 81,136

Ліва межа: = НОРМ.ОБР (0,05 / 2; 78; 8 / КОРІНЬ (25))Права межа: = НОРМ.ОБР (1-0,05 / 2; 78; 8 / КОРІНЬ (25))

відповідь : довірчий інтервалпри рівень довіри 95% і σ =8 мсекдорівнює 78 +/- 3,136 мсек.

В файлі прикладу на аркуші Сигмавідома створена форма для розрахунку і побудови двосторонньогодовірчого інтервалудля довільних вибірокіз заданим σ і рівнем значущості .

Функція ДОВЕРІТ.НОРМ ()

якщо значення вибіркизнаходяться в діапазоні B20: B79 , а рівень значущостідорівнює 0,05; то формула MS EXCEL: = СРЗНАЧ (B20: B79) -ДОВЕРІТ.НОРМ (0,05; σ; РАХУНОК (B20: B79))поверне ліву кордон довірчого інтервалу .

Цю ж кордон можна обчислити за допомогою формули: = СРЗНАЧ (B20: B79) -НОРМ.СТ.ОБР (1-0,05 / 2) * σ / КОРІНЬ (РАХУНОК (B20: B79))

Примітка: Функція ДОВЕРІТ.НОРМ () з'явилася в MS EXCEL 2010. У більш ранніх версіях MS EXCEL використовувалася функція ДОВЕРИТ ().

У попередніх підрозділах ми розглянули питання про оцінку невідомого параметра аодним числом. Така оцінка називається «точкової». У ряді завдань потрібно не тільки знайти для параметра апідходяще чисельне значення, а й оцінити його точність і надійність. Потрібно знати, до яких помилок може призвести заміна параметра айого точкової оцінкою аі з яким ступенем впевненості можна очікувати, що ці помилки не вийдуть за відомі межі?

Такого роду завдання особливо актуальні при малому числі спостережень, коли точкова оцінка а взначною мірою випадкова і наближена заміна а на а може привести до серйозних помилок.

Щоб дати уявлення про точність і надійність оцінки а,

в математичній статистиці користуються так званими довірчими інтервалами і довірчими ймовірностями.

Нехай для параметра аотримана з досвіду несмещенная оцінка а.Ми хочемо оцінити можливу при цьому помилку. Призначимо деяку досить велику ймовірність р (наприклад, р = 0,9, 0,95 або 0,99) таку, що подія з ймовірністю р можна вважати практично достовірним, і знайдемо таке значення s, для якого

Тоді діапазон практично можливих значень помилки, що виникає при заміні ана а, Буде ± s; великі за абсолютною величиною помилки будуть з'являтися тільки з малою вірогідністю а = 1 - р. Перепишемо (14.3.1) у вигляді:

Рівність (14.3.2) означає, що з імовірністю р невідоме значення параметра апотрапляє в інтервал

При цьому необхідно відзначити одну обставину. Раніше ми неодноразово розглядали ймовірність попадання випадкової величини в заданий невипадковий інтервал. Тут справа йде інакше: величина авиник не випадково, зате випадковий інтервал / р. Випадково його положення на осі абсцис, яке визначається його центром а; випадкова взагалі і довжина інтервалу 2s, так як величина s обчислюється, як правило, по досвідченим даним. Тому в даному випадку краще буде тлумачити величину р не як ймовірність «попадання» точки ав інтервал / р, а як ймовірність того, що випадковий інтервал / р накриє точку а(Рис. 14.3.1).

Мал. 14.3.1

Імовірність р прийнято називати довірчою ймовірністю, А інтервал / р - довірчим інтервалом.межі інтервалу If. а х = а- s і а 2 = а +а називаються довірчими межами.

Дамо ще одне тлумачення поняття довірчого інтервалу: його можна розглядати як інтервал значень параметра а,сумісних з досвідченими даними і не суперечать їм. Дійсно, якщо домовитися вважати подія з ймовірністю а = 1-р практично неможливим, то ті значення параметра а, для яких а - а> S, потрібно визнати такими, що суперечать досвідченим даними, а ті, для яких | а - а a t na 2.

Нехай для параметра ає несмещенная оцінка а.Якби нам був відомий закон розподілу величини а, Завдання знаходження довірчого інтервалу була б вельми проста: достатньо було б знайти таке значення s, для якого

Утруднення полягає в тому, що закон розподілу оцінки азалежить від закону розподілу величини Xі, отже, від його невідомих параметрів (зокрема, і від самого параметра а).

Щоб обійти це утруднення, можна застосувати наступний грубо наближений прийом: замінити в вираженні для s невідомі параметри їх точковими оцінками. При порівняно великій кількості дослідів п(Близько 20 ... 30) цей прийом зазвичай дає задовільні по точності результати.

Як приклад розглянемо задачу про довірчому інтервалі для математичного очікування.

нехай вироблено п X,характеристики якої - математичне очікування ті дисперсія D- невідомі. Для цих параметрів отримані оцінки:

Потрібно побудувати довірчий інтервал / р, відповідний довірчій ймовірності р, для математичного очікування твеличини X.

При вирішенні цього завдання скористаємося тим, що величина тявляє собою суму пнезалежних однаково розподілених випадкових величин X hі відповідно до центральної граничної теореми при досить великому пїї закон розподілу близький до нормального. На практиці навіть при відносно невеликому числі доданків (близько 10 ... 20) закон розподілу суми можна наближено вважати нормальним. Будемо виходити з того, що величина трозподілена за нормальним законом. Характеристики цього закону - математичне очікування і дисперсія - рівні відповідно ті

(Див. Розділ 13 підрозділ 13.3). Припустимо, що величина Dнам відома і знайдемо таку величину Ер, для якої

Застосовуючи формулу (6.3.5) глави 6, висловимо ймовірність в лівій частині (14.3.5) через нормальну функцію розподілу

де - середнє квадратичне відхилення оцінки т.

з рівняння

знаходимо значення Sp:

де arg Ф * (х) - функція, зворотна Ф * (Х),тобто таке значення аргументу, при якому нормальна функція розподілу дорівнює х.

дисперсія D,через яку виражена величина а 1П, нам точно не відома; як її орієнтовного значення можна скористатися оцінкою D(14.3.4) і покласти наближено:

Таким чином, приблизно вирішена задача побудови довірчого інтервалу, що дорівнює:

де gp визначається формулою (14.3.7).

Щоб уникнути при обчисленні s p зворотного інтерполювання в таблицях функції Ф * (л), зручно створити спеціальну таблицю (табл. 14.3.1), де наводяться значення величини

в залежності від р. Величина (р визначає для нормального закону число середніх квадратичних відхилень, яке потрібно відкласти вправо і вліво від центру розсіювання для того, щоб ймовірність попадання в отриману ділянку дорівнювала р.

Через величину 7 р довірчий інтервал виражається у вигляді:

Таблиця 14.3.1

Приклад 1. Проведено 20 дослідів над величиною X;результати наведені в табл. 14.3.2.

Таблиця 14.3.2

Потрібно знайти оцінку від для математичного очікування від величини Xі побудувати довірчий інтервал, відповідний довірчій ймовірності р = 0,8.

Рішення.маємо:

Вибравши за початок відліку л: = 10, по третій формулою (14.2.14) знаходимо несмещенную оцінку D :

За табл. 14.3,1 знаходимо

Довірчі кордону:

Довірчий інтервал:

значення параметра т,що лежать в цьому інтервалі, є сумісними з досвідченими даними, наведеними в табл. 14.3.2.

Аналогічним способом може бути побудований довірчий інтервал і для дисперсії.

нехай вироблено пнезалежних дослідів над випадковою величиною Xз невідомими параметрами від і Л, і для дисперсії Dотримана несмещенная оцінка:

Потрібно приблизно побудувати довірчий інтервал для дисперсії.

З формули (14.3.11) видно, що величина Dявляє собою

суму пвипадкових величин виду. Ці величини не є

незалежними, так як в будь-яку з них входить величина т,залежна від всіх інших. Однак можна показати, що при збільшенні пзакон розподілу їх суми теж наближається до нормального. практично при п= 20 ... 30 він вже може вважатися нормальним.

Припустимо, що це так, і знайдемо характеристики цього закону: математичне сподівання і дисперсію. Так як оцінка D- несмещенная, то М [D] = D.

обчислення дисперсії D Dпов'язане з порівняно складними викладками, тому наведемо її вираження без виведення:

де ц 4 - четвертий центральний момент величини X.

Щоб скористатися цим виразом, потрібно підставити в нього значення ц 4 і D(Хоча б наближені). замість Dможна скористатися його оцінкою D.В принципі четвертий центральний момент теж можна замінити його оцінкою, наприклад величиною виду:

але така заміна дасть вкрай невисоку точність, так як взагалі при обмеженому числі дослідів моменти високого порядку визначаються з великими помилками. Однак на практиці часто буває, що вид закону розподілу величини Xвідомий заздалегідь: невідомі лише його параметри. Тоді можна спробувати виразити ц 4 через D.

Візьмемо найбільш часто зустрічається випадок, коли величина Xрозподілена за нормальним законом. Тоді її четвертий центральний момент виражається через дисперсію (див. Розділ 6 підрозділ 6.2);

і формула (14.3.12) дає або

Замінюючи в (14.3.14) невідоме Dйого оцінкою D, Отримаємо: звідки

Момент ц 4 можна виразити через Dтакож і в деяких інших випадках, коли розподіл величини Xне є нормальним, але вигляд його відомий. Наприклад, для закону рівномірної щільності (див. Розділ 5) маємо:

де (а, Р) - інтервал, на якому поставлено закон.

отже,

За формулою (14.3.12) отримаємо: звідки знаходимо наближено

У випадках, коли вид закону розподілу величини 26 невідомий, при орієнтовною оцінкою величини а /) рекомендується все ж користуватися формулою (14.3.16), якщо немає спеціальних підстав вважати, що цей закон сильно відрізняється від нормального (володіє помітним позитивним або негативним ексцесом) .

Якщо орієнтовний значення а /) тим чи іншим способом отримано, то можна побудувати довірчий інтервал для дисперсії аналогічно тому, як ми будували його для математичного очікування:

де величина в залежності від заданої ймовірності р знаходиться по табл. 14.3.1.

Приклад 2. Знайти наближено 80% -й довірчий інтервал для дисперсії випадкової величини Xв умовах прикладу 1, якщо відомо, що величина Xрозподілена за законом, близькому до нормального.

Рішення.Величина залишається тією ж, що в табл. 14.3.1:

За формулою (14.3.16)

За формулою (14.3.18) знаходимо довірчий інтервал:

Відповідний інтервал значень середнього квадратичного відхилення: (0,21; 0,29).

14.4. Точні методи побудови довірчих інтервалів для параметрів випадкової величини, розподіленої за нормальним законом

У попередньому підрозділі ми розглянули грубо наближені методи побудови довірчих інтервалів для математичного очікування і дисперсії. Тут ми дамо уявлення про точні методи вирішення тієї ж завдання. Підкреслимо, що для точного знаходження довірчих інтервалів абсолютно необхідно знати заздалегідь вигляд закону розподілу величини X,тоді як для застосування наближених методів це не обов'язково.

Ідея точних методів побудови довірчих інтервалів зводиться до наступного. Будь-довірчий інтервал знаходиться з умови, що виражає ймовірність виконання деяких нерівностей, в які входить цікавить нас оцінка а.Закон розподілу оцінки ав загальному випадку залежить від невідомих параметрів величини X.Однак іноді вдається перейти в нерівностях від випадкової величини адо будь-якої іншої функції спостережених значень Х п Х 2, ..., X п.закон розподілу якої не залежить від невідомих параметрів, а залежить тільки від числа дослідів і і від виду закону розподілу величини X.Такого роду випадкові величини відіграють велику роль в математичній статистиці; вони найбільш докладно вивчені для випадку нормального розподілу величини X.

Наприклад, доведено, що при нормальному розподілі величини Xвипадкова величина

підпорядковується так званому закону розподілу Ст'юдентаз п- 1 ступенями свободи; щільність цього закону має вигляд

де Г (х) - відома гамма-функція:

Доведено також, що випадкова величина

має «розподіл% 2» з п- 1 ступенями свободи (див. Розділ 7), щільність якого виражається формулою

Не зупиняючись на висновках розподілів (14.4.2) і (14.4.4), покажемо, як їх можна застосувати при побудові довірчих інтервалів для параметрів ти D.

нехай вироблено пнезалежних дослідів над випадковою величиною X,розподіленої за нормальним законом з невідомими параметрами ТВО.Для цих параметрів отримані оцінки

Потрібно побудувати довірчі інтервали для обох параметрів, відповідні довірчої ймовірності р.

Побудуємо спочатку довірчий інтервал для математичного очікування. Природно цей інтервал взяти симетричним щодо т; позначимо s p половину довжини інтервалу. Величину s p потрібно вибрати так, щоб виконувалася умова

Спробуємо перейти в лівій частині рівності (14.4.5) від випадкової величини тдо випадкової величиною Т,розподіленої за законом Стьюдента. Для цього помножимо обидві частини нерівності | m-w? |

на позитивну величину: або, користуючись позначенням (14.4.1),

Знайдемо таке число / р, що Величина / р знайдеться з умови

З формули (14.4.2) видно, що (1) - парна функція, тому (14.4.8) дає

Рівність (14.4.9) визначає величину / р в залежності від р. Якщо мати на своєму розпорядженні таблицю значень інтеграла

то величину / р можна знайти зворотним интерполированием в таблиці. Однак зручніше скласти заздалегідь таблицю значень / р. Така таблиця дається в додатку (табл. 5). У цій таблиці наведені значення в залежності від довірчої ймовірності р і числа ступенів свободи п- 1. Визначивши / р по табл. 5 і вважаючи

ми знайдемо половину ширини довірчого інтервалу / р і сам інтервал

Приклад 1. Вироблено 5 незалежних дослідів над випадковою величиною X,розподіленої нормально з невідомими параметрами ті о. Результати дослідів наведені в табл. 14.4.1.

Таблиця 14.4.1

знайти оцінку тдля математичного очікування і побудувати для нього 90% -й довірчий інтервал / р (тобто інтервал, відповідний довірчій ймовірності р = 0,9).

Рішення.маємо:

По таблиці 5 додатка для п - 1 = 4 і р = 0,9 знаходимо звідки

Довірчий інтервал буде

Приклад 2. Для умов прикладу 1 підрозділу 14.3, припускаючи величину Xрозподіленої нормально, знайти точний довірчий інтервал.

Рішення.По таблиці 5 додатка знаходимо при п - 1 = 19ір =

0,8 / р = 1,328; звідси

Порівнюючи з рішенням прикладу 1 підрозділу 14.3 (е р = 0,072), переконуємося, що розбіжність досить незначно. Якщо зберегти точність до другого знака після коми, то довірчі інтервали, знайдені точним і наближеним методами, збігаються:

Перейдемо до побудови довірчого інтервалу для дисперсії. Розглянемо несмещенную оцінку дисперсії

і висловимо випадкову величину Dчерез величину V(14.4.3), що має розподіл х 2 (14.4.4):

Знаючи закон розподілу величини V,можна знайти інтервал / (1, в який вона потрапляє із заданою вірогідністю р.

закон розподілу k n _ x (v)величини I 7 має вигляд, зображений на рис. 14.4.1.

Мал. 14.4.1

Виникає питання: як вибрати інтервал / р? Якби закон розподілу величини Vбув симетричним (як нормальний закон або розподіл Стьюдента), природно було б взяти інтервал / р симетричним щодо математичного очікування. В даному випадку закон до п _ х (v)несиметричний. Домовимося вибирати інтервал / р так, щоб ймовірності виходу величини Vза межі інтервалу вправо і вліво (заштриховані площі на рис. 14.4.1) були однакові і рівні

Щоб побудувати інтервал / р з такою властивістю, скористаємося табл. 4 додатки: в ній наведено числа у)такі, що

для величини V,має х 2 -розподіл з г ступенями свободи. У нашому випадку г = п- 1. Зафіксуємо г = п- 1 і знайдемо у відповідному рядку табл. 4 два значення х 2 -одне, що відповідає ймовірності інше - ймовірності Позначимо ці

значення у 2і xl?інтервал має у 2,своїм лівим, а у ~правим кінцем.

Тепер знайдемо по інтервалу / р шуканий довірчий інтервал / |, для дисперсії з межами D, і D 2,який накриває точку Dз ймовірністю р:

Побудуємо такий інтервал / (, = (?> Ь А), який накриває точку Dтоді і тільки тоді, коли величина Vпотрапляє в інтервал / р. Покажемо, що інтервал

задовольняє цій умові. Дійсно, нерівності рівносильні нерівності

а ці нерівності виконуються з ймовірністю р. Таким чином, довірчий інтервал для дисперсії знайдений і виражається формулою (14.4.13).

Приклад 3. Знайти довірчий інтервал для дисперсії в умовах прикладу 2 підрозділу 14.3, якщо відомо, що величина Xрозподілена нормально.

Рішення.маємо . По таблиці 4 додатка

знаходимо при г = п - 1 = 19

За формулою (14.4.13) знаходимо довірчий інтервал для дисперсії

Відповідний інтервал для середнього квадратичного відхилення: (0,21; 0,32). Цей інтервал лише незначно перевершує отриманий в прикладі 2 підрозділу 14.3 наближеним методом інтервал (0,21; 0,29).

  • На малюнку 14.3.1 розглядається довірчий інтервал, симетричний щодо а. Взагалі, як ми побачимо далі, це необов'язково.

Довірчий інтервал(ДІ; в англ, confidence interval - CI) отриманий в дослідженні при вибірці дає міру точності (або невизначеності) результатів дослідження, для того щоб робити висновки про популяцію всіх таких пацієнтів (генеральна сукупність). Правильне визначення 95% ДІ можна сформулювати так: 95% таких інтервалів буде містити справжню величину в популяції. Трохи менш точна така інтерпретація: ДІ - діапазон величин, в межах якого можна на 95% бути впевненим в тому, що він містить натуральну величину. При використанні ДІ акцент робиться на визначенні кількісного ефекту, на противагу величиною Р, яка виходить в результаті перевірки статистичної значущості. Величина Р не оцінює ніякого кількості, а служить скоріше мірою сили свідоцтва проти нульової гіпотези «ніякого ефекту». Величина Р сама по собі не говорить нам нічого ні про величину відмінності, ні навіть про його направлення. Тому самостійні величини Р абсолютно неінформативні в статтях чи рефератах. На відміну від них ДІ вказує і на кількість ефекту, що представляє безпосередній інтерес, наприклад на корисність лікування, і на силу доказів. Тому ДІ безпосередньо має відношення до практики ДМ.

Підхід оцінки до статистичному аналізу, Ілюструється ДІ, спрямований на вимірювання кількості цікавить нас ефекту (чутливість діагностичного тесту, частота прогнозованих випадків, скорочення відносного ризику при лікуванні і т.д.), а також на вимір невизначеності в цьому ефекті. Найчастіше ДІ - діапазон величин по обидві сторони оцінки, в якому, ймовірно, лежить справжня величина, і можна бути впевненим в цьому на 95%. Угода використовувати 95% ймовірність довільно, також як і величину Р<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

ДІ заснований на ідеї, що те ж саме дослідження, виконане на інших вибірках пацієнтів, не привело б до ідентичних результатів, але що їх результати будуть розподілені навколо істинної, проте невідомої величини. Іншими словами, ДІ описує це як «варіабельність, що залежить від вибірки». ДІ не відображає додаткову невизначеності, обумовлену іншими причинами; зокрема, він не включає вплив селективної втрати пацієнтів при відстеженні, поганого комплайнса або неточного вимірювання результату, відсутність «засліплення» і т.д. ДІ, таким чином, завжди недооцінює загальна кількість невизначеності.

Обчислення довірчого інтервалу

Таблиця А1.1. Стандартні помилки і довірчі інтервали для деяких клінічних вимірів

Зазвичай ДІ обчислюють з спостерігається оцінки кількісного показника, такого, як відмінність (d) між двома пропорціями, і стандартної помилки (SE) в оцінці цього відмінності. Приблизний 95% ДІ, одержуваний таким чином, - d ± 1,96 SE. Формула змінюється відповідно до природи заходи результату і охопленням ДІ. Наприклад, в рандомізованому плацебо-контрольованому випробуванні бесклеточной вакцини кашлюку коклюш розвивався у 72 з 1670 (4,3%) немовлят, які отримали вакцину, і у 240 з тисячі шістсот шістьдесят п'ять (14,4%) в групі контролю. Різниця у відсотках, відоме як абсолютне зниження ризику, становить 10,1%. SE цього відмінності дорівнює 0,99%. Відповідно 95% ДІ становить 10,1% + 1,96 х 0,99%, тобто від 8,2 до 12,0.

Незважаючи на різні філософські підходи, ДІ і тести на статистичну значущість тісно пов'язані математично.

Таким чином, величина Р «значуща», тобто Р<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

Невизначеність (неточність) оцінки, що виражається в ДІ, у великій мірі пов'язана з квадратним коренем з розміру вибірки. Маленькі вибірки надають менше інформації, ніж великі, і ДІ відповідно ширше в меншій вибірці. Наприклад, стаття, що порівнює характеристики трьох тестів, які застосовуються для діагностики інфекції Helicobacter pylori, повідомила про чутливості дихальної проби з сечовиною 95,8% (95% ДІ 75-100). У той час як число 95,8% виглядає переконливо, маленька вибірка з 24 дорослих пацієнтів з Я. pylori означає, що є значна невизначеність в цій оцінці, як показує широкий ДІ. Дійсно, нижня межа 75% набагато нижче, ніж оцінка 95,8%. Якби така ж чутливість спостерігалася в вибірці 240 чоловік, то 95% ДІ становив би 92,5-98,0, даючи більше гарантій, що тест високочутливий.

У рандомізованих контрольованих випробуваннях (РСІ) незначні результати (тобто ті, де Р> 0,05) особливо схильні до невірного тлумачення. ДІ особливо корисний тут, оскільки він показує, наскільки сумісні результати з клінічно корисним істинним ефектом. Наприклад, в РСІ, порівнювати накладення анастомозу швом і скріпками на товстій кишці, ранова інфекція розвинулася у 10,9% і 13,5% пацієнтів відповідно (Р = 0,30). 95% ДІ для цього відмінності становить 2,6% (від -2 до +8). Навіть в цьому дослідженні, що включало 652 пацієнта, залишається ймовірність, що існує помірне відмінність в частоті інфекцій, що виникають внаслідок цих двох процедур. Чим менше дослідження, тим більше невпевненість. Сунг та співавт. виконали РСІ, щоб порівняти інфузію октреотида зі строкової склеротерапией при гострій кровотечі з варикозно-розширених вен на 100 пацієнтах. У групі октреотида частота зупинки кровотечі склала 84%; в групі склеротерапії - 90%, що дає Р = 0,56. Зауважимо, що показники триваючого кровотечі аналогічні таким при ранової інфекції в згаданому дослідженні. У цьому випадку, однак, 95% ДІ для відмінності втручань дорівнює 6% (від -7 до +19). Цей інтервал досить широкий у порівнянні з 5% відмінністю, яке представляло б клінічний інтерес. Ясно, що дослідження не виключає значної різниці в ефективності. Тому висновок авторів «інфузія октреотида і склеротерапія однаково ефективні при лікуванні кровотечі з варикозно-розширених вен» виразно невалидность. У подібних випадках, коли, як тут, 95% ДІ для абсолютного зниження ризику (АСР; absolute risk reduction - ARR, англ.) Включає нуль, ДІ для ЧПЛП (NNT - number needed to treat, англ.) Є досить складним для тлумачення . ЧПЛП і його ДІ отримують з величин, зворотних АСР (множачи їх на 100, якщо ці величини дані в вигляді відсотків). Тут ми отримуємо ЧПЛП = 100: 6 = 16,6 з 95% ДІ від -14,3 до 5,3. Як видно з виноски «d» в табл. А1.1, цей ДІ включає величини ЧПЛП від 5,3 до нескінченності і ЧПЛВ від 14,3 до нескінченності.

ДІ можна побудувати для більшості зазвичай вживаних статистичних оцінок або порівнянь. Для РСІ він включає різницю між середніми пропорціями, відносними ризиками, відносинами шансів і ЧПЛП. Аналогічно ДІ можна отримати для всіх головних оцінок, зроблених в дослідженнях точності діагностичних тестів - чутливості, специфічності, прогностичної значимості позитивного результату (всі вони є простими пропорціями), і відношення правдоподібності - оцінок, одержуваних в метааналізах і дослідженнях типу порівняння з контролем. Комп'ютерна програма для персональних комп'ютерів, яка покриває багато з цих способів використання ДІ, доступна з другим виданням «Statistics with Confidence». Макроси для обчислення ДІ для пропорцій безкоштовно доступні для Excel і статистичних програм SPSS та Minitab на http://www.uwcm.ac.uk/study/medicine/epidemiology_ statistics / research / statistics / proportions, htm.

Множинні оцінки ефекту лікування

У той час як побудова ДІ бажано для первинних результатів дослідження, вони не обов'язкові для всіх результатів. ДІ стосується клінічно важливих порівнянь. Наприклад, при порівнянні двох груп правильний той ДІ, що побудований для відмінності між групами, як показано вище в прикладах, а не ДІ, який можна побудувати для оцінки в кожній групі. Мало того, що марно давати окремі ДІ для оцінок в кожній групі, це уявлення може вводити в оману. Точно так же правильний підхід при порівнянні ефективності лікування в різних підгрупах - порівняння двох (або більше) підгруп безпосередньо. Неправильно припускати, що лікування ефективне тільки в одній підгрупі, якщо її ДІ виключає величину, відповідну відсутності ефекту, а інші - ні. ДІ корисні також при порівнянні результатів у декількох підгрупах. На рис. А 1.1 показаний відносний ризик еклампсії у жінок з прееклампсією в підгрупах жінок з плацебо-контрольованого РСІ сульфату магнію.

Мал. А1.2. Лісовий графік показує результати 11 рандомізованих клінічних випробувань бичачої ротавірусної вакцини для профілактики діареї в порівнянні з плацебо. При оцінці відносного ризику діареї використаний 95% довірчий інтервал. Розмір чорного квадрата пропорційний обсягу інформації. Крім того, показана сумарна оцінка ефективності лікування і 95% довірчого інтервалу (позначається ромбом). У метааналізу використана модель випадкових ефектів перевищує деякі попередньо встановлені; наприклад, це може бути розмір, використаний при обчисленні величини вибірки. Відповідно до більш суворим критерієм весь діапазон ДІ повинен показувати користь, що перевищує встановлений мінімум.

Ми вже обговорювали помилку, коли відсутність статистичної значущості приймають як вказівку на те, що два способи лікування мають однакову ефективність. Настільки ж важливо не зрівнювати статистичну значущість з клінічної важливістю. Клінічну важливість можна припускати, коли результат статистично значимий і величина оцінки ефективності лікування

Дослідження можуть показати, значимі результати статистично і які з них клінічно важливі, а які - ні. На рис. А1.2 наведені результати чотирьох випробувань, для яких весь ДІ<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

Довірчий інтервал для математичного очікування - це такий обчислений за даними інтервал, який з відомою ймовірністю містить математичне очікування генеральної сукупності. Природною оцінкою для математичного очікування є середнє арифметичне її спостережених значень. Тому далі протягом уроку ми будемо користуватися термінами "середнє", "середнє значення". У завданнях Розрахунок довірчого інтервалу найчастіше потрібно відповідь типу "Довірчий інтервал середнього числа [величина в конкретному завданні] знаходиться від [менше значення] до [більшого значення]". За допомогою довірчого інтервалу можна оцінювати не тільки середні значення, а й питома вага тієї чи іншої ознаки генеральної сукупності. Середні значення, дисперсія, стандартне відхилення і похибка, через які ми будемо приходити до нових визначень і формул, розібрані на уроці Характеристики вибірки і генеральної сукупності .

Точкова і інтервальна оцінки середнього значення

Якщо середнє значення генеральної сукупності оцінюється числом (точкою), то за оцінку невідомої середньої величини генеральної сукупності приймається конкретне середнє, яке розраховане за вибіркою спостережень. В такому випадку значення середнього вибірки - випадкової величини - не збігається із середнім значенням генеральної сукупності. Тому, вказуючи середнє значення вибірки, одночасно потрібно вказувати і похибку вибірки. В якості запобіжного помилки вибірки використовується стандартна помилка, яка виражена в тих же одиницях виміру, що і середнє. Тому часто використовується такий запис:.

Якщо оцінку середнього потрібно зв'язати з певною ймовірністю, то цікавить параметр генеральної сукупності потрібно оцінювати не одним числом, а інтервалом. Довірчим інтервалом називають інтервал, в якому з певною ймовірністю Pзнаходиться значення оцінюваного показника генеральної сукупності. Довірчий інтервал, в якому з ймовірністю P = 1 - α знаходиться випадкова величина, розраховується наступним чином:

,

α = 1 - P, Яке можна знайти в додатку до практично будь-якій книзі по статистиці.

На практиці середнє значення генеральної сукупності і дисперсія не відомі, тому дисперсія генеральної сукупності замінюється дисперсією вибірки, а середнє генеральної сукупності - середнім значенням вибірки. Таким чином, довірчий інтервал в більшості випадків розраховується так:

.

Формулу довірчого інтервалу можна використовувати для оцінки середнього генеральної сукупності, якщо

  • відомо стандартне відхилення генеральної сукупності;
  • або стандартне відхилення генеральної сукупності невідомо, але обсяг вибірки - більше 30.

Середнє значення вибірки є несмещённой оцінкою середнього генеральної сукупності. У свою чергу, дисперсія вибірки не є несмещённой оцінкою дисперсії генеральної сукупності. Для отримання несмещённой оцінки дисперсії генеральної сукупності у формулі дисперсії вибірки обсяг вибірки nслід замінити на n-1.

Приклад 1.Зібрано інформацію з 100 випадково вибраних кафе в деякому місті про те, що середнє число працівників в них становить 10,5 зі стандартним відхиленням 4,6. Визначити довірчий інтервал 95% числа працівників кафе.

де - критичне значення стандартного нормального розподілу для рівня значущості α = 0,05 .

Таким чином, довірчий інтервал 95% середнього числа працівників кафе склав від 9,6 до 11,4.

Приклад 2.Для випадкової вибірки з генеральної сукупності з 64 спостережень обчислені наступні сумарні величини:

сума значень в спостереженнях,

сума квадратів відхилення значень від середнього .

Обчислити довірчий інтервал 95% для математичного очікування.

обчислимо стандартне відхилення:

,

обчислимо середнє значення:

.

Підставляємо значення у вираз для довірчого інтервалу:

де - критичне значення стандартного нормального розподілу для рівня значущості α = 0,05 .

отримуємо:

Таким чином, довірчий інтервал 95% для математичного очікування даної вибірки склав від 7,484 до 11,266.

Приклад 3.Для випадкової вибірки з генеральної сукупності з 100 спостережень обчислено середнє значення 15,2 та стандартне відхилення 3,2. Обчислити довірчий інтервал 95% для математичного очікування, потім довірчий інтервал 99%. Якщо потужність вибірки і її варіація залишаються незмінними, а збільшується довірчий коефіцієнт, то довірчий інтервал звузиться або розшириться?

Підставляємо дані значення в вираз для довірчого інтервалу:

де - критичне значення стандартного нормального розподілу для рівня значущості α = 0,05 .

отримуємо:

.

Таким чином, довірчий інтервал 95% для середнього даної вибірки склав від 14,57 до 15,82.

Знову підставляємо дані значення в вираз для довірчого інтервалу:

де - критичне значення стандартного нормального розподілу для рівня значущості α = 0,01 .

отримуємо:

.

Таким чином, довірчий інтервал 99% для середнього даної вибірки склав від 14,37 до 16,02.

Як бачимо, при збільшенні довірчого коефіцієнта збільшується також критичне значення стандартного нормального розподілу, а, отже, початкова і кінцева точки інтервалу розташовані далі від середнього, і, таким чином, довірчий інтервал для математичного очікування збільшується.

Точкова і інтервальна оцінки питомої ваги

Питома вага деякої ознаки вибірки можна інтерпретувати як точкову оцінку питомої ваги pцього ж ознаки у генеральній сукупності. Якщо ж цю величину потрібно зв'язати з імовірністю, то слід розрахувати довірчий інтервал питомої ваги pознаки у генеральній сукупності з імовірністю P = 1 - α :

.

Приклад 4.У деякому місті два кандидата Aі Bпретендують на пост мера. Випадковим чином було опитано 200 жителів міста, з яких 46% відповіли, що будуть голосувати за кандидата A, 26% - за кандидата Bі 28% не знають, за кого будуть голосувати. Визначити довірчий інтервал 95% для питомої ваги мешканців міста, які підтримують кандидата A.

Костянтин Кравчик дохідливо пояснює, що таке довірчий інтервал в медичних дослідженнях і як його використовувати

«Катрен-Стиль» продовжує публікацію циклу Костянтина Кравчика про медичною статистикою. У двох попередніх статтях автор стосувався пояснення таких понять, як і.

Костянтин Кравчик

Математик-аналітик. Спеціаліст в області статистичних досліджень в медицині і гуманітарних науках

Місто Москва

Дуже часто в статтях з клінічних досліджень можна зустріти загадкове словосполучення: «довірчий інтервал» (95% ДІ або 95% CI - confidence interval). Наприклад, в статті може бути написано: «Для оцінки значущості відмінностей використовували t-критерій Стьюдента з розрахунком 95% довірчого інтервалу».

Якого ж значення «95% довірчого інтервалу» і навіщо його розраховувати?

Що таке довірчий інтервал? - Це діапазон, в якому знаходяться справжні середні значення в генеральній сукупності. А що, бувають «несправжні» середні значення? В якомусь сенсі так, бувають. В ми пояснювали, що неможливо виміряти цікавить параметр у всій генеральної сукупності, тому дослідники задовольняються обмеженою вибіркою. У цій вибірці (наприклад, по масі тіла) є одне середнє значення (певне політичне значення), за яким ми і судимо про середнє значення у всій генеральної сукупності. Однак навряд чи середня вага у вибірці (особливо невеликий) співпаде із середньою вагою в генеральної сукупності. Тому більш правильно розраховувати і користуватися діапазоном середніх значень генеральної сукупності.

Наприклад, уявімо, що 95% довірчий інтервал (95% ДІ) по гемоглобіну становить від 110 до 122 г / л. Це означає, що з імовірністю 95% справжнє середнє значення по гемоглобіну в генеральної сукупності перебуватиме в межах від 110 до 122 г / л. Іншими словами, ми не знаємо середній показник гемоглобіну в генеральної сукупності, але можемо з 95% -й вірогідністю вказати діапазон значень для цієї ознаки.

Довірчий інтервал особливо доречний для різниці в середніх значеннях між групами або, як це називають, в розмірі ефекту.

Припустимо, ми порівнювали ефективність двох препаратів заліза: давно присутнього на ринку і тільки що зареєстрованого. Після курсу терапії оцінили концентрацію гемоглобіну в досліджуваних групах пацієнтів, і статистична програма нам порахувала, що різниця між середніми значеннями двох груп з імовірністю 95% знаходиться в діапазоні від 1,72 до 14,36 г / л (табл. 1).

Табл. 1. Критерій для незалежних вибірок
(Порівнюються групи за рівнем гемоглобіну)

Трактувати це слід так: у частини пацієнтів генеральної сукупності, яка приймає новий препарат, гемоглобін буде вище в середньому на 1,72-14,36 г / л, ніж у тих, хто приймав уже відомий препарат.

Іншими словами, в генеральної сукупності різниця в середніх значеннях по гемоглобіну у груп з 95% -й вірогідністю знаходиться в цих межах. Судити, багато це чи мало, буде вже дослідник. Сенс всього цього в тому, що ми працюємо не з одним середнім значенням, а з діапазоном значень, отже, ми більш вірогідно оцінюємо різницю по параметру між групами.

У статистичних пакетах, на розсуд дослідника, можна самостійно звужувати або розширювати межі довірчого інтервалу. Знижуючи ймовірності довірчого інтервалу, ми звужуємо діапазон середніх. Наприклад, при 90% ДІ діапазон середніх (або різниці середніх) буде вже, ніж при 95%.

І навпаки, збільшення ймовірності до 99% розширює діапазон значень. При порівнянні груп нижня межа ДІ може перетнути нульову позначку. Наприклад, якщо ми розширили межі довірчого інтервалу до 99%, то межі інтервалу розташувалися від -1 до 16 г / л. Це означає, що в генеральній сукупності є групи, відмінність середніх між якими по досліджуваному ознакою дорівнює 0 (М = 0).

За допомогою довірчого інтервалу можна перевіряти статистичні гіпотези. Якщо довірчий інтервал перетинає нульове значення, то нульова гіпотеза, що припускає, що групи не розрізняються по досліджуваному параметру, вірна. Приклад описаний вище, коли ми розширили межі до 99%. Десь в генеральної сукупності у нас знайшлися групи, які не відрізнялися.

95% довірчий інтервал різниці по гемоглобіну, (г / л)


На малюнку у вигляді лінії зображений 95% довірчий інтервал різниці середніх значень по гемоглобіну між двома групами. Лінія проходить нульову позначку, отже, має місце різниця між середніми значеннями, що дорівнює нулю, що підтверджує нульову гіпотезу про те, що групи не розрізняються. Діапазон різниці між групами лежить від -2 до 5 г / л, Це означає, що гемоглобін може як знизитися на 2 г / л, так і підвищитися на 5 г / л.

Довірчий інтервал - дуже важливий показник. Завдяки йому можна подивитися, чи були відмінності в групах дійсно за рахунок різниці середніх або за рахунок великої вибірки, т. К. При великій вибірці шанси знайти відмінності більше, ніж при малій.

На практиці це може виглядати так. Ми взяли вибірку в 1000 чоловік, виміряли рівень гемоглобіну і виявили, що довірчий інтервал різниці середніх лежить від 1,2 до 1,5 г / л. Рівень статистичної значущості при цьому p

Ми бачимо, що концентрація гемоглобіну підвищилася, але практично непомітно, отже, статистична значимість з'явилася саме за рахунок обсягу вибірки.

Довірчий інтервал може бути вирахуваний не тільки для середніх значень, а й для пропорцій (і відносин ризиків). Наприклад, нас цікавить довірчий інтервал пропорцій пацієнтів, які досягли ремісії, приймаючи розроблене ліки. Припустимо, що 95% ДІ для пропорцій, т. Е. Для частки таких пацієнтів, лежить в межах 0,60-0,80. Таким чином, ми можемо сказати, що наші ліки має терапевтичний ефект від 60 до 80% випадків.