Konfidenzintervall ist eine Formel zur Berechnung eines Physikers. Konstruktion des Konfidenzintervalls für die mathematische Erwartung der Allgemeinbevölkerung. Konfidenzintervallmethode

Zuletzt aktualisiert: 3. März 2020
Beispieldatei

Konstruieren wir ein Konfidenzintervall in MS EXCEL, um den Mittelwert der Verteilung im Fall zu schätzen von bekannter Bedeutung Abweichung.

Natürlich die Wahl Vertrauensniveau kommt ganz auf das zu lösende Problem an. Daher sollte das Vertrauen des Fluggastes in die Zuverlässigkeit des Flugzeugs zweifellos höher sein als das Vertrauen des Käufers in die Zuverlässigkeit der Glühbirne.

Problemstellung

Angenommen, von die allgemeine Bevölkerung genommen haben Stichprobe Größe n. Es wird angenommen dass Standardabweichung diese Verteilung ist bekannt. Auf dieser Grundlage ist es notwendig Probenahme das Unbekannte bewerten mittlere Verteilung(μ,) und konstruieren das entsprechende beidseitigKonfidenzintervall .

Punktschätzung

Wie bekannt ist, Statistiken(wir bezeichnen es X Mittwoch) ist ein unverzerrte Schätzung des Mittelwerts Dies die allgemeine Bevölkerung und hat die Verteilung N (μ; σ 2 / n).

Notiz : Was tun, wenn Sie bauen müssen? Konfidenzintervall bei einer Verteilung, die ist nichtnormal? In diesem Fall kommt es zur Rettung, die besagt, dass bei einer ausreichend großen Größe Probenahme n aus der Verteilung nicht seinnormal , Stichprobenverteilung der Statistik X av Wille CA entsprechen Normalverteilung mit Parametern N (μ; σ 2 / n).

So, PunktschätzungMitteVerteilungswerte wir haben - das Stichprobenmittelwert, d.h. X Mittwoch... Kommen wir nun zu Konfidenzintervall.

Zeichnen eines Konfidenzintervalls

Wenn wir die Verteilung und ihre Parameter kennen, können wir normalerweise die Wahrscheinlichkeit berechnen, dass die Zufallsvariable einen Wert aus dem von uns angegebenen Intervall annimmt. Machen wir nun das Gegenteil: Finden Sie das Intervall, in das die Zufallsvariable mit einer bestimmten Wahrscheinlichkeit fällt. Zum Beispiel aus den Eigenschaften Normalverteilung es ist bekannt, dass mit einer Wahrscheinlichkeit von 95% eine Zufallsvariable verteilt über normales Gesetz, fällt in ein Intervall von ca. +/- 2 von Mittelwert(siehe Artikel über). Dieses Intervall dient uns als Prototyp Konfidenzintervall .

Lassen Sie uns nun herausfinden, ob wir die Verteilung kennen , dieses Intervall berechnen? Um die Frage zu beantworten, müssen wir die Form der Verteilung und ihre Parameter angeben.

Wir kennen die Verteilungsform - sie ist Normalverteilung(Denken Sie daran, dass wir darüber sprechen ProbenverteilungStatistikenX Mittwoch).

Wir kennen den Parameter μ nicht (er muss nur geschätzt werden mit Konfidenzintervall), aber wir haben seine Schätzung X Mi, berechnet basierend auf Probenahme, die verwendet werden können.

Der zweite Parameter ist Standardabweichung des Stichprobenmittelswir werden es für bekannt halten, ist es gleich σ / √n.

Weil kennen wir μ nicht, dann konstruieren wir das Intervall +/- 2 Standardabweichungen nicht von Mittelwert, und aus seiner bekannten Schätzung X Mittwoch... Jene. bei der Berechnung Konfidenzintervall das werden wir NICHT annehmen X Mittwoch fällt in den Bereich +/- 2 Standardabweichungen aus μ mit einer Wahrscheinlichkeit von 95%, und wir nehmen an, dass das Intervall +/- 2 Standardabweichungen von X Mittwoch mit einer Wahrscheinlichkeit von 95% deckt μ . ab - Durchschnitt der Gesamtbevölkerung, von dem es genommen wird Stichprobe... Diese beiden Aussagen sind äquivalent, aber die zweite Aussage erlaubt es uns zu konstruieren Konfidenzintervall .

Verfeinern wir außerdem das Intervall: eine Zufallsvariable verteilt über normales Gesetz, fällt mit einer Wahrscheinlichkeit von 95% in das Intervall +/- 1.960 Standardabweichungen, nicht +/- 2 Standardabweichungen... Dies lässt sich mit der Formel berechnen = NORM.ST.OBR ((1 + 0,95) / 2), cm. Beispieldatei Blattabstand .

Wir können nun eine probabilistische Aussage formulieren, die uns zur Bildung dient Konfidenzintervall: „Die Wahrscheinlichkeit, dass Bevölkerungsdurchschnitt aus durchschnittliche Stichprobe innerhalb von 1960 " Standardabweichungen des Stichprobenmittels ", ist gleich 95%".

Der in der Aussage erwähnte Wahrscheinlichkeitswert hat einen besonderen Namen was damit verbunden ist Signifikanzniveau α (alpha) durch einen einfachen Ausdruck Vertrauens Stufe = 1 . In unserem Fall Signifikanzniveau α =1-0,95=0,05 .

Basierend auf dieser probabilistischen Aussage schreiben wir nun einen Ausdruck zur Berechnung von Konfidenzintervall :

wobei Z α / 2 StandardNormalverteilung(ein solcher Wert der Zufallsvariablen z , was P (z >= Zα / 2 ) = α / 2).

Notiz : Oberes α / 2-Quantil bestimmt die Breite Konfidenzintervall v StandardabweichungenStichprobe bedeuten. Oberes α / 2-Quantil StandardNormalverteilung immer größer als 0, was sehr praktisch ist.

In unserem Fall bei α = 0,05, oberes α / 2-Quantil ist gleich 1.960. Für andere Signifikanzniveaus α (10 %; 1 %) oberes α / 2-QuantilZα / 2 kann mit der Formel berechnet werden = STANDARD ST.OBR (1-α / 2) oder falls bekannt Vertrauens Stufe , = NORM.ST.OBR ((1 + Vertrauensstufe) / 2) .

Normalerweise beim Bauen Konfidenzintervalle zur Schätzung des Mittelwerts benutz nur oberes α /2- Quantil und nicht verwenden unteres α /2- Quantil... Dies ist möglich, weil StandardNormalverteilung symmetrisch zur x-Achse ( seine Verteilungsdichte symmetrisch zu durchschnittlich, d.h. 0) . Daher ist keine Berechnung erforderlich unteres α / 2-Quantil(es heißt einfach α / 2-Quantil), da es ist gleich oberes α /2- Quantil mit Minuszeichen.

Denken Sie daran, dass trotz der Form der Verteilung der Größe x die entsprechende Zufallsvariable X Mittwoch verteilt CAfein N (μ; σ 2 / n) (siehe Artikel über). Daher gilt im allgemeinen Fall der obige Ausdruck für Konfidenzintervall ist nur ungefähr. Wenn die Menge x auf verteilt ist normales Gesetz N (μ; σ 2 / n), dann der Ausdruck für Konfidenzintervall ist genau.

Konfidenzintervallberechnung in MS EXCEL

Lassen Sie uns das Problem lösen. Reaktionszeit elektronisches Bauteil zum Eingangssignal ist ein wichtiges Merkmal des Gerätes. Der Ingenieur möchte ein Konfidenzintervall für die durchschnittliche Reaktionszeit mit einem Konfidenzniveau von 95 % darstellen. Aus Erfahrung weiß der Ingenieur, dass die Standardabweichung der Reaktionszeit 8 ms beträgt. Es ist bekannt, dass der Ingenieur 25 Messungen durchführte, um die Reaktionszeit abzuschätzen, der Durchschnittswert betrug 78 ms.

Lösung: Ein Ingenieur möchte die Reaktionszeit eines elektronischen Geräts wissen, aber er versteht, dass die Reaktionszeit keine feste, sondern eine Zufallsvariable ist, die ihre eigene Verteilung hat. Er kann sich also am besten darauf verlassen, die Parameter und die Form dieser Verteilung zu bestimmen.

Leider kennen wir aus der Problemstellung nicht die Form der Antwortzeitverteilung (muss nicht sein normal). , diese Verteilung ist ebenfalls unbekannt. Nur für ihn bekannt Standardabweichung= 8. Also, bis wir die Wahrscheinlichkeiten berechnen und bauen können Konfidenzintervall .

Aber trotz der Tatsache, dass wir die Verteilung nicht kennen Zeitseparate Antwort, wir wissen, dass nach CPT , Probenverteilungdurchschnittliche Reaktionszeit ist ungefähr normal(wir gehen davon aus, dass die Bedingungen CPT werden durchgeführt, weil die Größe Probenahme groß genug (n = 25)) .

Außerdem, der Durchschnitt dieser Verteilung ist Durchschnitt die Verteilung einer einzelnen Antwort, d.h. μ. EIN Standardabweichung dieser Verteilung (σ / √n) kann durch die Formel = 8 / ROOT (25) berechnet werden.

Es ist auch bekannt, dass der Ingenieur erhielt Punktschätzung Parameter μ gleich 78 ms (X vgl.). Daher können wir jetzt die Wahrscheinlichkeiten berechnen, da wir kennen die Verteilungsform ( normal) und seine Parameter (X cf und σ / √n).

Der Ingenieur will es wissen erwarteter Wertμ der Antwortzeitverteilung. Wie oben erwähnt, ist dieses μ gleich die mathematische Erwartung der Stichprobenverteilung der mittleren Antwortzeit... Wenn wir verwenden Normalverteilung N (X cf; σ / √n), dann liegt das gewünschte µ mit einer Wahrscheinlichkeit von etwa 95 % im Bereich +/- 2 * σ / n.

Signifikanzniveau ist gleich 1-0,95 = 0,05.

Finden Sie schließlich die linke und rechte Grenze Konfidenzintervall... Linker Rand: = 78-STANDARD ST.OBR (1-0,05 / 2) * 8 / ROOT (25) = 74,864 Rechter Rand: = 78 + NORM.ST.OBR (1-0,05 / 2) * 8 / ROOT (25) = 81,136

Linker Rand: = NORM.OBR (0,05 / 2; 78; 8 / ROOT (25)) Rechter Rand: = NORM.INV (1-0,05 / 2; 78; 8 / ROOT (25))

Antworten : Konfidenzintervall bei Konfidenzniveau 95% und σ =8 Frau ist gleich 78 +/- 3,136 msek.

V Beispieldatei auf dem Sigma-Arbeitsblatt ein Formular zur Berechnung und Konstruktion ist bekannt bilateralKonfidenzintervall für willkürlich Proben mit einem gegebenen σ und Signifikanzniveau .

Funktion VERTRAUEN.NORM ()

Wenn die Werte Probenahme sind im bereich B20: B79 , ein Signifikanzniveau gleich 0,05; dann die MS EXCEL-Formel: = MITTELWERT (B20: B79) -VERTRAUEN.NORM (0,05, σ, ZÄHLEN (B20: B79)) gibt den linken Rand zurück Konfidenzintervall .

Die gleiche Grenze kann mit der Formel berechnet werden: = DURCHSCHNITT (B20: B79) -NORM.ST.INV (1-0,05 / 2) * σ / ROOT (COUNT (B20: B79))

Notiz: Die Funktion VERTRAUEN.NORM () wurde in MS EXCEL 2010 verwendet. In früheren Versionen von MS EXCEL wurde die Funktion VERTRAUEN () verwendet.

In den vorherigen Unterabschnitten haben wir uns mit der Frage der Schätzung eines unbekannten Parameters beschäftigt ein eine Nummer. Diese Schätzung wird "Punkt" genannt. In einer Reihe von Aufgaben ist es erforderlich, nicht nur für den Parameter zu finden ein einen geeigneten Zahlenwert, sondern bewerten Sie auch seine Genauigkeit und Zuverlässigkeit. Sie wollen wissen, zu welchen Fehlern eine Parameterersetzung führen kann ein seine Punktschätzung ein und mit welcher Sicherheit können wir erwarten, dass diese Fehler innerhalb bekannter Grenzen bleiben?

Probleme dieser Art sind insbesondere für eine kleine Anzahl von Beobachtungen relevant, wenn die Punktschätzung und in sie ist größtenteils zufällig und das ungefähre Ersetzen von a durch a kann zu schwerwiegenden Fehlern führen.

Um eine Vorstellung von der Genauigkeit und Zuverlässigkeit der Bewertung zu geben ein,

in der mathematischen Statistik werden sogenannte Konfidenzintervalle und Konfidenzwahrscheinlichkeiten verwendet.

Lassen Sie für den Parameter ein aus Erfahrung unvoreingenommene Schätzung A. Wir wollen in diesem Fall den möglichen Fehler auswerten. Weisen wir eine hinreichend große Wahrscheinlichkeit p (z. B. p = 0,9, 0,95 oder 0,99) zu, sodass ein Ereignis mit einer Wahrscheinlichkeit p als praktisch zuverlässig angesehen werden kann, und finden wir einen solchen Wert s, für den

Dann der Bereich der praktisch möglichen Werte des beim Austausch auftretenden Fehlers ein An ein, wird ± s sein; große Absolutwertfehler treten nur mit geringer Wahrscheinlichkeit auf a = 1 - p. Wir schreiben (14.3.1) um als:

Gleichheit (14.3.2) bedeutet, dass mit Wahrscheinlichkeit p der unbekannte Wert des Parameters ein fällt in das Intervall

Gleichzeitig ist ein Umstand zu beachten. Zuvor haben wir wiederholt die Wahrscheinlichkeit betrachtet, mit der eine Zufallsvariable in ein gegebenes nicht-zufälliges Intervall fällt. Hier ist die Situation anders: die Menge ein nicht zufällig, aber das Intervall / p ist zufällig. Zufällig seine Position auf der Abszissenachse, bestimmt durch seinen Mittelpunkt ein; auch die Länge des Intervalls 2s ist im Allgemeinen zufällig, da der Wert von s in der Regel aus experimentellen Daten berechnet wird. Daher wäre es in diesem Fall besser, den Wert von p nicht als die Wahrscheinlichkeit des "Treffens" des Punktes zu interpretieren ein in das Intervall / p, und als Wahrscheinlichkeit, dass das Zufallsintervall / p den Punkt abdeckt ein(Abb. 14.3.1).

Reis. 14.3.1

Die Wahrscheinlichkeit p heißt üblicherweise Vertrauensniveau, und das Intervall / p ist Konfidenzintervall. Intervallgrenzen Wenn. ax = a- s und a 2 = a + aber angerufen Grenzen des Selbstvertrauens.

Lassen Sie uns das Konzept eines Konfidenzintervalls noch einmal interpretieren: Es kann als Intervall von Parameterwerten betrachtet werden ein, mit experimentellen Daten kompatibel ist und ihnen nicht widerspricht. In der Tat, wenn wir uns darauf einigen, ein Ereignis mit Wahrscheinlichkeit a = 1-p als praktisch unmöglich zu betrachten, dann die Werte des Parameters a, für die a - a> s, müssen als den experimentellen Daten widersprechend erkannt werden, und diejenigen, für die |a - ein a t na 2.

Lassen Sie für den Parameter ein es gibt eine unverzerrte Schätzung A. Wenn wir das Verteilungsgesetz der Menge kennen würden ein, wäre das Problem, das Konfidenzintervall zu finden, sehr einfach: Es würde genügen, einen solchen Wert von s zu finden, für den

Die Schwierigkeit besteht darin, dass das Verteilungsgesetz der Schätzung ein hängt vom Verteilungsgesetz der Menge ab x und damit auf seine unbekannten Parameter (insbesondere auf den Parameter selbst ein).

Um diese Schwierigkeit zu umgehen, kann die folgende grobe Näherung angewendet werden: Ersetzen Sie die unbekannten Parameter im Ausdruck für s durch ihre Punktschätzungen. Mit relativ vielen Experimenten NS(ca. 20 ... 30) liefert diese Technik normalerweise zufriedenstellende Ergebnisse in Bezug auf die Genauigkeit.

Betrachten Sie als Beispiel das Problem des Konfidenzintervalls für den mathematischen Erwartungswert.

Lass es produzieren NS X, deren Eigenschaften die mathematische Erwartung sind T und Varianz D- Unbekannt. Für diese Parameter wurden die folgenden Schätzungen erhalten:

Für den mathematischen Erwartungswert ist das Konfidenzintervall / p entsprechend der Konfidenzwahrscheinlichkeit p zu konstruieren T Größen X.

Bei der Lösung dieses Problems nutzen wir die Tatsache, dass die Menge T stellt den Betrag dar NS unabhängige identisch verteilte Zufallsvariablen X h und nach dem zentralen Grenzwertsatz für hinreichend große NS sein Verteilungsgesetz ist nahezu normal. In der Praxis kann das Verteilungsgesetz der Summe selbst bei einer relativ kleinen Anzahl von Termen (ca. 10 ... 20) als annähernd normal angesehen werden. Wir gehen davon aus, dass die Menge T nach dem normalen Gesetz verteilt. Die Eigenschaften dieses Gesetzes - mathematischer Erwartungswert und Varianz - sind jeweils gleich T und

(siehe Kapitel 13 Unterabschnitt 13.3). Angenommen, die Menge D wir kennen und finden einen solchen Wert Ep, für den

Mit der Formel (6.3.5) in Kapitel 6 drücken wir die Wahrscheinlichkeit auf der linken Seite von (14.3.5) durch die Normalverteilungsfunktion aus

wo ist die Standardabweichung der Schätzung T.

Aus der Gleichung

Wir finden den Wert von Sp:

wobei arg Ф * (х) die Umkehrfunktion von Ф * ist (NS), jene. ein solcher Wert des Arguments, für den die Normalverteilungsfunktion gleich ist NS.

Dispersion D, durch die der Wert ausgedrückt wird ein 1P, wir wissen es nicht genau; als ungefähren Wert können Sie die Schätzung verwenden D(14.3.4) und setzen Sie ungefähr:

Damit ist das Problem der Konstruktion eines Konfidenzintervalls näherungsweise gelöst, das gleich ist:

wobei gp durch Formel (14.3.7) definiert ist.

Um eine inverse Interpolation in den Tabellen der Funktion Ф * (l) bei der Berechnung von s p zu vermeiden, ist es zweckmäßig, eine spezielle Tabelle (Tabelle 14.3.1) zu erstellen, die die Werte der Menge angibt

je nach p. Die Größe (p bestimmt für das Normalgesetz die Anzahl der Standardabweichungen, die rechts und links vom Streuzentrum verschoben werden müssen, damit die Wahrscheinlichkeit, die resultierende Fläche zu treffen, gleich p ist.

Durch den Wert von 7 p wird das Konfidenzintervall wie folgt ausgedrückt:

Tabelle 14.3.1

Beispiel 1. 20 Experimente zum Wert durchgeführt X; die Ergebnisse sind in der Tabelle aufgeführt. 14.3.2.

Tabelle 14.3.2

Es ist erforderlich, eine Schätzung für den mathematischen Erwartungswert der Größe zu finden x und bauen Sie ein Konfidenzintervall auf, das einem Konfidenzniveau von p = 0,8 entspricht.

Lösung. Wir haben:

Nachdem wir als Ursprung l: = 10 gewählt haben, finden wir nach der dritten Formel (14.2.14) die unverzerrte Schätzung D :

Laut Tabelle. 14.3.1 finden

Grenzen des Selbstvertrauens:

Vertrauensintervall:

Parameterwerte T, in diesem Intervall liegen, stimmen mit den in der Tabelle angegebenen experimentellen Daten überein. 14.3.2.

Das Konfidenzintervall für die Varianz kann auf ähnliche Weise konstruiert werden.

Lass es produzieren NS unabhängige Experimente an einer Zufallsvariablen x mit unbekannten Parametern aus und A, und für die Varianz D die unverzerrte Schätzung wird erhalten:

Es ist erforderlich, das Konfidenzintervall für die Varianz grob zu konstruieren.

Aus Formel (14.3.11) ist ersichtlich, dass die Menge D repräsentiert

die Summe NS Zufallsvariablen der Form. Diese Mengen sind nicht

unabhängig, da jeder von ihnen die Menge enthält T, abhängig von allen anderen. Es kann jedoch gezeigt werden, dass mit zunehmendem NS auch das Verteilungsgesetz ihrer Summe ist annähernd normal. Praktisch bei NS= 20 ... 30 kann es schon als normal angesehen werden.

Nehmen wir an, dass dies so ist, und finden Sie die Merkmale dieses Gesetzes heraus: mathematische Erwartung und Varianz. Da die Partitur D- unvoreingenommen also M [D] = D.

Varianz berechnen D D ist mit relativ komplexen Berechnungen verbunden, daher präsentieren wir seinen Ausdruck ohne Ausgabe:

wobei q 4 das vierte zentrale Moment der Größe ist X.

Um diesen Ausdruck zu verwenden, müssen Sie darin die Werte \ u200b \ u200b4 und ersetzen D(zumindest ungefähr). Anstatt von D Sie können seine Schätzung verwenden D. Grundsätzlich kann das vierte zentrale Moment auch durch eine Schätzung ersetzt werden, beispielsweise durch einen Wert der Form:

ein solcher Ersatz ergibt jedoch eine äußerst geringe Genauigkeit, da im Allgemeinen mit einer begrenzten Anzahl von Experimenten Momente höherer Ordnung mit großen Fehlern bestimmt werden. In der Praxis kommt es jedoch häufig vor, dass die Form des Verteilungsgesetzes der Menge x im Voraus bekannt: nur seine Parameter sind unbekannt. Dann können Sie versuchen, q 4 durch auszudrücken D.

Nehmen wir den häufigsten Fall, wenn die Menge x nach dem normalen Gesetz verteilt. Dann wird sein viertes zentrales Moment als Varianz ausgedrückt (siehe Kapitel 6, Abschnitt 6.2);

und Formel (14.3.12) liefert oder

In (14.3.14) das Unbekannte ersetzen D seine Einschätzung D, wir bekommen: woher

Das Moment c 4 kann ausgedrückt werden durch D auch in einigen anderen Fällen, wenn die Verteilung der Menge x ist nicht normal, aber sein Aussehen ist bekannt. Für das Gesetz der gleichmäßigen Dichte (siehe Kapitel 5) gilt beispielsweise:

wobei (a, P) das Intervall ist, in dem das Gesetz festgelegt ist.

Somit,

Mit der Formel (14.3.12) erhalten wir: woher finden wir ungefähr

In Fällen, in denen die Form des Verteilungsgesetzes von 26 unbekannt ist, wird dennoch empfohlen, bei der groben Schätzung des Wertes von a / die Formel (14.3.16) zu verwenden, es sei denn, es bestehen besondere Gründe zu der Annahme, dass sich dieses Gesetz stark von unterscheidet das Normale (hat einen spürbaren positiven oder negativen Überschuss) ...

Wenn der Näherungswert von a /) auf die eine oder andere Weise erhalten wird, ist es möglich, ein Konfidenzintervall für die Varianz auf die gleiche Weise zu konstruieren, wie wir es für den mathematischen Erwartungswert erstellt haben:

wobei der Wert, abhängig von der gegebenen Wahrscheinlichkeit p, gemäß der Tabelle ermittelt wird. 14.3.1.

Beispiel 2. Finden Sie ein Konfidenzintervall von ungefähr 80 % für die Varianz einer Zufallsvariablen x unter den Bedingungen von Beispiel 1, wenn bekannt ist, dass die Menge x nach einem dem Normalfall nahestehenden Gesetz verteilt.

Lösung. Der Wert bleibt derselbe wie in der Tabelle. 14.3.1:

Nach der Formel (14.3.16)

Mit der Formel (14.3.18) finden wir das Konfidenzintervall:

Der entsprechende Wertebereich der Standardabweichung: (0,21; 0,29).

14.4. Exakte Methoden zur Konstruktion von Konfidenzintervallen für die Parameter einer nach dem Normalgesetz verteilten Zufallsvariablen

Im vorherigen Unterabschnitt haben wir uns grob näherungsweise Methoden zur Konstruktion von Konfidenzintervallen für Erwartungswert und Varianz angesehen. Hier geben wir eine Vorstellung von den genauen Methoden zur Lösung desselben Problems. Wir betonen, dass es zur genauen Ermittlung der Konfidenzintervalle unbedingt notwendig ist, die Form des Verteilungsgesetzes der Größe im Voraus zu kennen X, für die Anwendung von Näherungsverfahren ist dies jedoch nicht erforderlich.

Die Idee hinter genauen Methoden zur Konstruktion von Konfidenzintervallen ist wie folgt. Jedes Konfidenzintervall ergibt sich aus der Bedingung, die die Wahrscheinlichkeit der Erfüllung einiger Ungleichungen ausdrückt, zu denen die für uns interessante Schätzung gehört A. Schätzverteilungsrecht ein hängt im allgemeinen Fall von den unbekannten Parametern der Größe ab X. Manchmal ist es jedoch möglich, Ungleichungen von einer Zufallsvariablen zu übergeben ein zu einer anderen Funktion von beobachteten Werten XnX2, ..., X p. deren Verteilungsgesetz nicht von unbekannten Parametern abhängt, sondern nur von der Anzahl der Experimente und von der Form des Verteilungsgesetzes für die Menge X. Solche Zufallsvariablen spielen in der mathematischen Statistik eine wichtige Rolle; sie wurden am genauesten für den Fall der Normalverteilung der Größe untersucht X.

Zum Beispiel wurde bewiesen, dass für eine Normalverteilung der Menge x Zufallswert

gehorcht dem sogenannten Studentenvertriebsrecht mit NS- 1 Freiheitsgrade; die Dichte dieses Gesetzes hat die Form

wobei Г (х) die bekannte Gammafunktion ist:

Es wurde auch bewiesen, dass die Zufallsvariable

hat eine "Verteilung% 2" mit NS- 1 Freiheitsgrade (siehe Kapitel 7), deren Dichte durch die Formel ausgedrückt wird

Ohne auf die Herleitung der Verteilungen (14.4.2) und (14.4.4) einzugehen, zeigen wir, wie sie bei der Konstruktion von Konfidenzintervallen für die Parameter ty D.

Lass es produzieren NS unabhängige Experimente an einer Zufallsvariablen X, nach dem Normalgesetz verteilt mit unbekannten Parametern Thio. Für diese Parameter wurden die Schätzungen erhalten

Es ist erforderlich, für beide Parameter Konfidenzintervalle zu konstruieren, die der Konfidenzwahrscheinlichkeit p entsprechen.

Konstruieren wir zunächst das Konfidenzintervall für den mathematischen Erwartungswert. Dieses Intervall ist natürlich symmetrisch zu T; bezeichne mit s p die halbe Länge des Intervalls. Die Größe s p muss so gewählt werden, dass die Bedingung

Versuchen wir, die linke Seite der Gleichheit (14.4.5) aus der Zufallsvariablen zu übergeben T auf eine Zufallsvariable T, nach dem Studentengesetz verteilt. Dazu multiplizieren wir beide Seiten der Ungleichung |m-w?|

um einen positiven Wert: oder mit der Notation (14.4.1),

Lassen Sie uns eine Zahl / p finden, so dass der Wert / p aus der Bedingung gefunden wird

Aus Formel (14.4.2) ist ersichtlich, dass (1) eine gerade Funktion ist, daher gibt (14.4.8)

Gleichheit (14.4.9) bestimmt den Wert von / p in Abhängigkeit von p. Wenn Ihnen eine Wertetabelle des Integrals zur Verfügung steht

dann kann der Wert von / p durch umgekehrte Interpolation in der Tabelle gefunden werden. Es ist jedoch bequemer, im Voraus eine Tabelle mit / p-Werten zu erstellen. Eine solche Tabelle befindet sich im Anhang (Tabelle 5). Diese Tabelle zeigt die Werte in Abhängigkeit von der Konfidenzwahrscheinlichkeit p und der Anzahl der Freiheitsgrade NS- 1. Nach der Bestimmung / p gemäß der Tabelle. 5 und vorausgesetzt

wir finden die halbe Breite des Konfidenzintervalls / p und das Intervall selbst

Beispiel 1. 5 unabhängige Experimente mit einer Zufallsvariablen gemacht X, normalverteilt mit unbekannten Parametern T und über. Die Ergebnisse der Experimente sind in der Tabelle gezeigt. 14.4.1.

Tabelle 14.4.1

Kostenvoranschlag finden T für die mathematische Erwartung und konstruieren ein 90%-Konfidenzintervall / p dafür (d. h. das Intervall, das der Konfidenzwahrscheinlichkeit p = 0,9 entspricht).

Lösung. Wir haben:

Gemäß Tabelle 5 Anträge auf NS - 1 = 4 und p = 0,9 finden wir wo

Das Konfidenzintervall ist

Beispiel 2. Für die Bedingungen von Beispiel 1 von Unterabschnitt 14.3 unter Annahme des Wertes x Normalverteilt, finden Sie das genaue Konfidenzintervall.

Lösung. Gemäß Tabelle 5 finden wir Anwendungen für NS - 1 = 19ir =

0,8/p = 1,328; von hier

Im Vergleich mit der Lösung von Beispiel 1 des Unterabschnitts 14.3 (e p = 0,072) sind wir überzeugt, dass die Diskrepanz sehr gering ist. Wenn wir die Genauigkeit bis auf die zweite Dezimalstelle halten, dann stimmen die durch exakte und approximative Methode gefundenen Konfidenzintervalle überein:

Fahren wir mit der Konstruktion eines Konfidenzintervalls für die Varianz fort. Betrachten Sie die unverzerrte Varianzschätzung

und drücken Sie die Zufallsvariable aus D durch den Wert V(14.4.3) mit einer Verteilung x 2 (14.4.4):

Das Verteilungsgesetz der Menge kennen V., man findet das Intervall / (1, in das es mit einer gegebenen Wahrscheinlichkeit p fällt.

Vertriebsrecht k n _ x (v) Menge I 7 hat die in Abb. 14.4.1.

Reis. 14.4.1

Es stellt sich die Frage: Wie wählt man das Intervall / p? Wenn das Verteilungsgesetz der Menge V symmetrisch wäre (wie das Normalgesetz oder die Student-Verteilung), wäre es naheliegend, das Intervall / p symmetrisch in Bezug auf den mathematischen Erwartungswert zu nehmen. In diesem Fall gilt das Gesetz k n _ x (v) asymmetrisch. Wir vereinbaren, das Intervall / p so zu wählen, dass die Wahrscheinlichkeiten der Ausgabe der Größe V außerhalb des Intervalls nach rechts und links (schraffierte Bereiche in Abb. 14.4.1) waren gleich und gleich

Um ein Intervall / p mit dieser Eigenschaft zu konstruieren, verwenden wir table. 4 Anhänge: es listet Zahlen auf j) so dass

für den Wert V., mit x 2 -Verteilung mit r Freiheitsgraden. In unserem Fall r = n- 1. Lass uns reparieren r = n- 1 und suchen Sie in der entsprechenden Zeile der Tabelle. 4 zwei Bedeutungen x 2 - eine entspricht der Wahrscheinlichkeit die andere - Wahrscheinlichkeiten Lasst uns diese bezeichnen

Bedeutung um 2 und xl? Das Intervall hat um 2, seine Linke, und y ~ rechtes Ende.

Suchen wir nun das gewünschte Konfidenzintervall / | für die Varianz mit Grenzen D, und D2, was den punkt abdeckt D mit Wahrscheinlichkeit p:

Konstruieren wir ein solches Intervall / (, = (?> B A), das den Punkt D wenn und nur wenn die Menge V fällt in das Intervall / p. Zeigen wir, dass das Intervall

erfüllt diese Bedingung. Tatsächlich sind die Ungleichungen sind gleichbedeutend mit Ungleichungen

und diese Ungleichungen sind mit der Wahrscheinlichkeit p erfüllt. Damit ergibt sich das Konfidenzintervall für die Varianz und wird durch die Formel (14.4.13) ausgedrückt.

Beispiel 3. Bestimmen Sie das Konfidenzintervall für die Varianz unter den Bedingungen von Beispiel 2 von Unterabschnitt 14.3, wenn bekannt ist, dass der Wert x normal verteilt.

Lösung. Wir haben ... Gemäß Tabelle 4 des Anhangs

wir finden bei r = n - 1 = 19

Mit der Formel (14.4.13) ermitteln wir das Konfidenzintervall für die Varianz

Entsprechendes Intervall für die Standardabweichung: (0,21; 0,32). Dieses Intervall überschreitet nur geringfügig das Intervall (0,21; 0,29), das in Beispiel 2 von Unterabschnitt 14.3 durch ein Näherungsverfahren erhalten wurde.

  • Abbildung 14.3.1 betrachtet ein um a symmetrisches Konfidenzintervall. Im Allgemeinen ist dies, wie wir später sehen werden, optional.

Vertrauensintervall(CI; auf Englisch, Konfidenzintervall - CI), das in einer Studie mit einer Stichprobe erhalten wurde, gibt ein Maß für die Genauigkeit (oder Unsicherheit) der Studienergebnisse an, um Rückschlüsse auf die Population all dieser Patienten (Allgemeinpopulation) zu ziehen. Die korrekte Definition des 95 %-KI kann wie folgt formuliert werden: 95 % dieser Intervalle enthalten den wahren Wert in der Grundgesamtheit. Diese Interpretation ist etwas ungenauer: CI ist der Wertebereich, innerhalb dessen man zu 95 % sicher sein kann, dass er den wahren Wert enthält. Bei der Verwendung von CIs liegt der Schwerpunkt auf der Quantifizierung des Effekts, im Gegensatz zum P-Wert, der durch Testen auf statistische Signifikanz erhalten wird. Der P-Wert misst keine Quantität, sondern dient eher als Maß für die Stärke der Evidenz gegen die Nullhypothese „kein Effekt“. Der P-Wert allein sagt uns nichts über die Größe der Differenz oder auch nur über ihre Richtung. Daher sind unabhängige Werte von P in Artikeln oder Abstracts absolut informativ. Im Gegensatz dazu zeigt der CI sowohl das Ausmaß der Wirkung von unmittelbarem Interesse, wie die Nützlichkeit einer Behandlung, als auch die Stärke der Evidenz an. Daher steht JI in direktem Zusammenhang mit der EBM-Praxis.

Bewertungsansatz für statistische Analyse, illustriert durch das CI, zielt darauf ab, die Höhe des interessierenden Effekts (Sensitivität des diagnostischen Tests, Häufigkeit der vorhergesagten Fälle, Verringerung des relativen Risikos bei der Behandlung usw.) sowie die Unsicherheit in dieser zu messen Wirkung. Am häufigsten ist CI der Wertebereich auf beiden Seiten der Schätzung, in dem der wahre Wert wahrscheinlich liegt, und Sie können sich dessen zu 95 % sicher sein. Die Vereinbarung, die 95%-Wahrscheinlichkeit willkürlich zu verwenden, sowie den P-Wert<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

Das CI basiert auf der Idee, dass die gleiche Studie an anderen Patientenproben nicht zu identischen Ergebnissen führen würde, sondern dass ihre Ergebnisse um einen wahren, aber unbekannten Wert verteilt würden. Anders ausgedrückt beschreibt das CI dies als „stichprobenabhängige Variabilität“. Das CI spiegelt keine zusätzliche Unsicherheit aufgrund anderer Ursachen wider; insbesondere nicht die Auswirkungen eines selektiven Patientenverlusts bei der Nachverfolgung, schlechter Compliance oder ungenauer Ergebnismessung, fehlender Verblindung usw. CI unterschätzt also immer die Gesamtunsicherheit.

Berechnung des Konfidenzintervalls

Tabelle A1.1. Standardfehler und Konfidenzintervalle für einige klinische Messungen

Typischerweise wird der CI aus einer beobachteten Schätzung eines quantitativen Maßes, wie der Differenz (d) zwischen zwei Anteilen, und einem Standardfehler (SE) bei der Schätzung dieser Differenz berechnet. Das so erhaltene ungefähre 95 %-KI beträgt d ± 1,96 SE. Die Formel ändert sich je nach Art des Ergebnismaßes und dem Umfang des CI. In einer randomisierten, placebokontrollierten Studie mit einem azellulären Pertussis-Impfstoff entwickelten 72 von 1.670 (4,3%) Säuglingen, die den Impfstoff erhielten, Pertussis und 240 von 1.665 (14,4%) Kontrollen. Der prozentuale Unterschied, die so genannte absolute Risikoreduktion, beträgt 10,1 %. Der SE dieser Differenz beträgt 0,99%. Dementsprechend beträgt das 95 %-KI 10,1 % + 1,96 x 0,99 %, d.h. von 8.2 bis 12.0.

Trotz unterschiedlicher philosophischer Ansätze sind CI und statistische Signifikanztests mathematisch eng verwandt.

Somit ist der P-Wert "signifikant", d.h. R<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

Die Unsicherheit (Unsicherheit) der Schätzung, ausgedrückt in CI, hängt weitgehend von der Quadratwurzel des Stichprobenumfangs ab. Kleine Stichproben liefern weniger Informationen als große Stichproben, und der CI ist in der kleineren Stichprobe entsprechend breiter. Ein Artikel zum Vergleich der Eigenschaften von drei Tests, die zur Diagnose einer Helicobacter-pylori-Infektion verwendet werden, berichtete beispielsweise über eine Sensitivität von 95,8% des Harnstoff-Atemtests (95% CI 75-100). Während die Zahl von 95,8% beeindruckend aussieht, bedeutet eine kleine Stichprobe von 24 erwachsenen Patienten mit I. pylori, dass diese Schätzung eine erhebliche Unsicherheit aufweist, wie das breite CI zeigt. Tatsächlich ist die Untergrenze von 75 % viel niedriger als die Schätzung von 95,8 %. Wenn die gleiche Sensitivität in einer Stichprobe von 240 Personen beobachtet wurde, wäre das 95 %-KI 92,5-98,0, was mehr Garantien dafür gibt, dass der Test hochempfindlich ist.

In randomisierten kontrollierten Studien (RCTs) sind nicht signifikante Ergebnisse (d. h. solche mit P > 0,05) besonders anfällig für Fehlinterpretationen. Der CI ist hier besonders nützlich, da er zeigt, wie konsistent die Ergebnisse mit dem klinisch vorteilhaften wahren Effekt sind. In einer RCT zum Vergleich von Naht- und Klammeranastomose am Dickdarm entwickelte sich beispielsweise bei 10,9 % bzw. 13,5 % der Patienten eine Wundinfektion (P = 0,30). Das 95-%-KI für diese Differenz beträgt 2,6% (-2 bis +8). Selbst in dieser Studie mit 652 Patienten bleibt die Wahrscheinlichkeit bestehen, dass es einen bescheidenen Unterschied in der Inzidenz von Infektionen aufgrund der beiden Verfahren gibt. Je weniger Recherche, desto größer die Unsicherheit. Sunget al. eine RCT durchgeführt, um Octreotid-Infusion versus Notfall-Sklerotherapie bei akuter Varizenblutung bei 100 Patienten zu vergleichen. In der Octreotid-Gruppe betrug die Blutstillungsrate 84 %; in der Sklerotherapie-Gruppe - 90%, was P = 0,56 ergibt. Beachten Sie, dass die Raten anhaltender Blutungen denen von Wundinfektionen in der erwähnten Studie ähnlich sind. In diesem Fall beträgt das 95 %-KI für die Interventionsdifferenz jedoch 6 % (-7 bis +19). Dieses Intervall ist im Vergleich zu den 5% Unterschied, die von klinischem Interesse wären, ziemlich groß. Es ist klar, dass die Studie einen signifikanten Unterschied in der Wirksamkeit nicht ausschließt. Daher ist die Schlussfolgerung der Autoren „Octreotid-Infusion und Sklerotherapie sind bei der Behandlung von Krampfadernblutungen gleichermaßen wirksam“ definitiv nicht gültig. In solchen Fällen, in denen das 95 %-KI für absolute Risikoreduktion (ARR) wie hier Null enthält, ist das KI für Number Needed to Treat (NNT) eher schwer zu interpretieren. ... Der NPLP und sein CI ergeben sich aus dem Kehrwert des ACP (bei Angabe in Prozent multipliziert mit 100). Hier erhalten wir BPHP = 100: 6 = 16,6 mit einem 95 %-KI von -14,3 bis 5,3. Wie Sie der Fußnote "d" in der Tabelle entnehmen können. A1.1, dieses CI beinhaltet die BPHP-Werte von 5,3 bis unendlich und die BPHP-Werte von 14,3 bis unendlich.

CIs können für die am häufigsten verwendeten statistischen Schätzungen oder Vergleiche erstellt werden. Für RCTs beinhaltet es die Differenz zwischen Mittelwertanteilen, relativen Risiken, Odds Ratios und NPP. In ähnlicher Weise können CIs für alle wichtigen Schätzungen in Studien zur Genauigkeit diagnostischer Tests erhalten werden – Sensitivität, Spezifität, Vorhersagewert eines positiven Ergebnisses (alles einfache Proportionen) und Wahrscheinlichkeitsverhältnisse – Schätzungen aus Metaanalysen und Vergleichs-mit-Kontroll-Studien. Ein Computerprogramm für PCs, das viele dieser ID-Anwendungen abdeckt, ist mit der zweiten Ausgabe von Statistics with Confidence erhältlich. Makros zur Berechnung des CI für Proportionen stehen kostenlos für Excel und die Statistikprogramme SPSS und Minitab unter http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/proportions, htm zur Verfügung.

Mehrfachbewertungen des Behandlungseffekts

CIs sind zwar für die primären Studienergebnisse wünschenswert, aber nicht für alle Ergebnisse erforderlich. Das CI beschäftigt sich mit klinisch relevanten Vergleichen. Wenn Sie beispielsweise zwei Gruppen vergleichen, ist das CI, das zur Unterscheidung zwischen den Gruppen erstellt wird, wie in den Beispielen oben gezeigt, korrekt und nicht das CI, das für die Bewertung in jeder Gruppe erstellt werden kann. Es ist nicht nur sinnlos, separate CIs für die Bewertungen in jeder Gruppe bereitzustellen, diese Darstellung kann auch irreführend sein. Ebenso besteht der richtige Ansatz beim Vergleich der Behandlungswirksamkeit in verschiedenen Untergruppen darin, zwei (oder mehr) Untergruppen direkt zu vergleichen. Es ist falsch anzunehmen, dass die Behandlung nur in einer Untergruppe wirksam ist, wenn ihr CI keine Wirkung ausschließt und andere nicht. CIs sind auch nützlich, wenn Sie Ergebnisse über mehrere Untergruppen hinweg vergleichen. In Abb. A 1.1 zeigt das relative Risiko einer Eklampsie bei Frauen mit Präeklampsie in einer Untergruppe von Frauen aus einer placebokontrollierten RCT mit Magnesiumsulfat.

Reis. A1.2. Das Walddiagramm zeigt die Ergebnisse von 11 randomisierten klinischen Studien mit Rinder-Rotavirus-Impfstoff zur Vorbeugung von Durchfall im Vergleich zu Placebo. Bei der Bewertung des relativen Durchfallrisikos wurde ein 95 %-Konfidenzintervall verwendet. Die Größe des schwarzen Quadrats ist proportional zur Informationsmenge. Darüber hinaus werden der kumulative Behandlungseffektivitätsscore und das 95 %-Konfidenzintervall (gekennzeichnet durch eine Raute) angezeigt. Bei der Metaanalyse wurde ein Modell mit zufälligen Effekten verwendet, das einige der zuvor festgelegten übertrifft; zum Beispiel könnte es die Größe sein, die bei der Berechnung der Stichprobengröße verwendet wird. Für ein strengeres Kriterium sollte der gesamte CI-Bereich einen Nutzen aufweisen, der über ein vorgegebenes Minimum hinausgeht.

Wir haben bereits den Fehler diskutiert, bei dem das Fehlen statistischer Signifikanz als Hinweis darauf angesehen wird, dass zwei Behandlungen gleich wirksam sind. Ebenso wichtig ist es, statistische Signifikanz nicht mit klinischer Signifikanz gleichzusetzen. Klinische Bedeutung kann abgeleitet werden, wenn das Ergebnis statistisch signifikant ist und das Ausmaß der Bewertung der Wirksamkeit der Behandlung

Die Forschung kann zeigen, ob die Ergebnisse statistisch signifikant sind und welche klinisch wichtig sind und welche nicht. In Abb. A1.2 zeigt die Ergebnisse von vier Tests, für die das gesamte CI<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

Konfidenzintervall für Erwartungswert - Dies ist ein aus den Daten berechnetes Intervall, das mit bekannter Wahrscheinlichkeit die mathematische Erwartung der Allgemeinbevölkerung enthält. Eine natürliche Schätzung für den mathematischen Erwartungswert ist das arithmetische Mittel seiner beobachteten Werte. Daher verwenden wir im weiteren Verlauf der Lektion die Begriffe "Durchschnitt", "Mittelwert". Bei den Aufgaben zur Berechnung des Konfidenzintervalls wird am häufigsten eine Antwort des Typs "Das Konfidenzintervall des Mittelwerts [der Wert in einem bestimmten Problem] reicht von [niedrigerer Wert] bis [höherer Wert]" benötigt. Mit Hilfe des Konfidenzintervalls ist es möglich, nicht nur die Durchschnittswerte, sondern auch das spezifische Gewicht eines bestimmten Merkmals der Allgemeinbevölkerung abzuschätzen. Die Mittelwerte, Varianz, Standardabweichung und Fehler, durch die wir zu neuen Definitionen und Formeln kommen, werden in der Lektion zerlegt Stichproben- und Populationsmerkmale .

Punkt- und Intervallschätzungen des Mittelwertes

Wird der Durchschnittswert der Allgemeinbevölkerung durch eine Zahl (Punkt) geschätzt, so wird die Schätzung des unbekannten Durchschnittswerts der Allgemeinbevölkerung als spezifischer Durchschnitt angenommen, der aus der Stichprobe der Beobachtungen berechnet wird. In diesem Fall stimmt der Wert des Stichprobenmittelwerts – eine Zufallsvariable – nicht mit dem Durchschnittswert der Allgemeinbevölkerung überein. Daher ist es bei der Angabe des Mittelwertes der Stichprobe erforderlich, gleichzeitig den Stichprobenfehler anzugeben. Als Maß für den Stichprobenfehler wird der Standardfehler verwendet, der in denselben Maßeinheiten wie der Mittelwert ausgedrückt wird. Daher wird häufig die folgende Notation verwendet:.

Wenn die Schätzung des Mittelwerts mit einer bestimmten Wahrscheinlichkeit verbunden sein soll, muss der für die allgemeine Bevölkerung interessierende Parameter nicht durch eine Zahl, sondern durch ein Intervall geschätzt werden. Das Konfidenzintervall ist das Intervall, in dem mit einer gewissen Wahrscheinlichkeit P der Wert des geschätzten Indikators der allgemeinen Bevölkerung wird gefunden. Konfidenzintervall, in dem die Wahrscheinlichkeit P = 1 - α es wird eine Zufallsvariable gefunden, die wie folgt berechnet wird:

,

α = 1 - P, die im Anhang fast jedes Statistikbuches zu finden ist.

In der Praxis sind Mittelwert und Varianz der Grundgesamtheit nicht bekannt, daher wird die Varianz der Grundgesamtheit durch die Varianz der Stichprobe und der Mittelwert der Grundgesamtheit durch den Mittelwert der Stichprobe ersetzt. Somit berechnet sich das Konfidenzintervall in den meisten Fällen wie folgt:

.

Die Konfidenzintervallformel kann verwendet werden, um den Mittelwert der Grundgesamtheit zu schätzen, wenn

  • die Standardabweichung der Grundgesamtheit ist bekannt;
  • oder die Standardabweichung der Grundgesamtheit ist nicht bekannt, aber die Stichprobengröße ist größer als 30.

Der Stichprobenmittelwert ist die unverzerrte Schätzung des Grundgesamtheitsmittelwerts. Die Stichprobenvarianz ist keine unverzerrte Schätzung der Populationsvarianz. Um eine unverzerrte Schätzung der Varianz der Allgemeinbevölkerung in der Stichprobenvarianzformel zu erhalten, muss der Stichprobenumfang n sollte ersetzt werden durch n-1.

Beispiel 1. Gesammelte Informationen von 100 zufällig ausgewählten Cafés in einer Stadt, dass die durchschnittliche Anzahl der Angestellten in ihnen 10,5 beträgt, mit einer Standardabweichung von 4,6. Bestimmen Sie das Konfidenzintervall von 95 % der Anzahl der Café-Mitarbeiter.

wo ist der kritische Wert der Standardnormalverteilung für das Signifikanzniveau α = 0,05 .

Somit lag das 95%-Konfidenzintervall für die durchschnittliche Anzahl der Café-Beschäftigten zwischen 9,6 und 11,4.

Beispiel 2. Für eine Zufallsstichprobe aus einer Allgemeinbevölkerung von 64 Beobachtungen wurden folgende Gesamtwerte berechnet:

die Summe der Werte in den Beobachtungen,

die Summe der Quadrate der Abweichung der Werte vom Mittelwert .

Berechnen Sie das 95 %-Konfidenzintervall für die Erwartung.

Berechnen Sie die Standardabweichung:

,

Berechnen Sie den Durchschnittswert:

.

Setzen Sie die Werte in den Ausdruck für das Konfidenzintervall ein:

wo ist der kritische Wert der Standardnormalverteilung für das Signifikanzniveau α = 0,05 .

Wir bekommen:

Somit reichte das 95 %-Konfidenzintervall für die mathematische Erwartung dieser Stichprobe von 7,484 bis 11,266.

Beispiel 3. Für eine Zufallsstichprobe aus einer Allgemeinbevölkerung von 100 Beobachtungen betrug der Mittelwert 15,2 und die Standardabweichung 3,2. Berechnen Sie das 95 %-Konfidenzintervall für die Erwartung, dann das 99 %-Konfidenzintervall. Wenn die Stichprobengröße und ihre Variation unverändert bleiben, aber der Konfidenzkoeffizient zunimmt, wird sich dann das Konfidenzintervall verengen oder erweitern?

Setzen Sie diese Werte in den Ausdruck für das Konfidenzintervall ein:

wo ist der kritische Wert der Standardnormalverteilung für das Signifikanzniveau α = 0,05 .

Wir bekommen:

.

Somit lag das 95 %-Konfidenzintervall für den Mittelwert dieser Stichprobe zwischen 14,57 und 15,82.

Wir setzen diese Werte noch einmal in den Ausdruck für das Konfidenzintervall ein:

wo ist der kritische Wert der Standardnormalverteilung für das Signifikanzniveau α = 0,01 .

Wir bekommen:

.

Somit reichte das 99 %-Konfidenzintervall für den Mittelwert dieser Stichprobe von 14,37 bis 16,02.

Wie Sie sehen, nimmt mit steigendem Konfidenzkoeffizienten auch der kritische Wert der Standardnormalverteilung zu, und daher liegen Start- und Endpunkt des Intervalls weiter vom Mittelwert und damit vom Konfidenzintervall für die mathematische Erwartung steigt.

Punkt- und Intervallschätzungen des spezifischen Gewichts

Das spezifische Gewicht eines Merkmals der Stichprobe kann als Punktschätzung des spezifischen Gewichts interpretiert werden P das gleiche Merkmal in der allgemeinen Bevölkerung. Wenn dieser Wert auf die Wahrscheinlichkeit bezogen werden muss, sollte das Konfidenzintervall des spezifischen Gewichts berechnet werden P Merkmal in der Allgemeinbevölkerung mit einer Wahrscheinlichkeit P = 1 - α :

.

Beispiel 4. In einer Stadt gibt es zwei Kandidaten EIN und B für den Bürgermeister kandidieren. 200 Einwohner der Stadt wurden nach dem Zufallsprinzip befragt, von denen 46% antworteten, dass sie für den Kandidaten stimmen würden EIN, 26% - für den Kandidaten B und 28% wissen nicht, wen sie wählen werden. Bestimmen Sie das 95 %-Konfidenzintervall für den Anteil der Stadtbewohner, die den Kandidaten unterstützen EIN.

Konstantin Krawchik erklärt anschaulich, was ein Konfidenzintervall in der medizinischen Forschung ist und wie man es verwendet.

Katren-Stil veröffentlicht weiterhin einen Zyklus von Konstantin Kravchik über medizinische Statistik. In den beiden vorangegangenen Artikeln hat sich der Autor mit der Erklärung von Begriffen wie und beschäftigt.

Konstantin Kravchik

Analytischer Mathematiker. Spezialist für statistische Forschung in Medizin und Geisteswissenschaften

Stadt Moskau

Sehr oft findet man in Artikeln über klinische Studien einen mysteriösen Ausdruck: "Konfidenzintervall" (95% CI oder 95% CI - Konfidenzintervall). Der Artikel könnte beispielsweise lauten: "Um die Signifikanz der Unterschiede zu beurteilen, wurde der Student-t-Test mit der Berechnung eines 95-%-Konfidenzintervalls verwendet."

Was ist der Wert des "95 % Konfidenzintervalls" und warum wird es berechnet?

Was ist ein Konfidenzintervall? - Dies ist der Bereich, in dem die wahren Mittelwerte in der Grundgesamtheit gefunden werden. Und was, es gibt "unwahre" Durchschnittswerte? In gewisser Weise ja, die gibt es. Wir erklärten, dass es unmöglich ist, den interessierenden Parameter über die gesamte Population hinweg zu messen, daher begnügen sich die Forscher mit einer begrenzten Stichprobe. In dieser Stichprobe (zum Beispiel nach Körpergewicht) gibt es einen Durchschnittswert (ein bestimmtes Gewicht), nach dem wir den Durchschnittswert in der gesamten Allgemeinbevölkerung beurteilen. Es ist jedoch unwahrscheinlich, dass das durchschnittliche Gewicht in der Stichprobe (besonders klein) mit dem durchschnittlichen Gewicht in der Allgemeinbevölkerung übereinstimmt. Daher ist es korrekter, den Bereich der Durchschnittswerte der allgemeinen Bevölkerung zu berechnen und zu verwenden.

Stellen Sie sich zum Beispiel vor, dass das 95 %-KI (95 %-KI) für Hämoglobin 110 bis 122 g / L beträgt. Dies bedeutet, dass der wahre durchschnittliche Hämoglobinwert in der Allgemeinbevölkerung mit einer Wahrscheinlichkeit von 95 % im Bereich von 110 bis 122 g / l liegt. Mit anderen Worten, wir kennen das durchschnittliche Hämoglobin in der Allgemeinbevölkerung nicht, können aber mit 95%iger Wahrscheinlichkeit den Wertebereich für dieses Merkmal angeben.

Das Konfidenzintervall ist besonders relevant für die Differenz der Mittelwerte zwischen den Gruppen, die sogenannte Effektstärke.

Nehmen wir an, wir vergleichen die Wirksamkeit zweier Eisenpräparate: eines seit langem auf dem Markt und eines, das gerade erst zugelassen wurde. Nach dem Therapieverlauf wurde die Hämoglobinkonzentration in den untersuchten Patientengruppen bewertet und das statistische Programm berechnete, dass die Differenz zwischen den Mittelwerten der beiden Gruppen mit einer Wahrscheinlichkeit von 95 % im Bereich von 1,72 bis 14,36 g liegt /l (Tabelle 1).

Tab. 1. Kriterium für unabhängige Stichproben
(Vergleich der Gruppen nach Hämoglobinspiegel)

Dies ist wie folgt zu interpretieren: Bei einigen Patienten der Allgemeinbevölkerung, die das neue Medikament einnehmen, wird das Hämoglobin im Durchschnitt um 1,72–14,36 g / l höher sein als bei denen, die das bereits bekannte Medikament einnahmen.

Mit anderen Worten, in der Allgemeinbevölkerung liegt der Unterschied der Mittelwerte für Hämoglobin in Gruppen mit einer Wahrscheinlichkeit von 95 % innerhalb dieser Grenzen. Ob das viel oder wenig ist, muss der Forscher beurteilen. Der Sinn von all dem ist, dass wir nicht mit einem Durchschnittswert arbeiten, sondern mit einer Reihe von Werten, daher schätzen wir die Parameterunterschiede zwischen den Gruppen zuverlässiger ab.

In Statistikpaketen können Sie nach Ermessen des Forschers die Grenzen des Konfidenzintervalls unabhängig voneinander eingrenzen oder erweitern. Durch Verringern der Wahrscheinlichkeit des Konfidenzintervalls schränken wir den Mittelwertbereich ein. Bei einem KI von 90 % ist der Mittelwertbereich (oder die Mittelwertdifferenz) beispielsweise enger als bei 95 %.

Umgekehrt erweitert eine Erhöhung der Wahrscheinlichkeit auf 99% den Wertebereich. Beim Vergleich von Gruppen kann die untere Grenze des CI die Nullmarke überschreiten. Wenn wir beispielsweise das Konfidenzintervall auf 99% erweitert haben, reichten die Grenzen des Intervalls von –1 bis 16 g / L. Dies bedeutet, dass es in der allgemeinen Bevölkerung Gruppen gibt, deren Mittelwertdifferenz nach dem untersuchten Attribut gleich 0 ist (M = 0).

Mithilfe des Konfidenzintervalls können Sie statistische Hypothesen testen. Wenn das Konfidenzintervall Null durchquert, ist die Nullhypothese korrekt, die davon ausgeht, dass sich die Gruppen in den untersuchten Parametern nicht unterscheiden. Ein Beispiel ist oben beschrieben, als wir die Grenzen auf 99% erweitert haben. Irgendwo in der Allgemeinbevölkerung fanden wir Gruppen, die sich in keiner Weise unterschieden.

95 % Konfidenzintervall der Differenz im Hämoglobin, (g / l)


Die Linie zeigt das 95 %-Konfidenzintervall für die Differenz des mittleren Hämoglobins zwischen den beiden Gruppen. Die Linie passiert die Nullmarke, daher besteht eine Differenz zwischen den Mittelwerten gleich Null, was die Nullhypothese bestätigt, dass sich die Gruppen nicht unterscheiden. Der Unterschied zwischen den Gruppen reicht von –2 bis 5 g / l, was bedeutet, dass Hämoglobin entweder um 2 g / l abnehmen oder um 5 g / l ansteigen kann.

Das Konfidenzintervall ist eine sehr wichtige Metrik. Dank ihm können Sie erkennen, ob die Unterschiede in den Gruppen wirklich auf den Unterschied der Mittelwerte oder auf eine große Stichprobe zurückzuführen sind, denn bei einer großen Stichprobe sind die Chancen, Unterschiede zu finden, größer als bei einer kleinen.

In der Praxis könnte das so aussehen. Wir nahmen eine Stichprobe von 1000 Personen, maßen den Hämoglobinspiegel und stellten fest, dass das Konfidenzintervall für die Differenz der Mittelwerte 1,2 bis 1,5 g / L betrug. Das statistische Signifikanzniveau in diesem Fall p

Wir sehen, dass die Konzentration von Hämoglobin anstieg, aber fast unmerklich, daher erschien die statistische Signifikanz genau aufgrund der Stichprobengröße.

Das Konfidenzintervall kann nicht nur für Mittelwerte, sondern auch für Anteile (und Risikoverhältnisse) berechnet werden. Uns interessiert beispielsweise das Konfidenzintervall der Anteile der Patienten, die während der Einnahme eines entwickelten Medikaments eine Remission erreicht haben. Nehmen wir an, dass das 95 %-KI für Anteile, also für den Anteil solcher Patienten, im Bereich von 0,60–0,80 liegt. Somit können wir sagen, dass unser Medikament in 60 bis 80% der Fälle eine therapeutische Wirkung hat.