Hlavní Jiný Analýza dat mezi událostmi

Analýza dat mezi událostmi

Přehled

Software

Popis

Webové stránky

Čtení

Kurzy

Přehled

Tato stránka stručně popisuje řadu otázek, které je třeba vzít v úvahu při analýze údajů čas od události, a poskytuje anotovaný seznam zdrojů, kde najdete další informace.

Popis

Co je jedinečné na datech z času na událost (TTE)?

Data Time-to-Event (TTE) jsou jedinečná, protože výsledkem zájmu je nejen to, zda k události došlo, či nikoli, ale také to, kdy k této události došlo. Tradiční metody logistické a lineární regrese nejsou vhodné k tomu, aby bylo možné do modelu zahrnout jak událost, tak čas. Tradiční regresní metody také nejsou vybaveny pro zpracování cenzury, což je speciální typ chybějících dat, ke kterému dochází při analýzách času na událost, když subjekty během doby sledování nezažijí událost zájmu. V přítomnosti cenzury je skutečný čas do události podceňován. Byly vyvinuty speciální techniky pro data TTE, které budou diskutovány níže, aby využívaly dílčí informace o každém subjektu s cenzurovanými daty a poskytovaly objektivní odhady přežití. Tyto techniky zahrnují data z různých časových bodů napříč subjekty a lze je použít k přímému výpočtu sazeb, časových poměrů a poměrů rizika.

Jaké jsou důležité metodologické úvahy týkající se údajů o čase do události?

Při analýze údajů o čase do přežití nebo přežití existují 4 hlavní metodologické úvahy. Je důležité mít jasnou definici cílové události, počátek času, časové měřítko a popsat, jak účastníci opustí studii. Jakmile budou dobře definovány, stane se analýza přímočařejší. Typicky existuje jedna cílová událost, ale existují rozšíření analýz přežití, která umožňují více událostí nebo opakovaných událostí.

Jaký je časový původ?

Počátek času je bod, ve kterém začíná doba sledování. Data TTE mohou využívat různé časové počátky, které jsou do značné míry určeny designem studie, z nichž každý má související výhody a nevýhody. Mezi příklady patří základní čas nebo základní věk. Počátky času lze také určit pomocí určující charakteristiky, jako je nástup expozice nebo diagnóza. Toto je často přirozená volba, pokud výsledek souvisí s touto charakteristikou. Mezi další příklady patří narození a kalendářní rok. U kohortních studií je časová stupnice nejčastěji dobou studia.

Existuje jiná možnost pro jiné časové období než doba studia?

Věk je další běžně používaná časová stupnice, kde základní věk je počátek času a jednotlivci opouštějí svou událost nebo věk cenzury. Modely s věkem jako časovou stupnicí lze upravit pro efekty kalendáře. Někteří autoři doporučují, aby se jako časová stupnice použil spíše věk než čas na studium, protože to může poskytnout méně zkreslené odhady.

Co je to cenzura?

Jednou z výzev specifických pro analýzu přežití je, že pouze někteří jedinci zažili událost do konce studie, a proto bude doba přežití pro podskupinu studované skupiny neznámá. Tento jev se nazývá cenzura a může vzniknout následujícími způsoby: účastník studie do konce studie ještě nezažil relevantní výsledek, jako je relaps nebo smrt; účastník studie je ztracen kvůli sledování během studijního období; nebo účastník studie zažije jinou událost, která znemožňuje další sledování. Takové cenzurované intervalové časy podceňují skutečný, ale neznámý čas do události. U většiny analytických přístupů se předpokládá, že cenzura je náhodná nebo neinformativní.

Existují tři hlavní typy cenzury, pravý, levý a intervalový. Pokud k událostem dojde po skončení studie, jsou data správně cenzurována. Data pozorovaná vlevo se vyskytují, když je událost pozorována, ale přesný čas události není znám. Intervalově cenzurovaná data nastávají, když je událost pozorována, ale účastníci přicházejí a odcházejí z pozorování, takže přesný čas události není znám. Většina analytických metod přežití je navržena pro pozorování s pravou cenzurou, ale jsou k dispozici metody pro intervalová a levostranná data.

Jaká je otázka zájmu?

Volba analytického nástroje by se měla řídit výzkumnou otázkou, která nás zajímá. S daty TTE může mít výzkumná otázka několik forem, které ovlivňují, která funkce přežití je pro výzkumnou otázku nejrelevantnější. Tři různé typy výzkumných otázek, které by mohly být zajímavé pro data TTE, zahrnují:

  1. Jaká část jednotlivců po určité době zůstane bez akce?

  2. Jaký podíl jednotlivců bude mít událost po určité době?

  3. Jaké je riziko události v určitém časovém okamžiku mezi těmi, kteří přežili do tohoto bodu?

Každá z těchto otázek odpovídá jinému typu funkce použité v analýze přežití:

  1. Funkce přežití, S (t): pravděpodobnost, že jedinec přežije po čase t [Pr (T> t)]

  2. Funkce hustoty pravděpodobnosti, F (t), nebo funkce kumulativní incidence, R (t): pravděpodobnost, že jedinec bude mít dobu přežití menší nebo rovnou t [Pr (T≤t)]

  3. Funkce nebezpečí, h (t): okamžitý potenciál prožívání události v čase t, podmíněný přežitím do té doby

  4. Kumulativní nebezpečná funkce, H (t): integrál nebezpečné funkce od času 0 do času t, který se rovná ploše pod křivkou h (t) mezi časem 0 a časem t

Pokud je jedna z těchto funkcí známa, lze ostatní funkce vypočítat pomocí následujících vzorců:

S (t) = 1 - F (t) Funkce přežití a funkce hustoty pravděpodobnosti se sečtou k 1

h (t) = f (t) / S (t) Okamžité nebezpečí se rovná bezpodmínečné pravděpodobnosti

zažívá událost v čase t, zmenšen zlomkem živého v čase t

H (t) = -log [S (t)] Funkce kumulativního rizika se rovná zápornému logaritmu přežití

funkce

S (t) = e –H (t) Funkce přežití se rovná exponenciálně negativnímu kumulativnímu riziku

funkce

Tyto převody se často používají v metodách analýzy přežití, jak bude popsáno níže. Obecně platí, že zvýšení h (t), okamžitého nebezpečí, povede ke zvýšení H (t), kumulativního rizika, které se promítne do snížení S (t), funkce přežití.

Jaké předpoklady je třeba učinit pro použití standardních technik pro data od času k události?

Hlavním předpokladem při analýze dat TTE je neinformativní cenzura: jedinci, kteří jsou cenzurováni, mají stejnou pravděpodobnost následné události jako jednotlivci, kteří zůstávají ve studii. Informativní cenzura je obdobou nezpochybnitelných chybějících údajů, což ovlivní analýzu. Neexistuje žádný definitivní způsob, jak otestovat, zda je cenzura neinformativní, ačkoli zkoumání vzorů cenzury může naznačovat, zda je předpoklad neinformativní cenzury přiměřený. Pokud existuje podezření na informativní cenzuru, je možné použít analýzy citlivosti, jako jsou scénáře v nejlepším a nejhorším případě, ke kvantifikaci účinku, který má informativní cenzura na analýzu.

Dalším předpokladem při analýze dat TTE je, že pro dostatečnou statistickou sílu existuje dostatečná doba sledování a počet událostí. To je třeba vzít v úvahu ve fázi návrhu studie, protože většina analýz přežití je založena na kohortních studiích.

Za zmínku stojí další zjednodušující předpoklady, které jsou často vytvářeny v přehledech analýzy přežití. I když tyto předpoklady zjednodušují modely přežití, není nutné provádět analýzy s údaji TTE. Lze použít pokročilé techniky, pokud jsou porušeny tyto předpoklady:

  • Žádný kohortový účinek na přežití: u kohorty s dlouhým náborovým obdobím předpokládejme, že jednotlivci, kteří se připojí brzy, mají stejnou pravděpodobnost přežití jako ti, kteří se připojí pozdě

  • Správná cenzura pouze v datech

  • Události jsou na sobě nezávislé

Jaké typy přístupů lze použít pro analýzu přežití?

Existují tři hlavní přístupy k analýze dat TTE: neparametrické, semiparametrické a parametrické přístupy. Výběr, který přístup použít, by měl být řízen výzkumnou otázkou, která nás zajímá. Ve stejné analýze lze často vhodně použít více než jeden přístup.

Jaké jsou neparametrické přístupy k analýze přežití a kdy jsou vhodné?

Neparametrické přístupy se nespoléhají na předpoklady o tvaru nebo formě parametrů v základní populaci. V analýze přežití se k popisu dat používají neparametrické přístupy odhadem funkce přežití, S (t), spolu s mediánem a kvartily doby přežití. Tyto popisné statistiky nelze vypočítat přímo z údajů v důsledku cenzury, která podceňuje skutečnou dobu přežití u cenzurovaných subjektů, což vede ke zkresleným odhadům průměru, mediánu a dalších popisů. Neparametrické přístupy se často používají jako první krok v analýze ke generování nestranné popisné statistiky a často se používají ve spojení s poloparametrickými nebo parametrickými přístupy.

Kaplan-Meierův odhad

Nejběžnějším neparametrickým přístupem v literatuře je Kaplan-Meierův (nebo produktový limit) odhad. Kaplan-Meierův odhad pracuje tak, že rozděluje odhad S (t) do řady kroků / intervalů na základě pozorovaných časů událostí. Pozorování přispívají k odhadu S (t), dokud nedojde k události, nebo dokud nebudou cenzurovány. Pro každý interval se počítá pravděpodobnost přežití až do konce intervalu, vzhledem k tomu, že subjekty jsou na začátku intervalu ohroženy (obvykle se to označuje jako pj = (nj - dj) / nj). Odhadovaná S (t) pro každou hodnotu t se rovná součinu přežití každého intervalu až do času t včetně. Hlavními předpoklady této metody, kromě neinformativní cenzury, je to, že k cenzuře dochází po selhání a že neexistuje žádný kohortní účinek na přežití, takže subjekty mají stejnou pravděpodobnost přežití bez ohledu na to, kdy byly studovány.

Odhadovaný S (t) z Kaplan-Meierovy metody lze vynést jako krokovou funkci s časem na ose X. Tento graf je pěkným způsobem, jak vizualizovat zážitek přežití kohorty, a lze jej také použít k odhadu mediánu (když S (t) ≤0,5) nebo kvartilů doby přežití. Tyto popisné statistiky lze také vypočítat přímo pomocí Kaplan-Meierova odhadu. 95% intervaly spolehlivosti (CI) pro S (t) se spoléhají na transformace S (t), aby zajistily, že 95% CI je v rozmezí 0 a 1. Nejběžnější metodou v literatuře je odhad Greenwood.

Odhad životních tabulek

Odhad tabulky přežití funkce přežití je jedním z prvních příkladů použitých statistických metod, které se používají k popisu úmrtnosti u velkých populací již více než 100 let. Odhad tabulky životnosti je podobný metodě Kaplan-Meier, kromě toho, že intervaly jsou založeny na kalendářním čase namísto pozorovaných událostí. Vzhledem k tomu, že metody životních tabulek jsou založeny na těchto kalendářních intervalech a nikoli na jednotlivých událostech / časech cenzury, používají tyto metody k odhadu S (t) průměrnou velikost množiny rizik na interval a musí předpokládat, že k cenzuře došlo rovnoměrně v celém časovém intervalu. Z tohoto důvodu není odhad tabulky životnosti tak přesný jako odhad Kaplan-Meier, ale výsledky budou u velmi velkých vzorků podobné.

Nelson-Aalen Estimator

Další alternativou k Kaplan-Meierovi je Nelson-Aalenův odhad, který je založen na použití přístupu procesu počítání k odhadu kumulativní funkce rizika, H (t). Odhad H (t) lze poté použít k odhadu S (t). Odhady S (t) odvozené pomocí této metody budou vždy větší než odhad K-M, ale rozdíl bude mezi malými metodami ve velkých vzorcích malý.

Lze použít neparametrické přístupy pro analýzy s jednou nebo více proměnnými?

Neparametrické přístupy, jako je Kaplan-Meierův odhad, lze použít k provedení neměnných analýz kategoriálních zajímavých faktorů. Faktory musí být kategorické (buď v přírodě, nebo spojitá proměnná rozdělená do kategorií), protože funkce přežití, S (t), je odhadována pro každou úroveň kategorické proměnné a poté porovnávána napříč těmito skupinami. Odhadované S (t) pro každou skupinu lze vykreslit a vizuálně porovnat.

K statistickému testování rozdílu mezi křivkami přežití lze také použít testy založené na hodnocení. Tyto testy porovnávají pozorovaný a očekávaný počet událostí v každém časovém bodě napříč skupinami za nulové hypotézy, že funkce přežití jsou napříč skupinami stejné. Existuje několik verzí těchto testů založených na hodnostech, které se liší ve váze dané každému časovému bodu při výpočtu statistiky testu. Dva z nejběžnějších testů založených na hodnocení v literatuře jsou log rank test, který dává každému časovému bodu stejnou váhu, a Wilcoxonův test, který váží každý časový bod počtem rizikových subjektů. Na základě této hmotnosti je Wilcoxonův test citlivější na rozdíly mezi křivkami na začátku sledování, kdy je ohroženo více subjektů. Jiné testy, například test Peto-Prentice, používají váhy mezi těmi, které mají log rank a Wilcoxonovy testy. Testy založené na hodnostech podléhají dalšímu předpokladu, že cenzura je nezávislá na skupině, a všechny jsou omezeny malou schopností detekovat rozdíly mezi skupinami, když se křivky přežití protínají. Ačkoli tyto testy poskytují p-hodnotu rozdílu mezi křivkami, nelze je použít k odhadu velikostí efektů (p-hodnota testu log rank je však ekvivalentní p-hodnotě pro kategorický zajímavý faktor u neměnného Coxe Modelka).

Neparametrické modely jsou omezené v tom, že neposkytují odhady efektů a nelze je obecně použít k posouzení účinku více zajímavých faktorů (modely s více proměnnými). Z tohoto důvodu se neparametrické přístupy často používají ve spojení s semiparametrickými nebo plně parametrickými modely v epidemiologii, kde se pro kontrolu zmatků obvykle používají modely s více proměnnými.

Lze upravit křivky Kaplan-Meier?

Je běžným mýtem, že Kaplan-Meierovy křivky nelze upravit, a to se často uvádí jako důvod k použití parametrického modelu, který může generovat kovariančně upravené křivky přežití. Byla však vyvinuta metoda pro vytvoření upravených křivek přežití pomocí inverzní pravděpodobnostní váhy (IPW). V případě pouze jedné proměnné lze IPW neparametricky odhadnout a jsou ekvivalentní přímé standardizaci křivek přežití pro studovanou populaci. V případě více kovariancí je nutné pro odhad vah použít semi- nebo plně parametrické modely, které se pak použijí k vytvoření vícebarevně upravených křivek přežití. Výhodou této metody je, že nepodléhá předpokladu proporcionálních rizik, lze ji použít pro časově proměnné proměnné a lze ji také použít pro spojité proměnné.

Proč potřebujeme parametrické přístupy k analýze časových údajů?

Neparametrický přístup k analýze dat TTE se používá ke snadnému popisu údajů o přežití s ​​ohledem na vyšetřovaný faktor. Modely využívající tento přístup se také označují jako neměnné modely. Častěji se vyšetřovatelé zajímají o vztah mezi několika kovariátami a čas do události. Použití poloparametrických a plně parametrických modelů umožňuje analyzovat čas události s ohledem na mnoho faktorů současně a poskytuje odhady síly účinku pro každý základní faktor.

Co je semiparametrický přístup a proč se tak běžně používá?

škola dalšího studia

Coxův proporcionální model je nejčastěji používaným přístupem s více proměnnými pro analýzu údajů o přežití v lékařském výzkumu. Jedná se v zásadě o regresní model čas-událost, který popisuje vztah mezi výskytem události, vyjádřený funkcí nebezpečí, a souborem proměnných. Model Cox je napsán následovně:

nebezpečná funkce, h (t) = h0 (t) exp {β1X1 + β2X2 +… + βpXp}

Je považován za semiparametrický přístup, protože model obsahuje neparametrickou součást a parametrickou součást. Neparametrická složka je základní riziko, h0 (t). Toto je hodnota rizika, když jsou všechny kovariáty rovny 0, což zdůrazňuje význam centrování kovariací v modelu pro interpretovatelnost. Nezaměňujte základní riziko za nebezpečí v čase 0. Funkce výchozího rizika se odhaduje neparametricky, a tak se na rozdíl od většiny ostatních statistických modelů nepředpokládá, že doba přežití bude odpovídat konkrétnímu statistickému rozdělení a tvaru výchozího stavu nebezpečí je libovolné. Funkci výchozího rizika není nutné odhadovat, aby bylo možné odvodit relativní nebezpečí nebo poměr rizik. Díky této vlastnosti je Coxův model robustnější než parametrické přístupy, protože není náchylný k chybné specifikaci základního nebezpečí.

Parametrická složka se skládá z kovariančního vektoru. Kovariátový vektor znásobuje základní riziko o stejnou částku bez ohledu na čas, takže účinek jakékoli kovariáty je kdykoli během sledování stejný, a to je základem pro předpoklad proporcionálního rizika.

Jaký je předpoklad proporcionálního rizika?

Předpoklad proporcionálních rizik je zásadní pro použití a interpretaci Coxova modelu.

Za tohoto předpokladu existuje konstantní vztah mezi výsledkem nebo závislou proměnnou a kovariančním vektorem. Důsledky tohoto předpokladu jsou, že funkce nebezpečnosti pro kterékoli dva jednotlivce jsou v jakémkoli okamžiku úměrné a poměr rizik se časem nemění. Jinými slovy, pokud má jedinec riziko úmrtí v určitém počátečním časovém bodě, který je dvakrát vyšší než u jiného jedince, pak ve všech pozdějších časových bodech zůstává riziko úmrtí dvakrát tak vysoké. Tento předpoklad znamená, že křivky nebezpečí pro skupiny by měly být proporcionální a neměly by se křížit. Protože tento předpoklad je tak důležitý, měl by být určitě otestován.

Jak testujete předpoklad proporcionálních rizik?

Existuje řada technik, jak grafických, tak testových, pro posouzení platnosti předpokladu proporcionálního rizika. Jednou z technik je jednoduše vykreslit Kaplan – Meierovy křivky přežití, pokud porovnáváte dvě skupiny bez kovariát. Pokud se křivky protnou, může dojít k porušení předpokladu proporcionálních rizik. U malých studií je třeba mít na paměti důležitou výhradu k tomuto přístupu. S odhady křivek přežití u studií s malou velikostí vzorku může být spojeno velké množství chyb, proto se křivky mohou protínat, i když je splněn předpoklad proporcionálního rizika. Doplňkový log-log graf je robustnější test, který vykreslí logaritmus záporného logaritmu odhadované funkce přeživší proti logaritmu doby přežití. Pokud jsou rizika úměrná napříč skupinami, získá tento graf paralelní křivky. Další běžnou metodou pro testování předpokladu proporcionálních rizik je zahrnutí termínu časové interakce k určení, zda se HR mění v čase, protože čas je často viníkem neproporcionality rizik. Důkaz, že termín časové interakce skupiny * není nula, je důkazem proti proporcionálním rizikům.

Co když předpoklad proporcionálních rizik neplatí?

Pokud zjistíte, že předpoklad PH neplatí, nemusíte nutně upustit od používání Coxova modelu. V modelu existují možnosti pro zlepšení nepřiměřenosti. Například můžete do modelu zahrnout další proměnné, buď nové proměnné, nelineární výrazy pro existující proměnné, nebo interakce mezi proměnnými. Nebo můžete stratifikovat analýzu na jedné nebo více proměnných. To odhaduje model, ve kterém je povoleno lišit se základní riziko v každé vrstvě, ale účinky proměnných jsou ve všech vrstvách stejné. Mezi další možnosti patří rozdělení času do kategorií a použití proměnných indikátorů, které umožňují měnit poměry rizik v čase, a změna proměnné času analýzy (např. Od uplynulého času do věku nebo naopak).

Jak zkoumáte poloparametrický model?

Kromě kontroly porušení předpokladu proporcionality je třeba prozkoumat i další aspekty přizpůsobení modelu. Statistiky podobné těm, které se používají v lineární a logistické regrese, lze použít k provedení těchto úkolů u modelů Cox s určitými rozdíly, ale základní myšlenky jsou ve všech třech nastaveních stejné. Je důležité zkontrolovat linearitu kovariančního vektoru, což lze provést zkoumáním reziduí, stejně jako v případě lineární regrese. Rezidua v datech TTE však nejsou tak přímočará jako v lineární regresi, částečně proto, že u některých dat není známa hodnota výsledku a rezidua jsou často zkreslená. Pro posouzení Coxova modelu vhodného pro data TTE bylo vyvinuto několik různých typů reziduí. Mezi příklady patří mimo jiné Martingale a Schoenfeld. Můžete se také podívat na zbytky a identifikovat velmi vlivná a špatně vhodná pozorování. Existují také testy shody, které jsou specifické pro modely Cox, jako je test Gronnesby a Borgan a prognostický index Hosmer a Lemeshow. Můžete také použít AIC k porovnání různých modelů, i když použití R2 je problematické.

Proč používat parametrický přístup?

Jednou z hlavních výhod semiparametrických modelů je, že není nutné specifikovat základní riziko, aby bylo možné odhadnout poměry rizik, které popisují rozdíly v relativním nebezpečí mezi skupinami. Může se však stát, že je zajímavý odhad samotného základního nebezpečí. V tomto případě je nutný parametrický přístup. V parametrických přístupech jsou specifikovány jak riziková funkce, tak účinek kovariát. Funkce rizika se odhaduje na základě předpokládaného rozdělení v základní populaci.

Výhody použití parametrického přístupu k analýze přežití jsou:

  • Parametrické přístupy jsou více informativní než neparametrické a semi-parametrické přístupy. Kromě výpočtu odhadů relativních účinků je lze také použít k předpovědi doby přežití, míry rizika a střední a střední doby přežití. Mohou být také použity k předpovědi absolutního rizika v čase a k vykreslení křivek přežití přizpůsobených kovariátům.

  • Pokud je parametrický formulář správně zadán, mají parametrické modely větší výkon než semi-parametrické modely. Jsou také efektivnější, což vede k menším standardním chybám a přesnějším odhadům.

  • Parametrické přístupy se spoléhají na maximální pravděpodobnost odhadu parametrů.

  • Zbytky parametrických modelů mají podobu rozdílu mezi pozorovanými a očekávanými.

Hlavní nevýhodou použití parametrického přístupu je to, že se opírá o předpoklad, že bylo správně specifikováno základní rozdělení populace. Parametrické modely nejsou robustní podle specifikací, a proto jsou semi-parametrické modely v literatuře běžnější a jejich použití je méně riskantní, pokud existuje nejistota ohledně základního rozdělení populace.

Jak si vyberete parametrický formulář?

Volba vhodné parametrické formy je nejobtížnější částí parametrické analýzy přežití. Specifikace parametrické formy by měla být řízena hypotézou studie, spolu s předchozími znalostmi a biologickou věrohodností tvaru základního nebezpečí. Například pokud je známo, že riziko úmrtí dramaticky stoupá hned po operaci a poté klesá a vyrovnává, nebylo by vhodné specifikovat exponenciální rozdělení, které v průběhu času předpokládá stálé nebezpečí. Data lze použít k posouzení, zda se zdá, že se zadaná forma hodí k datům, ale tyto metody založené na datech by měly doplňovat, nikoli nahrazovat, výběry založené na hypotéze.

Jaký je rozdíl mezi modelem proporcionálního rizika a modelem zrychleného času selhání?

Ačkoli je Coxův model proporcionálních rizik semi-parametrický, modely proporcionálních rizik mohou být také parametrické. Modely parametrických proporcionálních rizik lze zapsat jako:

h (t, X) = h0 (t) exp (Xi β) = h0 (t) λ

kde základní riziko, h0 (t), závisí pouze na čase, t, ale ne na X, a λ je jednotková specifická funkce proměnných, která nezávisí na t, která mění základní rizikovou funkci nahoru nebo dolů. λ nemůže být záporné. V tomto modelu je míra rizika multiplikativní funkcí základního rizika a poměry rizika lze interpretovat stejným způsobem jako v semiparametrickém modelu proporcionálních rizik.

Modely AFT (Accelerated Failure Time) jsou třídou parametrických modelů přežití, které lze linearizovat převzetím přirozeného protokolu modelu doby přežití. Nejjednodušším příkladem modelu AFT je exponenciální model, který je zapsán jako:

ln (T) = β0 + β1X1 +…. + βpXp + ε *

Hlavní rozdíl mezi modely AFT a modely PH spočívá v tom, že modely AFT předpokládají, že účinky kovariátů jsou v časovém měřítku multiplikativní, zatímco modely Cox používají stupnici nebezpečnosti, jak je uvedeno výše. Odhady parametrů z modelů AFT jsou interpretovány jako účinky na časovou stupnici, která může buď zrychlit nebo zpomalit dobu přežití. Exp (β)> 1 z modelu AFT znamená, že faktor zrychluje dobu přežití nebo vede k delšímu přežití. Exp (β)<1 decelerates survival time (shorter survival). AFT models assume that estimated time ratios are constant across the time scale. A time ratio of 2, for example, can be interpreted as the median time to death in group 1 is double the median time to death in group 2 (indicated longer survival for group 1).

Některá rozdělení chyb lze zapsat a interpretovat jako modely PH i AFT (tj. Exponenciální, Weibull), jiné jsou pouze modely PH (tj. Gompertz) nebo pouze modely AFT (tj. Log-logistické) a jiné nejsou ani modely PH, ani AFT (tj. vložení spline).

Jaké formy mohou mít parametrické modely?

Funkce nebezpečí může mít jakoukoli formu, pokud h (t)> 0 pro všechny hodnoty t. Zatímco primárním hlediskem pro parametrickou formu by měla být předchozí znalost tvaru základního nebezpečí, každá distribuce má své vlastní výhody a nevýhody. Některé z běžnějších formulářů budou stručně vysvětleny a další informace budou k dispozici v seznamu zdrojů.

Exponenciální rozdělení

Exponenciální rozdělení předpokládá, že h (t) závisí pouze na modelových koeficientech a proměnných a je konstantní v čase. Hlavní výhodou tohoto modelu je, že se jedná jak o model proporcionálních rizik, tak o model zrychlené doby selhání, takže odhady efektů lze interpretovat buď jako poměry rizik, nebo jako časové poměry. Hlavní nevýhodou tohoto modelu je, že je často nepravděpodobné předpokládat v průběhu času neustálé nebezpečí.

Weibullova distribuce

Weibullova distribuce je podobná exponenciální distribuci. Zatímco exponenciální rozdělení předpokládá konstantní nebezpečí, Weibullovo rozdělení předpokládá monotónní nebezpečí, které může být buď rostoucí nebo klesající, ale ne obojí. Má dva parametry. Parametr tvaru (σ) určuje, zda se nebezpečí zvyšuje (σ1) (v exponenciálním rozdělení je tento parametr nastaven na 1). Parametr měřítka, (1 / σ) exp (-β0 / σ), určuje měřítko tohoto zvýšení / snížení. Protože Weibullova distribuce se zjednodušuje na exponenciální distribuci, když σ = 1, nulovou hypotézu, že σ = 1 lze testovat pomocí Waldova testu. Hlavní výhodou tohoto modelu je, že se jedná o model PH i AFT, takže lze odhadnout poměry rizika i časové poměry. Hlavní nevýhodou je opět to, že předpoklad monotónnosti základního rizika může být v některých případech nepravděpodobný.

Gompertz distribuce

Distribuce Gompertz je model PH, který se rovná distribuci log-Weibull, takže log funkce nebezpečí je lineární t. Toto rozdělení má exponenciálně rostoucí poruchovost a je často vhodné pro pojistně-matematické údaje, protože riziko úmrtnosti se také časem exponenciálně zvyšuje.

Log-logistická distribuce

Log-logistická distribuce je model AFT s chybovým výrazem, který následuje po standardní logistické distribuci. Může se hodit na nemonotonická rizika a obecně se hodí nejlépe, když podkladové riziko vystoupá na vrchol a poté spadne, což může být pravděpodobné u určitých onemocnění, jako je tuberkulóza. Log-logistická distribuce není model PH, ale je to model proporcionálních šancí. To znamená, že podléhá předpokladu proporcionálních šancí, ale výhodou je, že sklonové koeficienty lze interpretovat jako časové poměry a také jako poměry šancí. Například poměr šancí 2 z parametrického logaritmického modelu by byl interpretován jako šance na přežití po čase t u subjektů s x = 1 je dvakrát vyšší než u subjektů s x = 0.

Zobecněná distribuce gama (GG)

Zobecněná distribuce gama (GG) je ve skutečnosti rodina distribucí, která obsahuje téměř všechny nejčastěji používané distribuce, včetně exponenciální, Weibullovy, normální logaritmické a gama distribuce. To umožňuje srovnání mezi různými distribucemi. Rodina GG také zahrnuje všechny čtyři nejběžnější typy nebezpečných funkcí, což činí distribuci GG obzvláště užitečnou, protože tvar nebezpečné funkce může pomoci optimalizovat výběr modelu.

Přístup Splines

Jelikož jediným obecným omezením specifikace funkce základního nebezpečí je to (t)> 0 pro všechny hodnoty t, lze použít splajny pro maximální flexibilitu při modelování tvaru základního nebezpečí. Omezené kubické splajny jsou jednou z metod, která byla nedávno doporučena v literatuře pro parametrickou analýzu přežití, protože tato metoda umožňuje flexibilitu tvaru, ale omezuje lineární funkci na koncích, kde jsou data řídká. Křivky spline lze použít ke zlepšení odhadu a jsou také výhodné pro extrapolaci, protože maximalizují přizpůsobení pozorovaným datům. Pokud je správně zadán, odhady efektů z modelů přizpůsobených pomocí splajnů by neměly být zkreslené. Stejně jako v jiných regresních analýzách mohou výzvy při montáži splajnů zahrnovat výběr počtu a umístění uzlů a problémy s nadměrným spojováním.

Jak zkoumáte přizpůsobení parametrického modelu?

Nejdůležitější složkou posouzení shody parametrického modelu je zkontrolovat, zda data podporují zadaný parametrický formulář. To lze vizuálně posoudit pomocí grafu kumulativního rizika založeného na modelu proti odhadované funkci kumulativního rizika Kaplan-Meier. Pokud je zadaný formulář správný, měl by graf projít počátkem se sklonem 1. Test dobré shody Grønnesby-Borgan lze také použít k tomu, zda se pozorovaný počet událostí významně liší od očekávaného počtu událostí ve skupinách odlišených skóre rizika. Tento test je vysoce citlivý na počet vybraných skupin a má tendenci příliš liberálně odmítat nulovou hypotézu adekvátního přizpůsobení, pokud je vybráno mnoho skupin, zejména v malých souborech dat. Testu chybí síla k detekci porušení modelu, pokud je však vybráno příliš málo skupin. Z tohoto důvodu se zdá být nedoporučené spoléhat se při určování, zda je zadaný parametrický tvar přiměřený, pouze na testu shody.

AIC lze také použít k porovnání modelů spuštěných s různými parametrickými formami, přičemž nejnižší AIC naznačuje nejlepší přizpůsobení. AIC nelze použít k porovnání parametrických a semi-parametrických modelů, protože parametrické modely jsou založeny na pozorovaných časech událostí a semi-parametrické modely jsou založeny na pořadí časů událostí. Tyto nástroje by se měly znovu použít k prozkoumání, zda se zadaný formulář hodí k datům, ale věrohodnost specifikovaného podkladového nebezpečí je stále nejdůležitějším aspektem výběru parametrického formuláře.

Jakmile je určeno, že zadaný parametrický formulář vyhovuje datům, lze pro výběr mezi různými modely použít podobné metody, jaké byly dříve popsány pro modely proporcionálních rizik, jako jsou zbytkové grafy a testy shody.

Co když se prediktory v průběhu času mění?

Ve výše uvedených modelových prohlášeních jsme předpokládali, že expozice jsou v průběhu sledování konstantní. Expozice s hodnotami, které se časem mění, nebo časově proměnné kovariáty, lze zahrnout do modelů přežití změnou jednotky analýzy z jednotlivce na časové období, kdy je expozice konstantní. Tím se rozděluje čas osob na jednotlivce do intervalů, které každá osoba přispívá k rizikovému souboru exponovaných a neexponovaných pro tuto proměnnou. Hlavním předpokladem zahrnutí časově proměnné proměnné tímto způsobem je, že účinek časově proměnné proměnné nezávisí na čase.

Pro Coxův model proporcionálního rizika by zahrnutí časově proměnné proměnné mělo formu: h (t) = h0 (t) e ^ β1x1 (t). V parametrických modelech lze také zahrnout časově proměnné kovariáty, i když je to trochu komplikovanější a obtížněji interpretovatelné. Parametrické modely mohou také modelovat časově proměnné proměnné pomocí splajnů pro větší flexibilitu.

Obecně by se měly používat časově proměnné kovariáty, pokud se předpokládá, že riziko závisí více na pozdějších hodnotách kovariátu než na hodnotě kovariátu na počátku. Výzvy, které vyvstávají s časově proměnnými proměnnými, jsou chybějící údaje o proměnných v různých časových bodech a potenciální zkreslení v odhadu rizika, pokud je časově proměnná proměnná ve skutečnosti mediátorem.

Co je analýza konkurenčních rizik?

Tradiční metody analýzy přežití předpokládají, že dojde pouze k jednomu druhu zajímavé události. Existují však pokročilejší metody umožňující vyšetřování několika typů událostí ve stejné studii, jako je úmrtí z více příčin. Pro tyto studie, ve kterých je doba přežití ukončena první z několika událostí, se používá analýza konkurenčních rizik. Jsou nutné speciální metody, protože lze zkreslit analýzu času pro každou událost zvlášť. Konkrétně v této souvislosti má metoda KM tendenci nadhodnocovat podíl subjektů zažívajících události. Analýza konkurenčních rizik využívá metodu kumulativní incidence, ve které je celková pravděpodobnost události kdykoli součtem pravděpodobností specifických pro událost. Modely jsou obecně implementovány zadáním každého účastníka studie několikrát - jeden pro každý typ události. U každého účastníka studie je čas do jakékoli události cenzurován v době, kdy pacient zažil první událost. Další informace najdete na stránce advancedepidemiology.org na konkurenční rizika .

Co jsou křehké modely a proč jsou užitečné pro korelovaná data?

Korelovaná data o přežití mohou vzniknout v důsledku opakujících se událostí, které zažívá jedinec, nebo když jsou pozorování seskupena do skupin. Z důvodu nedostatku znalostí nebo proveditelnosti nemusí být některé kovariáty související se zajímavou událostí měřeny. Křehké modely vysvětlují heterogenitu způsobenou neměřenými kovariátami přidáním náhodných efektů, které multiplikativně působí na funkci nebezpečí. Křehké modely jsou v podstatě rozšíření Coxova modelu s přidáním náhodných efektů. I když se k popisu těchto modelů používají různá klasifikační schémata a názvosloví, čtyři běžné typy křehkých modelů zahrnují sdílenou, vnořenou, společnou a aditivní křehkost.

Existují jiné přístupy k analýze dat opakujících se událostí?

Data rekurentních událostí jsou korelována, protože u stejného subjektu může dojít k více událostem. Zatímco modely křehkosti jsou jednou z metod, které zohledňují tuto korelaci v analýzách opakujících se událostí, jednodušším přístupem, který může také vysvětlit tuto korelaci, je použití robustních standardních chyb (SE). S přidáním robustních SE lze provádět analýzu rekurentních událostí jako jednoduché rozšíření semiparametrických nebo parametrických modelů.

I když je jednoduchá implementace, existuje několik způsobů, jak modelovat data opakovaných událostí pomocí robustních SE. Tyto přístupy se liší v tom, jak definují sadu rizik pro každou recidivu. Tímto způsobem odpovídají na mírně odlišné studijní otázky, takže výběr toho, který přístup k modelování se má použít, by měl být založen na studijní hypotéze a platnosti modelových předpokladů.

Proces počítání neboli Andersen-Gillův přístup k modelování opakujících se událostí předpokládá, že každá opakování je nezávislá událost a nebere v úvahu pořadí ani typ události. V tomto modelu začíná doba sledování každého subjektu na začátku studie a je rozdělena na segmenty definované událostmi (opakováními). Subjekty přispívají k riziku stanovenému pro událost, pokud jsou v té době pod dohledem (ne cenzurovány). Tyto modely lze snadno nasadit jako Coxův model s přidáním robustního odhadu SE a poměry rizik se interpretují jako účinek kovariátu na míru recidivy během období sledování. Tento model by však byl nevhodný, pokud předpoklad nezávislosti není přiměřený.

Podmíněné přístupy předpokládají, že subjekt není vystaven riziku následné události, dokud nedojde k předchozí události, a proto berou v úvahu pořadí událostí. Jsou vhodné pomocí stratifikovaného modelu s číslem události (nebo v tomto případě s počtem opakování) jako variabilní vrstvy a zahrnující robustní SE. Existují dva různé podmíněné přístupy, které používají různé časové škály, a proto mají různé sady rizik. Přístup podmíněné pravděpodobnosti používá k definování časových intervalů čas od začátku studie a je vhodný, pokud je zájem v plném průběhu procesu opakujících se událostí. Přístup s časovou prodlevou v zásadě resetuje hodiny pro každou recidivu pomocí času od předchozí události k definování časových intervalů a je vhodnější, když jsou zajímavé odhady účinků specifické pro událost (nebo opakování).

A konečně, marginální přístupy (také známé jako WLW - Wei, Lin a Weissfeld - přístup) považují každou událost za samostatný proces, takže subjekty jsou vystaveny riziku všech událostí od začátku sledování, bez ohledu na to, zda zažily předchozí událost. Tento model je vhodný, když se předpokládá, že události jsou výsledkem různých podkladových procesů, aby subjekt mohl zažít například 3. událost, aniž by zažil první. Ačkoli se tento předpoklad jeví jako nepravděpodobný u některých typů dat, jako jsou recidivy rakoviny, lze jej použít k modelování recidiv poranění v určitém časovém období, kdy se u subjektů mohou v daném časovém období vyskytnout různé typy poranění, které nemají přirozený řád. Okrajové modely lze také přizpůsobit pomocí stratifikovaných modelů s robustními SE.

Čtení

Cílem tohoto projektu bylo popsat metodická a analytická rozhodnutí, kterým může člověk při práci s údaji o čase dojít, ale není v žádném případě vyčerpávající. Níže jsou uvedeny zdroje, které se těmto tématům věnují hlouběji.

Učebnice a kapitoly

Vittinghoff E, Glidden DV, Shiboski SC, McCulloch CE (2012). Regresní metody v biostatistice, 2. New York, NY: Springer.

  • Úvodní text k lineárním, logistickým modelům, modelům přežití a modelům opakovaných opatření, nejlepší pro ty, kteří chtějí základní výchozí bod.

  • Kapitola Analýza přežití poskytuje dobrý přehled, ale ne hloubku. Příklady jsou založené na STATA.

Hosmer DW, Lemeshow S, May S. (2008) Applied Survival Analysis: Regression Modeling of Time-to-Event Data, 2. vyd. Hoboken, NJ: John Wiley & Sons, Inc.

  • Podrobný přehled neparametrických, semiparametrických a parametrických Coxových modelů, nejlepší pro ty, kteří mají znalosti v jiných oblastech statistiky. Pokročilé techniky nejsou podrobně popsány, ale jsou uvedeny odkazy na jiné speciální učebnice.

Kleinbaum DG, Klein M (2012). Survival Analysis: A Self-Learning Text, 3. vyd. New York, NY: Springer Science + Business Media, LLC

  • Vynikající úvodní text

Klein JP, Moeschberger ML (2005). Analýza přežití: Techniky pro cenzurovaná a zkrácená data, 2. vyd. New York, NY: Springer Science + Business Media, LLC

  • Tato kniha je určena pro postgraduální studenty a poskytuje mnoho praktických příkladů

Therneau TM, Grambsch PM (2000). Modelování údajů o přežití: Rozšíření Coxova modelu. New York, NY: Springer Science + Business Media, LLC

  • Dobrý úvod do procesu počítání procesů a analýzy korelovaných údajů o přežití. Autor také napsal balíček přežití v R.

Allison PD (2010). Analýza přežití pomocí SAS: Praktický průvodce, 2. vyd. Cary, NC: SAS Institute

  • Skvělý aplikovaný text pro uživatele SAS

Bagdonavicius V, Nikulin M (2002). Zrychlené modely života: modelování a statistická analýza. Boca Raton, FL: Chapman & Hall / CRC Press.

  • Dobrý zdroj pro více informací o parametrických a semiparametrických zrychlených modelech doby selhání a o tom, jak se porovnávají s modely proporcionálních rizik

Metodické články

Úvodní / Přehledové články

Hougaard P (1999). Základy údajů o přežití. Biometrie 55 (1): 13-22. PMID: 11318147 .

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Část I: analýza přežití: základní pojmy a první analýzy. Br J Cancer 89 (2): 232-8. PMID: 12865907

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Analýza přežití, část II: analýza více proměnných - úvod do konceptů a metod. Br J Cancer 89 (3): 431-6. PMID: 1288808

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Analýza přežití část II: analýza více proměnných - výběr modelu a posouzení jeho přiměřenosti a vhodnosti. Br J Cancer 89 (4): 605-11. PMID: 12951864

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Část IV: Analýza přežití: další koncepty a metody v analýze přežití. Br J Cancer 89 (5): 781-6. PMID: 12942105

  • Série čtyř článků výše představuje vynikající úvodní přehled metod v analýze přežití, který je mimořádně dobře napsaný a snadno srozumitelný - velmi se doporučuje.

Věk jako časová stupnice

Korn EL, Graubard BI, Midthune D (1997). Analýza časového průběhu podélného sledování průzkumu: volba časového měřítka. Am J Epidemiol 145 (1): 72-80. PMID: 8982025

  • Příspěvek obhajující využití věku jako časové stupnice, nikoli jako doba studia.

Ingram DD, Makuc DM, Feldman JJ (1997). Re: Time-to-event analysis of longitudinal follow-up of an survey: selection of the time-scale. Am J Epidemiol 146 (6): 528-9. PMID: 9290515 .

  • Komentář k článku Korn popisující opatření, která je třeba učinit při použití věku jako časové stupnice.

Thiébaut AC, Bénichou J (2004). Volba časového měřítka v Coxově modelové analýze údajů o epidemiologické kohortě: simulační studie. Stat Med 30; 23 (24): 3803-20. PMID: 15580597

  • Simulační studie ukazující velikost zkreslení pro různé stupně asociace mezi věkem a zájmovou proměnnou při použití času na studii jako časové stupnice.

Canchola AJ, Stewart SL, Bernstein L a kol. Coxova regrese s použitím různých časových měřítek. Dostupné v: http://www.lexjansen.com/wuss/2003/DataAnalysis/i-cox_time_scales.pdf .

  • Pěkný článek porovnávající 5 Coxových regresních modelů s variacemi v době studia nebo věku jako časové měřítko s kódem SAS.

Cenzura

Huang CY, Ning J, Qin J (2015). Semiparametrická pravděpodobnost odvození dat zkrácených a správně cenzurovaných. Biostatistika [epub] PMID: 25796430 .

  • Tento článek má pěkný úvod do analýzy cenzurovaných dat a poskytuje nový postup odhadu pro rozdělení doby přežití s ​​levými a pravými cenzurovanými daty. Je velmi hustý a má pokročilé statistické zaměření.

Cain KC, Harlow SD, Little RJ, Nan B, Yosef M, Taffe JR, Elliott MR (2011). Předpětí způsobené zkrácením vlevo a cenzurou vlevo v longitudinálních studiích vývojových a chorobných procesů. Am J Epidemiol 173 (9): 1078-84. PMID: 21422059 .

  • Vynikající zdroj, který vysvětluje zkreslení inherentní datům s levou cenzurou z epidemiologického hlediska.

Sun J, Sun L, Zhu C (2007). Testování modelu proporcionálních kurzů pro data s cenzurou podle intervalu. Životní data Anal 13: 37–50. PMID 17160547 .

  • Další statisticky hustý článek o nuancovaném aspektu analýzy dat TTE, ale poskytuje dobré vysvětlení dat s intervalovou cenzurou.

Robins JM (1995a) Analytická metoda pro randomizované studie s informativní cenzurou: Část I. Celoživotní data Anal 1: 241–254. PMID 9385104 .

Robins JM (1995b) Analytická metoda pro randomizované studie s informativní cenzurou: Část II. Celoživotní data Anal 1: 417–434. PMID 9385113 .

  • Dva příspěvky, které pojednávají o metodách řešení informativní cenzury.

Neparametrické metody přežití

Borgan Ø (2005) Kaplan-Meier Estimator. Encyklopedie biostatistiky DOI: 10.1002 / 0470011815.b2a11042

  • Vynikající přehled Kaplan-Meierova odhadu a jeho vztahu k Nelson-Aalenovu odhadu

Rodríguez G (2005). Neparametrický odhad v modelech přežití. Dostupný z: http://data.princeton.edu/pop509/NonParametricSurvival.pdf

  • Úvod do neparametrických metod a Coxova modelu proporcionálního rizika, který vysvětluje vztahy mezi metodami pomocí matematických vzorců

Cole SR, Hernan MA (2004). Upravené křivky přežití s ​​inverzními váhami pravděpodobnosti. Programy výpočetních metod Biomed 75 (1): 35-9. PMID: 15158046

  • Popisuje použití IPW k vytvoření upravených Kaplan-Meierových křivek. Zahrnuje příklad a SAS makro.

Zhang M (2015). Robustní metody pro zlepšení efektivity a snížení zkreslení při odhadu křivek přežití v randomizovaných klinických studiích. Lifetime Data Anal 21 (1): 119-37. PMID: 24522498

  • Navrhovaná metoda pro kovariátově upravené křivky přežití v RCT

Poloparametrické metody přežití

Cox DR (1972) Regresní modely a tabulky života (s diskusí). J R Statistiky Soc B 34: 187–220.

  • Klasický odkaz.

Christensen E (1987) Analýza vícerozměrných přežití pomocí Coxova regresního modelu. Hepatologie 7: 1346–1358. PMID 3679094 .

  • Popisuje použití modelu Cox pomocí motivačního příkladu. Vynikající recenze klíčových aspektů analýzy modelu Cox, včetně toho, jak se hodí model Cox a kontrola předpokladů modelu.

Grambsch PM, Therneau TM (1994) Testy proporcionálních rizik a diagnostika na základě vážených reziduí. Biometrika 81: 515–526.

  • Podrobný dokument o testování předpokladu proporcionálních rizik. Dobrá kombinace teorie a pokročilé statistické vysvětlení.

Ng’andu NH (1997) Empirické srovnání statistických testů pro posouzení předpokladu proporcionálních rizik modelu Cox. Stat Med 16: 611–626. PMID 9131751 .

  • Další podrobný dokument o testování předpokladu proporcionálních rizik, tento zahrnuje diskusi o kontrole zbytků a účinků cenzury.

Parametrické metody přežití

Rodrίguez, G (2010). Parametrické modely přežití. Dostupný z: http://data.princeton.edu/pop509/ParametricSurvival.pdf

  • krátký úvod do nejběžnějších distribucí používaných v parametrické analýze přežití

Nardi A, Schemper M (2003). Srovnání Coxových a parametrických modelů v klinických studiích. Statistika Med 22 (23): 2597-610. PMID: 14652863

  • Poskytuje dobré příklady porovnávající semiparametrické modely s modely pomocí běžných parametrických distribucí a zaměřuje se na posouzení přizpůsobení modelu

Royston P, Parmar MK (2002). Flexibilní parametrické modely proporcionálních rizik a proporcionálních šancí pro data cenzurovaného přežití s ​​aplikací na prognostické modelování a odhad účinků léčby. Stat Med 21 (15): 2175-97. PMID: 12210632

  • Dobré vysvětlení pro základní proporcionální rizika a pravděpodobnostní modely a srovnání s kubickými spline

Cox C, Chu H, Schneider MF, Muñoz A (2007). Parametrická analýza přežití a taxonomie nebezpečných funkcí pro zobecněnou distribuci gama. Statist Med 26: 4352–4374. PMID 17342754 .

  • Poskytuje vynikající přehled o parametrických metodách přežití, včetně taxonomie nebezpečných funkcí a důkladné diskuse o generalizované rodině gama distribuce.

Crowther MJ, Lambert PC (2014). Obecný rámec pro parametrickou analýzu přežití. Stat Med 33 (30): 5280-97. PMID: 25220693

  • Popisuje omezující předpoklady běžně používaných parametrických distribucí a vysvětluje omezenou metodiku kubického spline

Sparling YH, Younes N, Lachin JM, Bautista OM (2006). Parametrické modely přežití pro intervalově cenzurovaná data s časově závislými kovariátami. Biometrické údaje 7 (4): 599-614. PMID: 16597670

  • Rozšíření a příklad toho, jak používat parametrické modely s intervalově cenzurovanými daty

Časově proměnlivé kovariatury

Fisher LD, Lin DY (1999). Časově závislé proměnné v Coxově regresním modelu proporcionálních rizik. Annu Rev Public Health 20: 145-57. PMID: 10352854

  • Důkladné a snadno pochopitelné vysvětlení časově proměnných proměnných v modelech Cox s matematickou přílohou

Petersen T (1986). Přizpůsobení parametrických modelů přežití časově závislými proměnnými. Appl Statist 35 (3): 281-88.

  • Hustý článek, ale s užitečným použitým příkladem

Konkurenční analýza rizik

Viz konkurenční rizika

Tai B, Machin D, White I, Gebski V (2001) Analýza konkurenčních rizik pacientů s osteosarkomem: srovnání čtyř různých přístupů. Stat Med 20: 661–684. PMID 11241570 .

  • Dobrý podrobný dokument, který popisuje čtyři různé metody analýzy údajů o konkurenčních rizicích a k porovnání těchto čtyř přístupů využívá údaje z randomizované studie pacientů s osteosarkomem.

Checkley W, Brower RG, Muñoz A (2010). Odvození vzájemně se vylučujících konkurenčních událostí prostřednictvím směsi zobecněných gama distribucí. Epidemiologie 21 (4): 557–565. PMID 20502337 .

  • Článek o konkurenčních rizicích pomocí zobecněné distribuce gama.

Analýza seskupených dat a křehkých modelů

Yamaguchi T, Ohashi Y, Matsuyama Y (2002) Proporcionální modely rizik s náhodnými účinky, které zkoumají účinky centra v multicentrických klinických studiích rakoviny. Stat Methods Med Res 11: 221–236. PMID 12094756 .

  • Článek s vynikajícím teoretickým a matematickým vysvětlením zohlednění shlukování při analýze údajů o přežití z multicentrických klinických studií.

O’Quigley J, Stare J (2002) Proporcionální modely rizik s křehkostí a náhodnými efekty. Stat Med 21: 3219–3233. PMID 12375300 .

  • Přímé srovnání křehkých modelů a modelů náhodných efektů.

Balakrishnan N, Peng Y (2006). Zobecněný model křehkosti gama. Statist Med 25: 2797–2816. PMID

  • Článek o křehkých modelech využívajících zobecněné rozdělení gama jako křehkého rozdělení.

Rondeau V, Mazroui Y, Gonzalez JR (2012). frailtypack: Balíček R pro analýzu korelovaných údajů o přežití s ​​modely Frailty pomocí odhadu pravděpodobnosti penalizace nebo parametrického odhadu. Journal of Statistical Software 47 (4): 1-28.

  • Viněta balíčku R s dobrými základními informacemi o křehkých modelech.

Schaubel DE, Cai J (2005). Analýza seskupených dat rekurentních událostí s aplikací na míru hospitalizace u pacientů se selháním ledvin. Biostatistika 6 (3): 404-19. PMID 15831581 .

  • Vynikající práce, ve které autoři prezentují dvě metody pro analýzu seskupených dat rekurentních událostí, a poté porovnávají výsledky navrhovaných modelů s výsledky založenými na křehkém modelu.

Gharibvand L, Liu L (2009). Analýza údajů o přežití s ​​klastrovanými událostmi. Příspěvek SAS Global Forum 2009 237-2009.

  • Stručný a snadno srozumitelný zdroj pro analýzu údajů o čase do události s klastrovanými událostmi s postupy SAS.

Analýza opakujících se událostí

Twisk JW, Smidt N, de Vente W (2005). Aplikovaná analýza opakujících se událostí: praktický přehled. J Epidemiol Community Health 59 (8): 706-10. PMID: 16020650

  • Velmi snadno pochopitelný úvod do modelování opakujících se událostí a konceptu sad rizik

Villegas R, Juliá O, Ocaña J (2013). Empirická studie korelovaných dob přežití pro opakující se události s proporcionálními hranicemi rizik a účinkem korelace a cenzury. BMC Med Res Methodol 13:95. PMID: 23883000

  • Používá simulace k testování robustnosti různých modelů pro data opakujících se událostí

Kelly PJ, Lim LL (2000). Analýza přežití pro údaje o opakujících se událostech: aplikace na dětské infekční nemoci. Stat Med 19 (1): 13-33. PMID: 10623190

  • Aplikované příklady čtyř hlavních přístupů pro modelování dat opakujících se událostí

Wei LJ, Lin DY, Weissfeld L (1989). Regresní analýza mnohorozměrných neúplných údajů o době selhání modelováním okrajových distribucí. Journal of the American Statistical Association84 (108): 1065-1073

Původní článek popisující marginální modely pro analýzu opakujících se událostí

Kurzy

Letní institut epidemiologie a populačního zdraví na Kolumbijské univerzitě (EPIC)

Statistické obzory, soukromý poskytovatel speciálních statistických seminářů vyučovaných odborníky v oboru

Interuniverzitní konsorcium pro politický a sociální výzkum (ICPSR), letní program kvantitativních metod sociálního výzkumu, součást Institutu pro sociální výzkum na University of Michigan

  • Třídenní seminář o analýze přežití, modelování historie událostí a analýze trvání nabízený ve dnech 22. – 24. Června 2015 v Berkeley v Kalifornii, vedený Tenkem Raykovem z Michigan State University. Komplexní přehled metod přežití napříč obory (nejen v oblasti veřejného zdraví): http://www.icpsr.umich.edu/icpsrweb/sumprog/courses/0200

Institute for Statistics Research nabízí dva online kurzy pro analýzu přežití, nabízené několikrát ročně. Tyto kurzy vycházejí z učebnice Aplikovaná analýza od Kleina a Kleinbauma (viz níže) a lze je absolvovat a la carte nebo jako součást certifikačního programu ve Statistice:

Institut pro digitální výzkum a vzdělávání na UCLA nabízí to, čemu říkají semináře, prostřednictvím svých webových stránek pro analýzu přežití v různých statistických softwarech. Tyto semináře ukazují, jak provádět aplikovanou analýzu přežití se zaměřením více na kód než na teorii.

Zajímavé Články

Redakce Choice

Jak vytvořit firemní stránku na Facebooku bez osobního účtu? Je to možné?
Jak vytvořit firemní stránku na Facebooku bez osobního účtu? Je to možné?
Jak vytvořit firemní stránku na Facebooku bez osobního účtu? Je to možné? Podívejte se a naučte se, jak vytvořit firemní fb stránku...
Rick D'Avino
Rick D'Avino
Rick D'Avino je výkonným ředitelem společnosti PricewaterhouseCoopers, kde pracuje s místopředsedou PwC a řídícím partnerem USA, jejím globálním daňovým vůdcem, jejím americkým daňovým vůdcem a působením PwC v oblasti daňové politiky ve Washingtonu, DC Kromě toho Rick v současné době slouží jako předseda skupiny PwC Insourced Solutions for Tax. Rick působil ve společnosti GE v letech 1991 až 2013, jako viceprezident a hlavní daňový poradce ve společnosti GE Capital do roku 2005 a následně jako viceprezident a hlavní daňový poradce ve společnosti General Electric Company. Rick byl zodpovědný za všechny aspekty zdanění společnosti GE Capital a po roce 2005 i za společnost GE Corporate a za podíl GE na společnosti NBC Universal. Rick také působil v představenstvech GE Capital Corporation a GE Capital Services v letech 2009 až 2012 a GE SeaCo, společného podniku mezi GE a Sea Containers Ltd., v letech 1996 až 2011. Rick zahájil kariéru u soudce Alvina B. Rubin u odvolacího soudu USA pro pátý obvod, poté působil jako spolupracovník ve společnosti Cohen & Uretz ve Washingtonu, DC Rick poté působil jako advokát-poradce a zástupce daňového legislativního poradce na ministerstvu financí USA v letech 1983– 1987. Před příchodem do GE byl Rick daňovým partnerem ve společnosti King & Spalding ve Washingtonu, DC Rick byl členem poradní rady Internal Revenue Service, výkonného výboru daňové sekce advokátní komory v New Yorku a Washingtonu, DC a Pensylvánské bary. Rick působil jako mimořádný profesor na Právnickém centru na Georgetownské univerzitě v letech 1982-1990 a je lektorem práva na Penn Law. Rick působí v Penn Law Board of Overseers, byl prezidentem správní rady absolventů Penn Law Alumni a absolvoval dvě funkční období ve správní radě na Pitzer College. V letech 1994 až 2018 působil v představenstvu DomusKids, organizace pro vzdělávání a sociální péči o děti v Connecticutu. V roce 2018 byl Rick zvolen předsedou představenstva Stamford Academy Domus, charterové školy pro studenty ve stupních devět až dvanáct, kteří bojovali tradiční školní prostředí. Rick je členem správní rady a slouží jako viceprezident National Sawdust, brooklynské neziskové organizace, která poskytuje nejmodernější vybavení a podporu širokému spektru skladatelů, hudebníků a umělců. D’Avino získal titul B.S. z Wharton School of University of Pennsylvania v roce 1977 a promoval na právnické škole v roce 1980, kde byl redaktorem University of Pennsylvania Law Review.
Mobilní telefon Nokia 9 Pure View 2019 Cena, specifikace, Cena v Indii, Fotoaparát, Cena v USD
Mobilní telefon Nokia 9 Pure View 2019 Cena, specifikace, Cena v Indii, Fotoaparát, Cena v USD
Nokia 9 Pure View 2019 Cena, Specifikace, Funkce, Nastavení pěti fotoaparátů. Nokia 9 Pure View 2019 USD Cena, datum vydání, trendy, baterie...
PhD program
PhD program
Získejte titul Ph.D. v sociální práci na Kolumbijské univerzitě. Nabízíme renomovaného a vlivného Ph.D. program od roku 1950.
Kdy je nejlepší den číst knihy? Ráno, odpoledne nebo večer
Kdy je nejlepší den číst knihy? Ráno, odpoledne nebo večer
Někteří lidé říkají, že neexistuje ideální nebo nejlepší čas na čtení knih během dne, ale existuje perfektní den, během kterého můžete číst a učit se.
Eugene Ramos '07, spolupracovník pro Dračího prince
Eugene Ramos '07, spolupracovník pro Dračího prince
The Dragon Prince je fantasy počítačově animovaná streamovací série vytvořená Aaronem Ehaszem a Justinem Richmondem. Je to příběh dvou civilizací, jedné, která má moc magie, a lidí, kteří k magii nemají přirozený přístup.
Co je hlasování s hodnocením a proč je New York City používá?
Co je hlasování s hodnocením a proč je New York City používá?
Poprvé bude New York City používat hlasování s hodnocením podle volby u primátora. Studie ukazují, že je vláda reprezentativnější a omezuje negativní kampaně.