Software | |
Kurzy |
Přehled
Tato stránka stručně popisuje analýzu věku-období-kohorty a poskytuje anotovaný seznam zdrojů.
Popis
Efekt kohorty podle věkového období
Analýza věkových období (APC) hraje důležitou roli v porozumění časově proměnným prvkům v epidemiologii. Analýza APC rozeznává zejména tři typy časově se měnících jevů: věkové efekty, periodické efekty a kohortní efekty. (1)
Účinky na věk jsou variace spojené s biologickými a sociálními procesy stárnutí specifické pro jednotlivce. (2) Zahrnují fyziologické změny a akumulaci sociálních zkušeností souvisejících se stárnutím, ale nesouvisí s časovým obdobím nebo kohortou narození, ke které jedinec patří. V epidemiologických studiích jsou věkové účinky obvykle označovány různou mírou onemocnění napříč věkovými skupinami.
Efekty období jsou výsledkem vnějších faktorů, které mají stejný dopad na všechny věkové skupiny v určitém kalendářním čase. Mohlo by to vzniknout z řady environmentálních, sociálních a ekonomických faktorů, např. válka, hladomor, ekonomická krize. Metodické změny v definicích výsledků, klasifikacích nebo metodách sběru dat by také mohly vést k dobovým efektům v datech. (3)
Kohortové efekty jsou variace vyplývající z jedinečného zážitku / expozice skupiny subjektů (kohorty) při jejich pohybu v čase. Nejčastěji definovanou skupinou v epidemiologii je kohorta narození založená na roce narození a je popsána jako rozdíl v riziku zdravotního výsledku na základě roku narození. Kohortový efekt tedy nastává, když distribuce nemoci vznikají z expozice, která různě ovlivňuje věkové skupiny. V epidemiologii je kohortový efekt pojímán jako interakce nebo modifikace účinku v důsledku efektu období, který je odlišně prožíván prostřednictvím věkově specifické expozice nebo náchylnosti k této události nebo příčině. (4)
Identifikační problém v APC : Analýza APC si klade za cíl popsat a odhadnout nezávislý vliv věku, období a kohorty na studovaný výsledek zdraví. Různé použité strategie si kladou za cíl rozdělit rozptyl do jedinečných složek, které lze přičíst účinkům věku, období a kohorty (4). Existuje však hlavní překážka v nezávislém odhadu účinků věku, období a kohorty modelováním dat, která jsou známá jako identifikační problém v APC. Důvodem je přesná lineární závislost mezi věkem, obdobím a kohortou: Období - Věk = kohorta; tj. vzhledem k kalendářnímu roku a věku lze určit kohortu (rok narození) (5). Přítomnost dokonale kolineárních prediktorů (věk, období a kohorta) v regresním modelu vytvoří jedinečnou neidentifikovatelnou matici návrhu, ze které je statisticky nemožné odhadnout jedinečné odhady pro tyto tři efekty. (5)
hodiny jídelny mojo
Konvenční řešení problému identifikace APC
Omezené koeficienty GLIM odhad (CGLIM)
Přístup k proměnným proxy
Přístup nelineární parametrické (algebraické) transformace
Metoda vlastního odhadu
Střední polská analýza
Epidemiologická definice kohortového efektu jako interakce mezi věkem a obdobím je základem pro analýzu polského mediánu. Extrahuje nelinearitu účinků věku a období a rozděluje nelineární rozptyl na kohortový efekt a náhodnou chybu (4). Jinými slovy tento přístup hodnotí interakci věku a období, která je nad rámec toho, co by se dalo očekávat od jejich aditivních vlivů.
Směrnice pro odhad modelů APC (Na základě Yang and Land) (5):
-
Popisná analýza dat pomocí grafického znázornění dat je prvním krokem v analýze APC. To pomáhá při kvalitativním hodnocení vzorů časových variací
-
Vyloučte, že data lze vysvětlit jakýmkoli jednofaktorovým nebo dvoufaktorovým modelem věku, časového období a kohorty. Statistika dobré shody se často používá k porovnání lineárních modelů se sníženým logem: tři samostatné modely pro věk, období a kohortní efekty; a tři dvoufaktorové modely, jeden pro každou ze tří možných dvojic efektů, jmenovitě AP, AC a PC efekty. Všechny tyto modely jsou poté porovnány s úplným modelem APC, kde jsou současně kontrolovány všechny tři faktory. Používají se dvě nejčastěji používaná kritéria výběru modelu penalizované pravděpodobnosti, a to Akaikeovo informační kritérium (AIC) a Bayesovské informační kritérium (BIC). vyhodnotit model, protože testy poměru pravděpodobnosti mají tendenci upřednostňovat modely s větším počtem parametrů. BIC a AIC upravují dopad rozměrů modelu na odchylky modelu.
-
Pokud popisné analýzy naznačují, že všechny tři dimenze A, P a C nejsou funkční, lze analýzu dokončit zmenšeným modelem, který vynechá nefunkční dimenzi a neexistuje žádný problém s identifikací.
-
Pokud však tyto analýzy naznačují, že všechny tři dimenze fungují, použijte některou ze specifických metod analýzy APC
Praktický příklad střední polské analýzy (3)
Tabulka (3) ukazuje problém identifikace, kde jsou tři složky (věk, období a kohorta) dokonale korelované. K identifikaci kohort potřebujeme znát pouze období a věkovou skupinu: odečteme skupinu raného věku od horní a dolní hranice období (např. Lidé, kteří měli 10–14 let v letech 1950-1954, odečteme 10 od roku 1950 a 1954 do označte interval kohorty jako 1940-1944). (9) Barevně zvýrazněná úhlopříčná pole označují míru stárnutí každé kohorty. Pohotovostní tabulky nemohou odhadnout vzájemně se vylučující riziko kohorty z důvodu překrývajících se kohort. Tato konvence může zavést nesprávnou klasifikaci některých jednotlivců, ale primárním účelem analýzy kohorty podle věku a období je spíše odhadnout obecné trendy v kohortě specifické než přesnou kvantifikaci skutečného kauzálního rizika. Překrývající se skupina nám připomíná přílišnou interpretaci odhadů. Jsme také omezeni chybějícími údaji. Například máme pouze jeden bod údajů pro nejmladší populaci skupiny (osoby ve věku 10–14 let v letech 2000–2004). Pomocí této tabulky můžeme provést počáteční grafické znázornění čárovým grafem v aplikaci Microsoft Excel.
Dva grafy byly vytvořeny pomocí spojnicových grafů v aplikaci Microsoft Excel. K vykreslení obou grafů jsme právě přeskupili data pomocí funkce Přepnout řádek / sloupec. Tyto dvě grafické znázornění nám umožňují posoudit jakýkoli vzorec v datech. Omezení spočívá v tom, že jakýkoli nález může představovat kombinaci dvou nebo více účinků.
Střední polský odstraní aditivní účinky věku a období iterativním odečtením střední hodnoty každého řádku a sloupce. (6) Prvním krokem v mediánovém lesku je výpočet mediánů pro každý řádek, viz tabulka 2:
800-367-5690
Dalším krokem je odečtení mediánu řádku od každé hodnoty v řádku, například v prvním řádku odečteme 0,610 minus 0,790 = -0,18. Ve druhém řádku (ve věku 15-19 let) jsme použili stejný postup 6.330 - 5.770 = 0,56 a poté pro každou buňku v tabulce. Tím byla vytvořena tabulka s novými hodnotami, viz tabulka 3:
Dalším krokem je výpočet mediánu sloupce pro nové hodnoty a poté odečtení mediánu sloupce od každé buňky ve sloupci, například -0,18 - 19,08 = -19,26. Po vytvoření nové tabulky s hodnotami od odečtení každého mediánu sloupce pro každou buňku pokračujeme ve výpočtu mediánu řádku (třetí iterace). Tyto iterace nakonec vytvoří mediány řádků a sloupců rovné nule. V tomto příkladu bylo k vytvoření mediánu řádků a sloupců rovných nule potřeba 6 iterací, viz tabulka 4:
Tabulka 4 obsahuje zbytkové hodnoty po 5 iteracích. Tyto zbytky představují koeficienty bez aditivního vlivu věku a období. Všimněte si, že údaje pro věkové skupiny 75-79 a 80-84 let staré mezi lety 1910 a 1939 chybí. Pokud nahradíme chybějící hodnoty nulovými sazbami, budou vypočteny zbytky zkreslené. Celý postup byl proveden v aplikaci Microsoft Excel. Abychom zkontrolovali, zda jsou tyto rezidua správná, vytvořili jsme novou tabulku s produktem odečtení reziduální hodnoty od původní sady hodnot v tabulce 1. Produkt odečtení se používá k vytvoření spojnicového grafu. Tento spojnicový graf nám umožňuje zkontrolovat platnost zbytků a očekáváme řádky dokonale rovnoběžné. Jelikož odečítáme rezidua, která představují kohortní efekty, od původních hodnot, hodnotíme jakýkoli efekt věku nebo období bez kohortních efektů. Viz grafy 3 a 4:
Medián polského postupu je k dispozici v R, což je volně dostupný software (8). Zobrazit další syntaxi:
mpdata<- read.csv(C:/Users/mydocs/suicidemp.csv, header=FALSE, stringsAsFactors=FALSE)
názvy řádků (mpdata)<- c(10-14, 15-19, 20-24, 25-29, 30-34, 35-39, 40-44, 45-49, 50-54, 55-59, 60-64, 65-69, 70-74, 75-79, 80-84)
colnames (mpdata)<- c(1910-1914, 1915-1919, 1920-1924, 1925-1929, 1930-1934, 1935-1939, 1940-1944, 1945-1949, 1950-1954, 1955-1959, 1960-1964, 1965-1969, 1970-1974, 1975-1979, 1980-1984, 1985-1989, 1990-1994, 1995-1999, 2000-2004)
med.p<- medpolish(mpdata, na.rm = TRUE)
med.p
Medián polských výsledků lze získat bez jakékoli transformace sazeb, ale použití logaritmické transformace sazeb před procedurou mediánového leštění způsobí vyhodnocení interakce na multiplikativní škále (nebo log-aditivní efekt). Zopakovali jsme náš postup s mediánem leštění pomocí logické transformace míry sebevražd. Abychom vytvořili zbytky původní tabulky transformované logem pomocí softwaru R, vytvořili jsme novou funkci, která nahradí sazby za sazby transformované logem (všimli jsme si tučného písma v syntaxi):
medpolish2<- function (x, eps = 0.01, maxiter = 10L, trace.iter = TRUE, na.rm = FALSE)
s<- as.matrix( log (x) )
Ne<- nrow(z)
nc<- ncol(z)
t<- 0
r<- numeric(nr)
C<- numeric(nc)
oldsum<- 0
pro (iter v 1L: maxiter) abs (newsum - oldsum)
oldsum<- newsum
kočka (iter,:, newsum, n, sep =)
pokud (konvergované) {
kočka (finále:, newsum, n, sep =)
varování else (sprintf (ngettext (maxiter, medpolish () se nekonvergoval v% d iteraci, medpolish () se nekonvergoval v% d iteracích), maxiter), doména = NA)
jména (r)<- rownames(z)
jména (c)<- colnames(z)
let<- list(overall = t, row = r, col = c, residuals = z, name = deparse(substitute(x)))
třída (roky)<- medpolish
}
med.p2<- medpolish2(mpdata, na.rm = TRUE)
Data se ukládají jako soubor s oddělovači čárkami (.csv), což je snadný formát pro čtení v R. Všimněte si příkazu pro střední polštinu, možnost chybějících dat je povolena, jinak procedura ohlásí chybu. Obě sady reziduí vytvořené pomocí aplikace Excel a R jsou stejné.
Data jsme přetvořili podle kohorty a provedli jsme graf reziduí proti kategorii kohorty. Viz následující tabulka:
co můžete dělat s mistry v oblasti veřejného zdraví
Vypočítali jsme průměr pro každou kohortu a poté se tyto logaritmicky transformované zbytky použijí k vytvoření grafu kohortou. Tento graf pomáhá posoudit distribuci reziduí, kde jakákoli významná odchylka od nuly naznačuje silný kohortní efekt pro tuto kohortu, viz následující graf:
STATA kód pro zakreslení zbytků:
Plot sazby medián zbytků leštidla, PŘÍKLAD KNIHY (logaritmická stupnice)
přejmenovat var2 var1
přejmenovat var16 var15
přetvarovat dlouhou var, i (kohorta) j (počet)
štítek definovat kohortu 1 1830-1834 2 1835-1839… 32 1985-1989 33 1990-1994
přejmenovat var Reziduální
twayay (scatter Residual cohort, msize (vsmall)) (spojený průměr kohorty, msize (vsmall) msymbol (trojúhelník) lwidth (thin) lpattern (solid)), ytitle (Median Polish Residuals) yscale (range (-2 2)) ylabel (# 7) xtitle (kohorta) xlabel (# 33, štítky labsize (malý) úhel (vertikální) labgap (minuscule) valuelabel) název (, velikost (medsmall) prsten (0)) legenda (velikost (malý))
Tyto rezidua nám pomáhají posoudit velikost kohortního efektu pomocí lineární regrese hodnot reziduí podle kohorty. Zde zvolíme 1910 - 1914 jako referenční kohortu. Podobně jako v grafu 6 se zdá, že kohorty narozené po roce 1950 měly statisticky významně vyšší riziko sebevraždy ve srovnání s kohortou z let 1910-1014. Koeficienty vypočítané s lineární regresí jsou v logaritmickém měřítku, pro odhad poměrů rychlosti jsme použili exponentovou funkci pro každý koeficient [exp (x)].
STATA kód pro regresi zbytků z míry sebevražd.
char kohorta [vynechat] 17
xi: regress Residual i.cohort
-
Yang Y, Schulhofer ‐ Wohl S, Fu WJ, Land KC. Skutečný odhad pro analýzu kohorty podle věku-období: Co to je a jak ji používat1. American Journal of Sociology 2008; 113 (6): 1697-736.
-
Buď EN, Hauser RM, Yang Y. Záleží na kohortě narození? Věkové kohortní analýzy epidemie obezity ve Spojených státech. Sociální vědy a medicína 2009; 69 (10): 1439-48.
-
Keyes KM, Li G. Věk – období – modelování kohort. Research Injury: Springer, 2012: 409-26.
-
Keyes KM, Utz RL, Robinson W, Li G. Co je to kohortní efekt? Srovnání tří statistických metod pro modelování kohortních účinků na prevalenci obezity ve Spojených státech, 1971-2006. Soc Sci Med 2010; 70 (7): 1100-8
-
Yang, Yang a Kenneth C. Land. Analýza věkových období a kohort: nové modely, metody a empirické aplikace. CRC Press, 2013
-
Mason, Karen Oppenheim a kol. Některé metodické problémy kohortní analýzy archivních dat. Americký sociologický přehled (1973): 242-258
-
O’Brien, R.M. 2000. Věkové období kohortní charakteristické modely. Social Science Research 29: 123-139
r.a.v. v. město sv. Pavel
-
Keyes KM, Li G. Vícefázová metoda pro odhad účinků kohorty v datech kontingenční tabulky věkových období. Ann Epidemiol 2010; 20: 779-785.
Čtení
-
Yang, Yang a Kenneth C. Land. Analýza věkových období a kohort: nové modely, metody a empirické aplikace. CRC Press, 2013.
-
Keyes, Katherine M. a Guohua Li. Věk – období – modelování kohort. Výzkum úrazů. Springer USA, 2012. 409-426.
-
Glenn, Norval D., ed. Kohortová analýza. Sv. 5. Sage, 2005
-
Hobcraft, John, Jane Menken a Samuel Preston. Věk, období a kohortní efekty v demografii: recenze. Springer New York, 1985.
Metodické články
-
Ryder, Norman B. Kohorta jako koncept při studiu sociálních změn. Americký sociologický přehled (1965): 843-861
-
Mason, Karen Oppenheim a kol. Některé metodické problémy kohortní analýzy archivních dat. Americký sociologický přehled (1973): 242-258
-
Mason, William M. a Stephen E. Fienberg. Kohortová analýza v sociálním výzkumu: za problémem identifikace. (1985)
-
Yang, Yang a kol. Skutečný odhad pro analýzu kohorty podle věku-období: Co to je a jak ji používat1. American Journal of Sociology 113.6 (2008): 1697-1736.
-
Keyes, Katherine M. a kol. Co je to kohortový efekt? Srovnání tří statistických metod pro modelování kohortních účinků na prevalenci obezity ve Spojených státech, 1971–2006. Sociální vědy a medicína 70,7 (2010): 1100-1108.
800-367-5690
-
Keyes, K. & Li, G., Age-period-cohort modeling. In Li, G. & Baker, S. (eds.), Injury Research: Theories, Methods, and Approaches. Springer, kapitola 22, strany 409-426. New York, 2012
Články o aplikaci
-
Keyes, Katherine M. a kol. Věk, období a kohortové účinky v psychologické nouzi ve Spojených státech a Kanadě. Americký žurnál epidemiologie (2014): kwu029.