Hoofd Andere Leeftijd-Periode-Cohort Analyse

Leeftijd-Periode-Cohort Analyse

Overzicht

Software

Omschrijving

Websites

Lezingen

Cursussen

Overzicht

Deze pagina beschrijft kort leeftijd-periode-cohortanalyse en biedt een geannoteerde bronnenlijst.

Omschrijving

Leeftijd Periode Cohort Effect

Analyse van leeftijdsperiodecohort (APC) speelt een belangrijke rol bij het begrijpen van in de tijd variërende elementen in de epidemiologie. In het bijzonder onderscheidt APC-analyse drie soorten tijdvariërende verschijnselen: leeftijdseffecten, periode-effecten en cohorteffecten. (1)
Leeftijdseffecten zijn variaties die verband houden met biologische en sociale processen van veroudering die specifiek zijn voor individuen. (2) Ze omvatten fysiologische veranderingen en accumulatie van sociale ervaringen die verband houden met veroudering, maar die geen verband houden met de tijdsperiode of het geboortecohort waartoe een persoon behoort. In epidemiologische studies worden leeftijdseffecten meestal aangegeven door variërende percentages van ziekten tussen leeftijdsgroepen.
Periode-effecten het gevolg zijn van externe factoren die alle leeftijdsgroepen in een bepaalde kalendertijd in gelijke mate beïnvloeden. Het kan voortkomen uit een reeks ecologische, sociale en economische factoren, b.v. oorlog, hongersnood, economische crisis. Methodologische veranderingen in uitkomstdefinities, classificaties of methode van gegevensverzameling kunnen ook leiden tot periode-effecten in gegevens. (3)
Cohorteffecten zijn variaties die het resultaat zijn van de unieke ervaring/blootstelling van een groep proefpersonen (cohort) terwijl ze door de tijd bewegen. De meest gedefinieerde groep in de epidemiologie is het geboortecohort op basis van geboortejaar en wordt beschreven als verschil in het risico op een gezondheidsuitkomst op basis van geboortejaar. Er treedt dus een cohorteffect op wanneer ziekteverdelingen voortkomen uit een blootstelling die leeftijdsgroepen verschillend beïnvloedt. In de epidemiologie wordt een cohorteffect geconceptualiseerd als een interactie of effectmodificatie als gevolg van een periode-effect dat verschillend wordt ervaren door leeftijdsspecifieke blootstelling of gevoeligheid voor die gebeurtenis of oorzaak. (4)
In tegenstelling tot deze conceptualisering van het cohorteffect als een effectmodificatie in de epidemiologie, beschouwt de sociologische literatuur het cohorteffect als een structurele factor die de som van alle unieke blootstellingen vertegenwoordigt die het cohort vanaf de geboorte heeft ervaren. In dit geval worden leeftijd en periode-effect opgevat als confounders van cohorteffect en APC-analyse heeft tot doel het onafhankelijke effect van leeftijd, periode en cohort te ontrafelen. (4) De meeste APC-analysestrategieën zijn gebaseerd op het sociologische model van cohorteffect, onafhankelijk effect van leeftijd, periode en cohorteffect te conceptualiseren.
Identificatieprobleem in APC : APC-analyse is gericht op het beschrijven en schatten van het onafhankelijke effect van leeftijd, periode en cohort op het onderzochte gezondheidsresultaat. De verschillende gebruikte strategieën hebben tot doel de variantie op te delen in de unieke componenten die kunnen worden toegeschreven aan leeftijd, periode en cohorteffecten (4). Er is echter een grote belemmering voor het onafhankelijk schatten van leeftijd-, periode- en cohorteffecten door de gegevens te modelleren, wat bekend staat als het identificatieprobleem in APC. Dit komt door de exacte lineaire afhankelijkheid tussen leeftijd, periode en cohort: Periode – Leeftijd = Cohort; dat wil zeggen, gegeven het kalenderjaar en de leeftijd kan men het cohort (geboortejaar) bepalen (5). De aanwezigheid van perfect collineaire voorspellers (leeftijd, periode en cohort) in een regressiemodel zal een unieke niet-identificeerbare ontwerpmatrix opleveren, waaruit het statistisch onmogelijk is om unieke schattingen voor de drie effecten te schatten. (5)

Conventionele oplossingen voor APC-identificatieprobleem

Beperkte coëfficiënten GLIM-schatter (CGLIM)
Een populaire benadering voor het oplossen van het identificatieprobleem was het gebruik van op beperkingen gebaseerde regressieanalyse (Constrained Coefficients GLIM-schatter (CGLIM)). In deze strategie worden aanvullende beperkingen gesteld aan een van de categorieën van ten minste één voorspeller om tegelijkertijd de leeftijdsperiode en het cohorteffect te schatten. Dus aangenomen dat sommige categorieën van leeftijdsgroepen, cohorten of tijdsperioden identieke effecten hebben op de afhankelijke variabele, wordt het mogelijk om het onafhankelijke effect van leeftijdsperiode en cohort te schatten (6). De resultaten van deze analyse zijn echter afhankelijk van de beperkingen die door de onderzoeker zijn gekozen op basis van externe informatie. De geldigheid van de gekozen beperkingen zal afhangen van het theoretische vooroordeel over de categorieën parameters die identiek zijn, is vaak subjectief en er is geen empirische manier om de geldigheid van de gekozen beperkingen te bevestigen (4).
Proxyvariabelen benadering
Gebruik een of meer proxyvariabelen als surrogaten voor de leeftijds-, periode- of cohortcoëfficiënten (7)
Niet-lineaire parametrische (algebraïsche) transformatiebenadering
Definieer een niet-lineaire parametrische functie van een van de leeftijds-, periode- of cohortvariabelen zodat de relatie met andere niet-lineair is.
Intrinsieke schattermethode
Is een nieuwe techniek die in de afgelopen 10 jaar is ontwikkeld en is gerelateerd aan hoofdcomponentenanalyse die identificatieproblemen aanpakt wanneer verklarende variabelen sterk gecorreleerd zijn. Hoewel IE ook beperkingen oplegt aan parameters die vergelijkbaar zijn met CGLM, zijn de beperkingen minder subjectief en hebben ze geen invloed op de schatting van regressieparameters voor leeftijd, periode of cohort (4,5). Modelvalidatiestudies hebben de robuustheid van de statistische eigenschappen van IE bevestigd door bevindingen van een IE-analyse van empirische gegevens te vergelijken met resultaten van een analyse van dezelfde gegevens door een andere familie van modellen die niet dezelfde identificatiebeperking gebruiken (5).
Mediaan Poolse analyse
De epidemiologische definitie van een cohorteffect als leeftijd per periode-interactie is de basis voor mediane analyse. Het extraheert de niet-lineariteit in leeftijds- en periode-effecten en verdeelt de niet-lineaire variantie in cohorteffect en willekeurige fout (4). Met andere woorden, deze benadering evalueert de interactie tussen leeftijd en periode die verder gaat dan wat zou worden verwacht van hun additieve invloeden.

Richtlijn voor het schatten van APC-modellen (Gebaseerd op Yang en Land) (5):

  1. Beschrijvende gegevensanalyse door grafische weergave van gegevens is de eerste stap in een APC-analyse. Dit helpt bij de kwalitatieve beoordeling van patronen van op tijd gebaseerde variaties

  2. Sluit uit dat gegevens kunnen worden verklaard door een enkelvoudig of tweefactormodel van leeftijd, tijdsperiode en cohort. Een Goodness-of-fit-statistiek wordt vaak gebruikt om lineaire modellen met een gereduceerd logaritme te vergelijken: drie afzonderlijke modellen voor leeftijd, periode en cohorteffecten; en drie tweefactormodellen, één voor elk van de drie mogelijke paren effecten, namelijk AP-, AC- en pc-effectmodellen. Al deze modellen worden vervolgens vergeleken met een volledig APC-model waarin alle drie de factoren tegelijkertijd worden gecontroleerd. Er worden twee meest gebruikte selectiecriteria voor bestraft-waarschijnlijkheidsmodellen gebruikt, namelijk het Akaike-informatiecriterium (AIC) en het Bayesiaanse informatiecriterium (BIC). om het model te evalueren, aangezien waarschijnlijkheidsratio-tests de voorkeur geven aan modellen met een groter aantal parameters. BIC en AIC passen beide de impact van modeldimensies op modelafwijkingen aan.

  3. Als de beschrijvende analyses aangeven dat alle drie de dimensies A, P en C niet werken, kan de analyse worden aangevuld met een gereduceerd model dat de niet-operatieve dimensie weglaat en is er geen identificatieprobleem.

  4. Als deze analyses echter suggereren dat alle drie de dimensies aan het werk zijn, gebruik dan een van de specifieke methoden van APC-analyse

Mediaan Poolse analyse-praktisch voorbeeld (3)

Tabel (3) toont het identificatieprobleem, waarbij de drie componenten (leeftijd, periode en cohort) perfect gecorreleerd zijn. Om de cohorten te identificeren, hoeven we alleen de periode en leeftijdsgroep te kennen: we trekken de jonge leeftijdsgroep af van de bovenste en onderste periodegrens (bijv. mensen die 10-14 jaar oud waren in 1950-1954, we trekken 10 af van 1950 en 1954 tot label het cohortinterval als 1940-1944). (9) De in kleur gemarkeerde diagonale velden geven het percentage aan voor elk cohort naarmate ze ouder worden. Contingentietabellen kunnen het wederzijds uitsluitende cohortrisico niet inschatten vanwege overlappende cohorten. Deze conventie kan leiden tot een verkeerde classificatie van sommige individuen, maar het primaire doel van een leeftijd-periode-cohortanalyse is om algemene trends in cohortspecifiek te schatten in plaats van een nauwkeurige kwantificering van een echt causaal risico. Het overlappende cohort herinnert ons eraan tegen overinterpretatie van schattingen. We worden ook beperkt door ontbrekende gegevens. We hebben bijvoorbeeld maar één gegevenspunt voor de jongste groepspopulatie (10-14 jaar in 2000-2004). Met behulp van deze tabel kunnen we een eerste grafische weergave uitvoeren met een lijngrafiek in Microsoft Excel.

De twee grafieken zijn gemaakt met behulp van de lijndiagrammen in Microsoft Excel. Om beide grafieken te plotten, hebben we de gegevens opnieuw gerangschikt met de functie Rij/kolom wisselen. Met deze twee grafische weergaven kunnen we elk patroon in de gegevens beoordelen. De beperking is dat elke bevinding een combinatie van twee of meer effecten kan vertegenwoordigen.

Mediaan polish verwijdert de additieve effecten van leeftijd en periode door iteratief de mediaanwaarde van elke rij en kolom af te trekken. (6) De eerste stap in de gemiddelde pooling is het berekenen van de medianen voor elke rij, zie tabel 2:

De volgende stap is om de rijmediaan af te trekken van elke waarde in de rij, bijvoorbeeld in rij één trekken we 0,610 min 0,790 = -0,18 af. In de tweede rij (15-19 jaar oud) gebruikten we dezelfde procedure 6.330 – 5.770 = 0,56, en dan voor elke cel in de tabel. Hierdoor ontstond een tabel met nieuwe waarden, zie tabel 3:

De volgende stap is om de kolommediaan voor de nieuwe waarden te berekenen en vervolgens de kolommediaan af te trekken van elke cel in de kolom, bijvoorbeeld -0,18 – 19,08 = -19,26. Na het maken van de nieuwe tabel met de waarden van het aftrekken van elke mediaankolom voor elke cel, gaan we verder met het berekenen van de rijmediaan (derde iteratie). Deze iteraties zullen uiteindelijk rij- en kolommedianen produceren die gelijk zijn aan nul. Voor dit voorbeeld waren 6 iteraties nodig om rij- en kolommedianen gelijk aan nul te produceren, zie tabel 4:

Tabel 4 heeft de restwaarden na 5 iteraties. Deze restwaarden vertegenwoordigen de coëfficiënten zonder het additieve effect van leeftijd- en periode-effecten. Merk op dat de gegevens voor de leeftijdsgroepen 75-79 en 80-84 jaar tussen 1910 en 1939 ontbrekende waarden zijn. Als we de ontbrekende waarden voor nultarieven vervangen, zullen de berekende residuen vertekend zijn. De volledige procedure werd uitgevoerd in Microsoft Excel. Om te controleren of deze residuen correct waren, hebben we een nieuwe tabel gemaakt met het product van het aftrekken van de restwaarde van de oorspronkelijke reeks waarden in tabel 1. Het product van de aftrekkingen wordt gebruikt om een ​​lijndiagram te maken. Met dit lijndiagram kunnen we de geldigheid van de residuen controleren en we verwachten dat lijnen perfect parallel zijn. Omdat we de residuen die cohorteffecten vertegenwoordigen aftrekken van de oorspronkelijke waarden, beoordelen we voor elk leeftijds- of periode-effect dat vrij is van cohorteffecten. Zie grafieken 3 en 4:


De mediane polijstprocedure is beschikbaar in R, een gratis beschikbare software (8). Zie de volgende syntaxis:

mpdata<- read.csv(C:/Users/mydocs/suicidemp.csv, header=FALSE, stringsAsFactors=FALSE)
mpdata
rijnamen (mpdata)<- c(10-14, 15-19, 20-24, 25-29, 30-34, 35-39, 40-44, 45-49, 50-54, 55-59, 60-64, 65-69, 70-74, 75-79, 80-84)
colnames(mpdata)<- c(1910-1914, 1915-1919, 1920-1924, 1925-1929, 1930-1934, 1935-1939, 1940-1944, 1945-1949, 1950-1954, 1955-1959, 1960-1964, 1965-1969, 1970-1974, 1975-1979, 1980-1984, 1985-1989, 1990-1994, 1995-1999, 2000-2004)
mpdata
med.p<- medpolish(mpdata, na.rm = TRUE)
med.p

Mediaan polish-resultaten kunnen worden verkregen zonder enige transformatie van snelheden, maar het gebruik van de log-transformatie van de snelheden vóór de mediaan polish-procedure zal een beoordeling van interactie op de multiplicatieve schaal (of log-additief effect) opleveren. We herhaalden onze mediane polijstprocedure met behulp van log-transformatie van de zelfmoordcijfers. Om log-getransformeerde residuen van de originele tabel te produceren met behulp van R-software, hebben we een nieuwe functie gemaakt die de tarieven voor log-getransformeerde tarieven vervangt (let op het vetgedrukte lettertype in de syntaxis):

koningscollege

medpolish2<- function (x, eps = 0.01, maxiter = 10L, trace.iter = TRUE, na.rm = FALSE)
{
met<- as.matrix( log(x) )
Nee<- nrow(z)
nc<- ncol(z)
t<- 0
r<- numeric(nr)
c<- numeric(nc)
oldsum<- 0
voor (iter in 1L:maxiter) abs(newsum – oldsum)als (geconvergeerd)
breken
oldsum<- newsum
als (trace.iter)
cat(iter, : , nieuwssom, , sep = )

als (geconvergeerd) {
als (trace.iter)
cat(Laatste: , nieuwssom, , sep = )
}
else warning(sprintf(ngettext(maxiter, medpolish() convergeerde niet in %d iteratie, medpolish() convergeerde niet in %d iteraties), maxiter), domein = NA)
namen(r)<- rownames(z)
namen (c)<- colnames(z)
jaar<- list(overall = t, row = r, col = c, residuals = z, name = deparse(substitute(x)))
klas (jaren)<- medpolish
jaar
}

med.p2<- medpolish2(mpdata, na.rm = TRUE)

De gegevens worden opgeslagen als een door komma's gescheiden bestand (.csv), een gemakkelijk leesbaar formaat in R. Let op de opdracht voor de mediaan polish, de optie voor ontbrekende gegevens is ingeschakeld, anders zal de procedure een fout rapporteren. Beide sets van residuen gemaakt met Excel en R zijn gelijk.
We hervormden de gegevens per cohort en voerden een plot uit van de residuen tegen de cohortcategorie. Zie volgende tabel:

We hebben het gemiddelde voor elk cohort berekend en vervolgens worden deze log-getransformeerde residuen gebruikt om een ​​plot per cohort te maken. Deze grafiek helpt bij het beoordelen van de verdeling van de residuen, waarbij elke significante afwijking van nul een sterk cohorteffect voor dat cohort suggereert, zie volgende grafiek:

STATA-code voor het plotten van de residuen:

Plot van gemiddelde polijstresiduen, BOEKVOORBEELD (logschaal)
gebruik C:Usersmydocssuicide_data.dta, wissen
hernoem var2 var1
……
hernoem var16 var15
eigen gemiddelde = rijgemiddelde (var *)
hervorm lange var, i(cohort) j(count)
laat vallen als var==.
label definiëren cohort 1 1830-1834 2 1835-1839 … 32 1985-1989 33 1990-1994
label waarden cohort cohort
hernoem var Rest
twoway(scatter Residual cohort, msize(vsmall)) (connected mean cohort, msize(vsmall) msymbol(driehoek) lwidth(dun) lpattern(solid)), ytitle(Median Polish Residuals) yscale (bereik(-2 2)) ylabel (#7) xtitle(Cohort) xlabel(#33, labels labsize(small) angle(vertical) labgap(minuscule) valuelabel) title(, size(medsmall) ring(0)) legend(size(small))

Deze residuen helpen ons om de omvang van het cohorteffect te beoordelen met behulp van een lineaire regressie van de residuenwaarden per cohort. Hier kiezen we de 1910 – 1914 als referentiecohort. Net als in grafiek 6 lijkt het erop dat de cohorten geboren na 1950 een statistisch significant hoger risico op zelfmoord hadden dan de cohort van 1910-1014. De coëfficiënten die zijn berekend met de lineaire regressie zijn in log-schaal, om de snelheidsverhoudingen te schatten, hebben we de exponentfunctie voor elke coëfficiënt [exp(x)] gebruikt.

STATA-code voor de regressie van residuen van zelfmoordcijfers.

char cohort [weglaten] 17
xi: regressie Resterend i.cohort

  1. Yang Y, Schulhofer-Wohl S, Fu WJ, Land KC. De intrinsieke schatter voor leeftijd-periode-cohortanalyse: wat het is en hoe het te gebruiken1. American Journal of Sociology 2008;113(6):1697-736.

  2. Reither EN, Hauser RM, Yang Y. Zijn geboortecohorten van belang? Leeftijd-periode-cohortanalyses van de obesitas-epidemie in de Verenigde Staten. Sociale wetenschappen en geneeskunde 2009;69(10):1439-48.

  3. Keyes KM, Li G. Leeftijd-periode-cohortmodellering. Blessureonderzoek: Springer, 2012: 409-26.

  4. Keyes KM, Utz RL, Robinson W, Li G. Wat is een cohorteffect? Vergelijking van drie statistische methoden voor het modelleren van cohorteffecten bij de prevalentie van obesitas in de Verenigde Staten, 1971-2006. Soc Sci Med 2010;70(7):1100-8

  5. Yang, Yang en Kenneth C. Land. Leeftijd-periode-cohortanalyse: nieuwe modellen, methoden en empirische toepassingen. CRC Press, 2013

  6. Mason, Karen Oppenheim, et al. Enkele methodologische problemen bij cohortanalyse van archiefgegevens. Amerikaans sociologisch overzicht (1973): 242-258

  7. O'Brien, R.M. 2000. Leeftijd Periode Cohort Karakteristieke Modellen. Sociaalwetenschappelijk onderzoek 29:123-139

  8. http://www.r-project.org/

  9. Keyes KM, Li G. Een meerfasige methode voor het schatten van cohorteffecten in contingentietabelgegevens van de leeftijdsperiode. Ann Epidemiol 2010; 20:779-785.

Lezingen


Studieboeken en hoofdstukken

  • Yang, Yang en Kenneth C. Land. Leeftijd-periode-cohortanalyse: nieuwe modellen, methoden en empirische toepassingen. CRC-pers, 2013.

  • Keyes, Katherine M. en Guohua Li. Leeftijd-periode-cohortmodellering. Blessure onderzoek. Springer VS, 2012. 409-426.

  • Glenn, Norval D., uitg. Cohortanalyse. Vol. 5. Salie, 2005

  • Hobcraft, John, Jane Menken en Samuel Preston. Leeftijd, periode en cohorteffecten in demografie: een overzicht. Springer New York, 1985.

Methodologische artikelen

  • Ryder, Norman B. Het cohort als concept in de studie van sociale verandering. American sociological review (1965): 843-861

  • Mason, Karen Oppenheim, et al. Enkele methodologische problemen bij cohortanalyse van archiefgegevens. Amerikaans sociologisch overzicht (1973): 242-258

  • Mason, William M. en Stephen E. Fienberg. Cohortanalyse in sociaal onderzoek: voorbij het identificatieprobleem. (1985)

  • Yang, Yang, et al. De intrinsieke schatter voor leeftijd-periode-cohortanalyse: wat het is en hoe het te gebruiken1. American Journal of Sociology 113.6 (2008): 1697-1736.

  • Keyes, Katherine M., et al. Wat is een cohorteffect? Vergelijking van drie statistische methoden voor het modelleren van cohorteffecten bij de prevalentie van obesitas in de Verenigde Staten, 1971-2006. Sociale wetenschappen en geneeskunde 70,7 (2010): 1100-1108.

  • Keyes, K. & Li, G., leeftijd-periode-cohortmodellering. In Li, G. & Baker, S. (eds.), Letselonderzoek: theorieën, methoden en benaderingen. Springer, Hoofdstuk 22, pagina's 409-426. New York, 2012

Toepassingsartikelen

  • Keyes, Katherine M., et al. Leeftijd, periode en cohorteffecten bij psychologische nood in de Verenigde Staten en Canada. Amerikaans tijdschrift voor epidemiologie (2014): kwu029.

Websites

http://yangclaireyang.web.unc.edu/research/age-period-cohort-analysis-new-models-methods-and-empirical-applications/

Interessante Artikelen

Editor'S Choice

Virginia Lorenzi MS
Virginia Lorenzi MS
Bobby Art International v. Hoon
Bobby Art International v. Hoon
Columbia Global Freedom of Expression streeft naar een beter begrip van de internationale en nationale normen en instellingen die de vrije stroom van informatie en meningsuiting het beste beschermen in een onderling verbonden wereldwijde gemeenschap met grote gemeenschappelijke uitdagingen die moeten worden aangepakt. Om haar missie te bereiken, onderneemt en geeft Global Freedom of Expression onderzoeks- en beleidsprojecten, organiseert het evenementen en conferenties en neemt het deel aan en draagt ​​het bij aan wereldwijde debatten over de bescherming van de vrijheid van meningsuiting en informatie in de 21e eeuw.
Februari Virtuele Narrative Medicine-rondes met André Aciman
Februari Virtuele Narrative Medicine-rondes met André Aciman
Homo Irrealis: Essays,' een gesprek met schrijver André Aciman over zijn nieuwe boek Voor onze Narrative Medicine-rondes in februari verwelkomen we schrijver André...
Nigeriaanse immigratiedienst en de last van gegevensbescherming
Nigeriaanse immigratiedienst en de last van gegevensbescherming
Columbia Global Freedom of Expression streeft naar een beter begrip van de internationale en nationale normen en instellingen die de vrije stroom van informatie en meningsuiting het beste beschermen in een onderling verbonden wereldwijde gemeenschap met grote gemeenschappelijke uitdagingen die moeten worden aangepakt. Om haar missie te bereiken, onderneemt en geeft Global Freedom of Expression onderzoeks- en beleidsprojecten, organiseert evenementen en conferenties, en neemt deel aan en draagt ​​bij aan wereldwijde debatten over de bescherming van vrijheid van meningsuiting en informatie in de 21e eeuw.
Hij is een CNN-held: Alumnus David Flink beschouwt 'LD' als 'anders leren
Hij is een CNN-held: Alumnus David Flink beschouwt 'LD' als 'anders leren'
Teachers College alumnus David Flink (M.A. ’08), oprichter en Chief Empowerment Officer van Eye to Eye, een mentoringbeweging voor en door mensen met leerproblemen/ADHD, is uitgeroepen tot CNN Hero.
Martin Luther King Jr. in Columbia
Martin Luther King Jr. in Columbia
Op 27 oktober 1961 arriveerde Martin Luther King Jr., de voorzitter van de Southern Christian Leadership Conference (SCLC) en predikant van de Ebenezer Baptist Church in Atlanta, aan de Columbia University om een ​​toespraak te houden. King omhelsde christelijke liefde en Gandhiaanse geweldloosheid en stond erop dat Amerika zijn belofte van gelijke rechten voor iedereen waarmaakt. King, tweeëndertig, was de meest vooraanstaande burgerrechtenleider van het land. Hij had de Montgomery Bus Boycot in 1956 geleid en maakte de cover van TIME.
Klimaatverandering zorgt voor aanzienlijke toename van bosbranden in de VS
Klimaatverandering zorgt voor aanzienlijke toename van bosbranden in de VS