Hoofd Andere Tijd-tot-event gegevensanalyse

Tijd-tot-event gegevensanalyse

Overzicht

Software

Omschrijving

Websites

Lezingen

Cursussen

Overzicht

Deze pagina beschrijft in het kort een reeks vragen waarmee rekening moet worden gehouden bij het analyseren van tijd-tot-gebeurtenisgegevens en biedt een geannoteerde bronnenlijst voor meer informatie.

Omschrijving

Wat is er uniek aan time-to-event (TTE) data?

Time-to-event (TTE)-gegevens zijn uniek omdat de uitkomst van belang niet alleen is of een gebeurtenis al dan niet heeft plaatsgevonden, maar ook wanneer die gebeurtenis heeft plaatsgevonden. Traditionele methoden van logistische en lineaire regressie zijn niet geschikt om zowel de gebeurtenis- als de tijdsaspecten als uitkomst in het model op te nemen. Traditionele regressiemethoden zijn ook niet uitgerust om censuur aan te pakken, een speciaal type ontbrekende gegevens dat optreedt in time-to-event-analyses wanneer proefpersonen de gebeurtenis van belang niet ervaren tijdens de follow-uptijd. In aanwezigheid van censuur wordt de werkelijke tijd tot gebeurtenis onderschat. Er zijn speciale technieken voor TTE-gegevens ontwikkeld, zoals hieronder zal worden besproken, om de gedeeltelijke informatie over elk onderwerp te gebruiken met gecensureerde gegevens en om onbevooroordeelde overlevingsschattingen te geven. Deze technieken bevatten gegevens van meerdere tijdstippen over onderwerpen en kunnen worden gebruikt om snelheden, tijdverhoudingen en risicoverhoudingen direct te berekenen.

Wat zijn belangrijke methodologische overwegingen van time-to-event data?

Er zijn 4 belangrijke methodologische overwegingen bij de analyse van tijd tot gebeurtenis of overlevingsgegevens. Het is belangrijk om een ​​duidelijke definitie te hebben van de doelgebeurtenis, de tijdsoorsprong, de tijdschaal en om te beschrijven hoe deelnemers het onderzoek zullen verlaten. Zodra deze goed zijn gedefinieerd, wordt de analyse eenvoudiger. Meestal is er één doelgebeurtenis, maar er zijn uitbreidingen van overlevingsanalyses die meerdere gebeurtenissen of herhaalde gebeurtenissen mogelijk maken.

Wat is de oorsprong van de tijd?

De tijdsoorsprong is het punt waarop de follow-uptijd begint. TTE-gegevens kunnen een verscheidenheid aan tijdoorsprongen gebruiken die grotendeels worden bepaald door het onderzoeksontwerp, elk met bijbehorende voor- en nadelen. Voorbeelden zijn baseline-tijd of baseline-leeftijd. Tijdsoorsprong kan ook worden bepaald door een bepalend kenmerk, zoals het begin van de blootstelling of diagnose. Dit is vaak een natuurlijke keuze als de uitkomst gerelateerd is aan die eigenschap. Andere voorbeelden zijn geboorte- en kalenderjaar. Voor cohortstudies is de tijdschaal meestal tijd op studie.

Is er een andere optie voor tijdschaal dan tijd op studie?

Leeftijd is een andere veelgebruikte tijdschaal, waarbij baseline-leeftijd de tijdsoorsprong is en individuen vertrekken op hun evenement of censurerende leeftijd. Modellen met leeftijd als tijdschaal kunnen worden aangepast voor kalendereffecten. Sommige auteurs bevelen aan om leeftijd in plaats van studietijd als tijdschaal te gebruiken, omdat dit minder vooringenomen schattingen kan opleveren.

Wat is censureren?

Een van de specifieke uitdagingen voor overlevingsanalyse is dat slechts enkele individuen de gebeurtenis aan het einde van het onderzoek hebben meegemaakt, en daarom zullen de overlevingstijden onbekend zijn voor een subset van de onderzoeksgroep. Dit fenomeen wordt censurering genoemd en kan op de volgende manieren ontstaan: de deelnemer aan de studie heeft de relevante uitkomst, zoals terugval of overlijden, nog niet ervaren aan het einde van de studie; de studiedeelnemer is tijdens de studieperiode verloren voor follow-up; of de studiedeelnemer beleeft een andere gebeurtenis die verdere follow-up onmogelijk maakt. Dergelijke gecensureerde intervaltijden onderschatten de echte maar onbekende tijd tot gebeurtenis. Voor de meeste analytische benaderingen wordt aangenomen dat censurering willekeurig of niet-informatief is.

Er zijn drie hoofdtypen censurering: rechts, links en interval. Als de gebeurtenissen plaatsvinden na het einde van het onderzoek, worden de gegevens rechtsgecensureerd. Links gecensureerde gegevens vinden plaats wanneer de gebeurtenis wordt waargenomen, maar de exacte tijd van de gebeurtenis is onbekend. Intervalgecensureerde gegevens vinden plaats wanneer de gebeurtenis wordt waargenomen, maar deelnemers komen in en uit observatie, dus de exacte tijd van de gebeurtenis is onbekend. De meeste overlevingsanalysemethoden zijn ontworpen voor rechts-gecensureerde waarnemingen, maar methoden voor interval- en links-gecensureerde gegevens zijn beschikbaar.

Wat is de vraag van belang?

De keuze van het analytische hulpmiddel moet worden geleid door de onderzoeksvraag van belang. Met TTE-data kan de onderzoeksvraag verschillende vormen aannemen, wat van invloed is op welke overlevingsfunctie het meest relevant is voor de onderzoeksvraag. Drie verschillende soorten onderzoeksvragen die van belang kunnen zijn voor TTE-gegevens zijn:

  1. Welk deel van de personen blijft na een bepaalde tijd vrij van het evenement?

  2. Welk deel van de personen zal het evenement na een bepaalde tijd hebben?

  3. Wat is het risico van de gebeurtenis op een bepaald moment, onder degenen die tot dat moment hebben overleefd?

Elk van deze vragen komt overeen met een ander type functie dat wordt gebruikt in overlevingsanalyse:

  1. Overlevingsfunctie, S(t): de kans dat een individu na de tijd t zal overleven [Pr(T>t)]

  2. Kansdichtheidsfunctie, F(t), of de cumulatieve incidentiefunctie, R(t): de kans dat een persoon een overlevingstijd heeft die kleiner is dan of gelijk is aan t [Pr(T≤t)]

  3. Hazard Function, h(t): het momentane potentieel van het ervaren van een gebeurtenis op tijdstip t, afhankelijk van het hebben overleefd tot op dat moment

  4. Cumulatieve gevarenfunctie, H(t): de integraal van de gevarenfunctie van tijd 0 tot tijd t, die gelijk is aan de oppervlakte onder de kromme h(t) tussen tijd 0 en tijd t

Als een van deze functies bekend is, kunnen de andere functies worden berekend met behulp van de volgende formules:

S(t) = 1 – F(t) De overlevingsfunctie en de kansdichtheidsfunctie som op tot 1

h(t)=f(t)/S(t) Het momentane gevaar is gelijk aan de onvoorwaardelijke kans op

Minersville School District v. Gobitis

het ervaren van de gebeurtenis op tijdstip t, geschaald door de fractie levend op tijdstip t

H(t) = -log[S(t)] De cumulatieve gevarenfunctie is gelijk aan de negatieve logaritme van de overleving

functie

S(t) = e –H(t) De overlevingsfunctie is gelijk aan het exponentiële negatieve cumulatieve gevaar

functie

Deze conversies worden vaak gebruikt in overlevingsanalysemethoden, zoals hieronder zal worden besproken. Over het algemeen zal een toename van h(t), het momentane gevaar, leiden tot een toename van H(t), het cumulatieve gevaar, wat zich vertaalt in een afname van S(t), de overlevingsfunctie.

Welke aannames moeten worden gemaakt om standaardtechnieken te gebruiken voor time-to-event data?

De belangrijkste veronderstelling bij het analyseren van TTE-gegevens is die van niet-informatieve censuur: individuen die worden gecensureerd hebben dezelfde kans om een ​​volgende gebeurtenis mee te maken als individuen die in het onderzoek blijven. Informatieve censurering is analoog aan niet te negeren ontbrekende gegevens, die de analyse zullen vertekenen. Er is geen definitieve manier om te testen of censuur niet-informatief is, hoewel het onderzoeken van patronen van censuur kan aangeven of een aanname van niet-informatieve censuur redelijk is. Als informatieve censuur wordt vermoed, kunnen gevoeligheidsanalyses, zoals best-case en worst-case scenario's, worden gebruikt om te proberen het effect van informatieve censuur op de analyse te kwantificeren.

Een andere aanname bij het analyseren van TTE-gegevens is dat er voldoende follow-uptijd en aantal gebeurtenissen is voor voldoende statistische power. Hiermee moet rekening worden gehouden in de onderzoeksontwerpfase, aangezien de meeste overlevingsanalyses gebaseerd zijn op cohortonderzoeken.

Aanvullende vereenvoudigende aannames zijn het vermelden waard, omdat deze vaak worden gemaakt in overzichten van overlevingsanalyses. Hoewel deze aannames overlevingsmodellen vereenvoudigen, zijn ze niet nodig om analyses uit te voeren met TTE-gegevens. Geavanceerde technieken kunnen worden gebruikt als deze veronderstellingen worden geschonden:

  • Geen cohorteffect op overleving: neem voor een cohort met een lange rekruteringsperiode aan dat individuen die vroeg toetreden dezelfde overlevingskansen hebben als degenen die laat toetreden

  • Rechts censureren alleen in de data

  • Evenementen zijn onafhankelijk van elkaar

Welke soorten benaderingen kunnen worden gebruikt voor overlevingsanalyse?

Er zijn drie hoofdbenaderingen voor het analyseren van TTE-gegevens: niet-parametrische, semi-parametrische en parametrische benaderingen. De keuze van de te gebruiken benadering moet worden bepaald door de onderzoeksvraag die van belang is. Vaak kan meer dan één benadering op passende wijze worden gebruikt in dezelfde analyse.

Wat zijn niet-parametrische benaderingen voor overlevingsanalyse en wanneer zijn ze geschikt?

Niet-parametrische benaderingen zijn niet afhankelijk van aannames over de vorm of vorm van parameters in de onderliggende populatie. Bij overlevingsanalyse worden niet-parametrische benaderingen gebruikt om de gegevens te beschrijven door de overlevingsfunctie, S(t), samen met de mediaan en kwartielen van overlevingstijd te schatten. Deze beschrijvende statistieken kunnen niet rechtstreeks uit de gegevens worden berekend als gevolg van censurering, waarbij de werkelijke overlevingstijd bij gecensureerde proefpersonen wordt onderschat, wat leidt tot scheve schattingen van het gemiddelde, de mediaan en andere beschrijvingen. Niet-parametrische benaderingen worden vaak gebruikt als de eerste stap in een analyse om onbevooroordeelde beschrijvende statistieken te genereren, en worden vaak gebruikt in combinatie met semi-parametrische of parametrische benaderingen.

Kaplan-Meier schatter

De meest gebruikelijke niet-parametrische benadering in de literatuur is de Kaplan-Meier (of productlimiet) schatter. De Kaplan-Meier-schatter werkt door de schatting van S(t) op te splitsen in een reeks stappen/intervallen op basis van waargenomen gebeurtenistijden. Waarnemingen dragen bij aan de schatting van S(t) totdat de gebeurtenis plaatsvindt of totdat ze worden gecensureerd. Voor elk interval wordt de overlevingskans berekend tot het einde van het interval, aangezien proefpersonen aan het begin van het interval risico lopen (dit wordt gewoonlijk genoteerd als pj =( nj – dj)/nj). De geschatte S(t)voor elke waarde van t is gelijk aan het product van het overleven van elk interval tot en met tijd t. De belangrijkste aannames van deze methode, naast niet-informatieve censuur, is dat censuur plaatsvindt na mislukkingen en dat er geen cohorteffect is op overleving, dus proefpersonen hebben dezelfde overlevingskans, ongeacht wanneer ze in onderzoek kwamen.

De geschatte S(t) van de Kaplan-Meier-methode kan worden uitgezet als een stapsgewijze functie met de tijd op de X-as. Deze grafiek is een leuke manier om de overlevingservaring van het cohort te visualiseren, en kan ook worden gebruikt om de mediaan (wanneer S(t)≤0,5) of kwartielen van overlevingstijd te schatten. Deze beschrijvende statistieken kunnen ook direct worden berekend met behulp van de Kaplan-Meier-schatter. 95%-betrouwbaarheidsintervallen (BI) voor S(t) zijn afhankelijk van transformaties van S(t) om ervoor te zorgen dat het 95%-BI tussen 0 en 1 ligt. De meest gebruikelijke methode in de literatuur is de Greenwood-schatter.

Levenstafel schatter

De overlevingstafelschatter van de overlevingsfunctie is een van de vroegste voorbeelden van toegepaste statistische methoden en wordt al meer dan 100 jaar gebruikt om sterfte in grote populaties te beschrijven. De schatter van de overlevingstafel is vergelijkbaar met de Kaplan-Meier-methode, behalve dat intervallen zijn gebaseerd op kalendertijd in plaats van waargenomen gebeurtenissen. Aangezien levenstafelmethoden zijn gebaseerd op deze kalenderintervallen en niet op individuele gebeurtenissen/censuurtijden, gebruiken deze methoden de gemiddelde grootte van de risicoset per interval om S(t) te schatten en moeten ze aannemen dat censurering uniform plaatsvond over het kalendertijdsinterval. Om deze reden is de levenstafelschatter niet zo nauwkeurig als de Kaplan-Meier-schatter, maar de resultaten zullen vergelijkbaar zijn in zeer grote steekproeven.

Nelson-Aalen schatter

Een ander alternatief voor Kaplan-Meier is de Nelson-Aalen-schatter, die is gebaseerd op het gebruik van een telprocesbenadering om de cumulatieve gevarenfunctie H(t) te schatten. De schatting van H(t) kan dan worden gebruikt om S(t) te schatten. Schattingen van S(t) die met deze methode zijn afgeleid, zullen altijd groter zijn dan de K-M-schatting, maar het verschil tussen de twee methoden in grote steekproeven zal klein zijn.

Kunnen niet-parametrische benaderingen worden gebruikt voor univariabele of multivariabele analyses?

Niet-parametrische benaderingen zoals de Kaplan-Meier-schatter kunnen worden gebruikt om univariabele analyses uit te voeren voor categorische factoren van belang. Factoren moeten categorisch zijn (ofwel van aard of een continue variabele opgedeeld in categorieën) omdat de overlevingsfunctie, S(t), wordt geschat voor elk niveau van de categorische variabele en vervolgens tussen deze groepen wordt vergeleken. De geschatte S(t) voor elke groep kan worden uitgezet en visueel worden vergeleken.

Op rang gebaseerde tests kunnen ook worden gebruikt om het verschil tussen de overlevingscurven statistisch te testen. Deze tests vergelijken het waargenomen en verwachte aantal gebeurtenissen op elk tijdstip tussen groepen, onder de nulhypothese dat de overlevingsfuncties gelijk zijn tussen groepen. Er zijn verschillende versies van deze op rang gebaseerde tests, die verschillen in het gewicht dat aan elk tijdstip wordt gegeven bij de berekening van de teststatistiek. Twee van de meest voorkomende op rang gebaseerde tests die in de literatuur worden gezien, zijn de log rank-test, die elk tijdstip een gelijk gewicht geeft, en de Wilcoxon-test, die elk tijdstip weegt op basis van het aantal proefpersonen dat risico loopt. Op basis van dit gewicht is de Wilcoxon-test gevoeliger voor verschillen tussen curven vroeg in de follow-up, wanneer meer proefpersonen risico lopen. Andere tests, zoals de Peto-Prentice-test, gebruiken gewichten tussen die van de log-rank en de Wilcoxon-tests. Op rang gebaseerde tests zijn onderhevig aan de aanvullende veronderstelling dat censuur onafhankelijk is van de groep, en ze worden allemaal beperkt door weinig vermogen om verschillen tussen groepen te detecteren wanneer overlevingscurven elkaar kruisen. Hoewel deze tests een p-waarde van het verschil tussen curven opleveren, kunnen ze niet worden gebruikt om effectgroottes te schatten (de p-waarde van de log rank-test is echter equivalent aan de p-waarde voor een categorische factor van belang in een univariabele Cox model).

Niet-parametrische modellen zijn beperkt omdat ze geen effectschattingen geven en in het algemeen niet kunnen worden gebruikt om het effect van meerdere factoren van belang te beoordelen (multivariabele modellen). Om deze reden worden niet-parametrische benaderingen vaak gebruikt in combinatie met semi- of volledig parametrische modellen in de epidemiologie, waar multivariabele modellen doorgaans worden gebruikt om te controleren op confounders.

Kunnen Kaplan-Meier-curven worden aangepast?

Het is een veel voorkomende mythe dat Kaplan-Meier-curven niet kunnen worden aangepast, en dit wordt vaak aangehaald als een reden om een ​​parametrisch model te gebruiken dat voor covariaat gecorrigeerde overlevingscurven kan genereren. Er is echter een methode ontwikkeld om aangepaste overlevingscurven te maken met behulp van inverse kansweging (IPW). In het geval van slechts één covariabele kunnen IPW's niet-parametrisch worden geschat en zijn ze gelijk aan directe standaardisatie van de overlevingscurven naar de onderzoekspopulatie. In het geval van meerdere covariaten moeten semi- of volledig parametrische modellen worden gebruikt om de gewichten te schatten, die vervolgens worden gebruikt om voor meerdere covariaten aangepaste overlevingscurven te maken. Voordelen van deze methode zijn dat ze niet onderhevig is aan de aanname van proportionele gevaren, maar dat ze kan worden gebruikt voor in de tijd variërende covariaten en dat ze ook kan worden gebruikt voor continue covariaten.

Waarom hebben we parametrische benaderingen nodig voor het analyseren van time-to-event data?

Een niet-parametrische benadering van de analyse van TTE-gegevens wordt gebruikt om eenvoudig de overlevingsgegevens met betrekking tot de onderzochte factor te beschrijven. Modellen die deze benadering gebruiken, worden ook wel univariabele modellen genoemd. Vaker zijn onderzoekers geïnteresseerd in de relatie tussen verschillende covariaten en de tijd tot gebeurtenis. Het gebruik van semi- en volledig parametrische modellen maakt het mogelijk om de tijd tot een gebeurtenis te analyseren met betrekking tot veel factoren tegelijk, en geeft schattingen van de sterkte van het effect voor elke samenstellende factor.

Wat is een semi-parametrische benadering en waarom wordt deze zo vaak gebruikt?

Het Cox Proportional-model is de meest gebruikte multivariabele benadering voor het analyseren van overlevingsgegevens in medisch onderzoek. Het is in wezen een tijd-tot-gebeurtenis-regressiemodel, dat de relatie beschrijft tussen de incidentie van gebeurtenissen, zoals uitgedrukt door de gevarenfunctie, en een reeks covariabelen. Het Cox-model is als volgt geschreven:

gevarenfunctie, h(t) = h0(t)exp{β1X1 + β2X2 + … + βpXp}

Het wordt beschouwd als een semi-parametrische benadering omdat het model een niet-parametrische component en een parametrische component bevat. De niet-parametrische component is de baseline hazard, h0(t). Dit is de waarde van het gevaar wanneer alle covariaten gelijk zijn aan 0, wat het belang benadrukt van het centreren van de covariaten in het model voor interpreteerbaarheid. Verwar het basislijngevaar niet met het gevaar op tijdstip 0. De basislijnrisicofunctie wordt niet-parametrisch geschat, en dus wordt, in tegenstelling tot de meeste andere statistische modellen, niet aangenomen dat de overlevingstijden een bepaalde statistische verdeling en de vorm van de basislijn volgen gevaar is willekeurig. De baseline-hazardfunctie hoeft niet te worden geschat om conclusies te kunnen trekken over het relatieve gevaar of de hazardratio. Deze functie maakt het Cox-model robuuster dan parametrische benaderingen omdat het niet kwetsbaar is voor een verkeerde specificatie van het basisrisico.

De parametrische component bestaat uit de covariate vector. De covariabele vector vermenigvuldigt het basislijnrisico met dezelfde hoeveelheid, ongeacht de tijd, dus het effect van elke covariabele is op elk moment tijdens de follow-up hetzelfde, en dit is de basis voor de aanname van proportionele gevaren.

Wat is de veronderstelling van proportionele gevaren?

De veronderstelling van proportionele gevaren is essentieel voor het gebruik en de interpretatie van een Cox-model.

Onder deze aanname is er een constante relatie tussen de uitkomst of de afhankelijke variabele en de covariabele vector. De implicaties van deze veronderstelling zijn dat de gevarenfuncties voor twee personen op elk moment in de tijd proportioneel zijn en dat de risicoverhouding niet met de tijd varieert. Met andere woorden, als een persoon een risico op overlijden heeft op een eerste tijdstip dat twee keer zo hoog is als dat van een ander persoon, dan blijft het risico op overlijden op alle latere tijdstippen twee keer zo hoog. Deze aanname houdt in dat de risicocurven voor de groepen proportioneel moeten zijn en elkaar niet mogen kruisen. Omdat deze aanname zo belangrijk is, moet ze zeker worden getest.

Hoe toets je de veronderstelling van proportionele gevaren?

Er zijn verschillende technieken, zowel grafisch als testgebaseerd, om de validiteit van de veronderstelling van proportionele gevaren te beoordelen. Eén techniek is om eenvoudig Kaplan-Meier-overlevingscurven te plotten als u twee groepen zonder covariaten vergelijkt. Als de curven elkaar kruisen, kan de veronderstelling van proportionele gevaren worden geschonden. Een belangrijk voorbehoud bij deze benadering moet in gedachten worden gehouden voor kleine studies. Er kan een grote hoeveelheid fouten zijn in verband met de schatting van overlevingscurven voor onderzoeken met een kleine steekproefomvang, daarom kunnen de curven elkaar kruisen, zelfs als aan de veronderstelling van proportionele risico's wordt voldaan. De complementaire log-log plot is een robuustere test die de logaritme van de negatieve logaritme van de geschatte overlevingsfunctie uitzet tegen de logaritme van de overlevingstijd. Als de gevaren evenredig zijn over groepen, levert deze grafiek parallelle curven op. Een andere veelgebruikte methode voor het testen van de aanname van proportionele gevaren is het opnemen van een tijdinteractieterm om te bepalen of de HR in de loop van de tijd verandert, aangezien tijd vaak de boosdoener is voor niet-proportionaliteit van de gevaren. Bewijs dat de interactieterm groep*tijd niet nul is, is bewijs tegen proportionele risico's.

Wat als de veronderstelling van proportionele gevaren niet opgaat?

Als u merkt dat de PH-aanname niet opgaat, hoeft u niet per se het gebruik van het Cox-model op te geven. Er zijn mogelijkheden om de niet-proportionaliteit in het model te verbeteren. U kunt bijvoorbeeld andere covariaten in het model opnemen, ofwel nieuwe covariaten, niet-lineaire termen voor bestaande covariaten of interacties tussen covariaten. Of u kunt de analyse stratificeren op een of meer variabelen. Dit schat een model waarin het basisrisico binnen elk stratum anders mag zijn, maar de covariabele effecten zijn gelijk over alle strata. Andere opties zijn onder meer het verdelen van de tijd in categorieën en het gebruik van indicatorvariabelen om de risicoverhoudingen in de tijd te laten variëren, en het wijzigen van de analysetijdvariabele (bijv. van verstreken tijd naar leeftijd of vice versa).

Hoe onderzoek je semi-parametrische modelfit?

Naast het controleren op schendingen van de evenredigheidsaanname, zijn er nog andere aspecten van modelfit die moeten worden onderzocht. Statistieken vergelijkbaar met die gebruikt in lineaire en logistische regressie kunnen worden toegepast om deze taken voor Cox-modellen uit te voeren, met enkele verschillen, maar de essentiële ideeën zijn hetzelfde in alle drie de instellingen. Het is belangrijk om de lineariteit van de covariabele vector te controleren, wat kan worden gedaan door de residuen te onderzoeken, net zoals we dat doen bij lineaire regressie. Residuen in TTE-gegevens zijn echter niet zo eenvoudig als bij lineaire regressie, deels omdat de waarde van de uitkomst voor sommige gegevens onbekend is en de residuen vaak scheef zijn. Er zijn verschillende soorten residuen ontwikkeld om de geschiktheid van het Cox-model voor TTE-gegevens te beoordelen. Voorbeelden zijn onder andere Martingale en Schoenfeld. Je kunt ook naar de residuen kijken om zeer invloedrijke en slecht passende observaties te identificeren. Er zijn ook goodness-of-fit-tests die specifiek zijn voor Cox-modellen, zoals de Gronnesby- en Borgan-test, en de Hosmer en Lemeshow prognostische index. U kunt de AIC ook gebruiken om verschillende modellen te vergelijken, hoewel het gebruik van R2 problematisch is.

Waarom een ​​parametrische benadering gebruiken?

Een van de belangrijkste voordelen van semi-parametrische modellen is dat het basisrisico niet hoeft te worden gespecificeerd om de hazard ratio's te schatten die verschillen in het relatieve gevaar tussen groepen beschrijven. Het kan echter zijn dat de schatting van het basisrisico zelf van belang is. In dit geval is een parametrische benadering noodzakelijk. In parametrische benaderingen worden zowel de gevarenfunctie als het effect van de covariabelen gespecificeerd. De hazardfunctie wordt geschat op basis van een veronderstelde verdeling in de onderliggende populatie.

Voordelen van het gebruik van een parametrische benadering van overlevingsanalyse zijn:

  • Parametrische benaderingen zijn informatiever dan niet- en semi-parametrische benaderingen. Naast het berekenen van relatieve effectschattingen, kunnen ze ook worden gebruikt om overlevingstijd, risicopercentages en gemiddelde en mediane overlevingstijden te voorspellen. Ze kunnen ook worden gebruikt om absolute risicovoorspellingen in de loop van de tijd te doen en om voor covariaat gecorrigeerde overlevingscurven te plotten.

  • Wanneer de parametrische vorm correct is gespecificeerd, hebben parametrische modellen meer kracht dan semi-parametrische modellen. Ze zijn ook efficiënter, wat leidt tot kleinere standaardfouten en nauwkeurigere schattingen.

  • Parametrische benaderingen zijn afhankelijk van de maximale waarschijnlijkheid om parameters te schatten.

  • Restanten van parametrische modellen nemen de bekende vorm aan van het verschil in waargenomen versus verwacht.

Het belangrijkste nadeel van het gebruik van een parametrische benadering is dat deze gebaseerd is op de aanname dat de onderliggende populatieverdeling correct is gespecificeerd. Parametrische modellen zijn niet bestand tegen verkeerde specificatie, daarom komen semi-parametrische modellen vaker voor in de literatuur en zijn ze minder riskant om te gebruiken wanneer er onzekerheid bestaat over de onderliggende populatieverdeling.

Hoe kies je de parametrische vorm?

De keuze van de juiste parametrische vorm is het moeilijkste onderdeel van parametrische overlevingsanalyse. De specificatie van de parametrische vorm moet worden bepaald door de onderzoekshypothese, samen met voorkennis en biologische aannemelijkheid van de vorm van het baselinegevaar. Als bijvoorbeeld bekend is dat het risico op overlijden direct na de operatie dramatisch toeneemt en vervolgens afneemt en afvlakt, zou het ongepast zijn om de exponentiële verdeling te specificeren, die een constant risico in de tijd veronderstelt. De gegevens kunnen worden gebruikt om te beoordelen of de gespecificeerde vorm bij de gegevens lijkt te passen, maar deze gegevensgestuurde methoden moeten hypothesegestuurde selecties aanvullen en niet vervangen.

Wat is het verschil tussen een proportioneel risicomodel en een versneld faaltijdmodel?

Hoewel het Cox-model voor proportionele gevaren semi-parametrisch is, kunnen modellen voor proportionele gevaren ook parametrisch zijn. Parametrische proportionele gevarenmodellen kunnen worden geschreven als:

h(t,X) = h0(t)exp(Xi β) = h0(t)λ

waarbij het basislijngevaar, h0(t), alleen afhangt van tijd, t, maar niet van X, en λ een eenheidsspecifieke functie van covariabelen is, die niet afhankelijk is van t, die de basislijnrisicofunctie omhoog of omlaag schaalt. λ kan niet negatief zijn. In dit model is de hazard rate een multiplicatieve functie van de baseline hazard en kunnen de hazard ratio's op dezelfde manier worden geïnterpreteerd als in het semi-parametrische proportionele hazards-model.

Accelerated Failure Time (AFT)-modellen zijn een klasse van parametrische overlevingsmodellen die kunnen worden gelineariseerd door de natuurlijke logaritme van het overlevingstijdmodel te nemen. Het eenvoudigste voorbeeld van een AFT-model is het exponentiële model, dat wordt geschreven als:

ln (T) = β0 + β1X1 +.... + βpXp + ε *

Het belangrijkste verschil tussen AFT-modellen en PH-modellen is dat AFT-modellen ervan uitgaan dat effecten van covariaten multiplicatief zijn op tijdschaal, terwijl Cox-modellen de gevarenschaal gebruiken zoals hierboven weergegeven. Parameterschattingen van AFT-modellen worden geïnterpreteerd als effecten op de tijdschaal, die de overlevingstijd kunnen versnellen of vertragen. Exp(β)>1 uit een AFT-model betekent dat de factor de overlevingstijd versnelt, of tot een langere overleving leidt. Exp(β)<1 decelerates survival time (shorter survival). AFT models assume that estimated time ratios are constant across the time scale. A time ratio of 2, for example, can be interpreted as the median time to death in group 1 is double the median time to death in group 2 (indicated longer survival for group 1).

Sommige foutverdelingen kunnen worden geschreven en geïnterpreteerd als zowel PH- als AFT-modellen (dwz exponentieel, Weibull), andere zijn alleen PH (dwz Gompertz) of alleen AFT-modellen (dwz log-logistiek) en andere zijn geen PH- of AFT-modellen (bijv. een spline plaatsen).

Welke vormen kunnen parametrische modellen aannemen?

De hazardfunctie kan elke vorm aannemen zolang h(t)>0 voor alle waarden van t. Hoewel de primaire overweging voor de parametrische vorm voorafgaande kennis van de vorm van het basislijngevaar moet zijn, heeft elke distributie zijn eigen voor- en nadelen. Enkele van de meest voorkomende vormen zullen kort worden uitgelegd, met meer informatie in de bronnenlijst.

Exponentiële verdeling

De exponentiële verdeling veronderstelt dat h(t) alleen afhangt van modelcoëfficiënten en covariaten en constant is in de tijd. Het belangrijkste voordeel van dit model is dat het zowel een proportioneel risicomodel als een versneld faaltijdmodel is, zodat effectschattingen kunnen worden geïnterpreteerd als ofwel hazard ratio's ofwel tijdsverhoudingen. Het belangrijkste nadeel van dit model is dat het vaak onaannemelijk is om een ​​constant gevaar in de tijd aan te nemen.

Weibull-distributie

De Weibull-verdeling is vergelijkbaar met de exponentiële verdeling. Terwijl de exponentiële verdeling uitgaat van een constant gevaar, gaat de Weibull-verdeling uit van een monotoon gevaar dat zowel toenemend als afnemend kan zijn, maar niet beide. Het heeft twee parameters. De vormparameter (σ ) bepaalt of het gevaar toeneemt (σ1 ) (in de exponentiële verdeling is deze parameter ingesteld op 1). De schaalparameter, (1/σ)exp(-β0/σ), bepaalt de schaal van deze toename/afname. Aangezien de Weibull-verdeling vereenvoudigt tot de exponentiële verdeling wanneer σ = 1, kan de nulhypothese dat σ = 1 worden getest met behulp van een Wald-test. Het grote voordeel van dit model is dat het zowel een PH- als een AFT-model is, zodat zowel de hazard ratio als de tijd ratio geschat kunnen worden. Nogmaals, het belangrijkste nadeel is dat de aanname van eentonigheid van het basisrisico in sommige gevallen ongeloofwaardig kan zijn.

nba mobiele munt hack

Gompertz-distributie

De Gompertz-verdeling is een PH-model dat gelijk is aan de log-Weibull-verdeling, dus de log van de hazardfunctie is lineair in t. Deze verdeling heeft een exponentieel toenemend faalpercentage en is vaak geschikt voor actuariële gegevens, omdat het risico op sterfte ook exponentieel toeneemt in de tijd.

Log-logistieke distributie

De log-logistieke verdeling is een AFT-model met een foutterm die de standaard logistieke verdeling volgt. Het kan passen bij niet-monotone gevaren, en past over het algemeen het beste wanneer het onderliggende gevaar een piek bereikt en vervolgens daalt, wat aannemelijk kan zijn voor bepaalde ziekten zoals tuberculose. De log-logistieke verdeling is geen PH-model, maar een proportioneel odds-model. Dit betekent dat het onderhevig is aan de proportionele odds-aanname, maar het voordeel is dat hellingscoëfficiënten kunnen worden geïnterpreteerd als tijdratio's en ook als oddsratio's. Een odds ratio van 2 uit een parametrisch log-logistiek model zou bijvoorbeeld worden geïnterpreteerd als de overlevingskans na tijd t bij proefpersonen met x=1 is twee keer zo groot als bij proefpersonen met x=0.

Gegeneraliseerde Gamma (GG) Distributie

De gegeneraliseerde gamma (GG)-verdeling is eigenlijk een familie van verdelingen die bijna alle meest gebruikte verdelingen bevat, inclusief de exponentiële, Weibull-, log-normale en gamma-verdelingen. Dit maakt vergelijkingen tussen de verschillende distributies mogelijk. De GG-familie omvat ook alle vier de meest voorkomende typen gevaarfuncties, wat de GG-verdeling bijzonder nuttig maakt, aangezien de vorm van de gevaarfunctie kan helpen bij het optimaliseren van de modelselectie.

Splines-benadering:

Aangezien de enige algemene beperking van de specificatie van de baseline-hazardfunctie is dath(t)>0 voor alle waarden van t, kunnen splines worden gebruikt voor maximale flexibiliteit bij het modelleren van de vorm van het baseline-gevaar. Beperkte kubische splines zijn een methode die onlangs in de literatuur is aanbevolen voor parametrische overlevingsanalyse, omdat deze methode flexibiliteit in de vorm mogelijk maakt, maar de functie beperkt om lineair te zijn aan uiteinden waar gegevens schaars zijn. Splines kunnen worden gebruikt om de schatting te verbeteren en zijn ook voordelig voor extrapolatie, omdat ze zo goed mogelijk passen bij de waargenomen gegevens. Indien correct gespecificeerd, mogen effectschattingen van modellen die passen met behulp van splines niet vertekend zijn. Net als bij andere regressieanalyses, kunnen uitdagingen bij het passen van splines het kiezen van het aantal en de locatie van de knopen en problemen met overpassen omvatten.

Hoe onderzoek je parametrische modelfit?

Het belangrijkste onderdeel van het beoordelen van parametrische modelfit is om te controleren of de gegevens de gespecificeerde parametrische vorm ondersteunen. Dit kan visueel worden beoordeeld door het op het model gebaseerde cumulatieve gevaar uit te zetten tegen de Kaplan-Meier geschatte cumulatieve gevaarfunctie. Als de opgegeven vorm correct is, moet de grafiek door de oorsprong gaan met een helling van 1. De Grønnesby-Borgan goodness-of-fit-test kan ook worden gebruikt om te bepalen of het waargenomen aantal gebeurtenissen significant afwijkt van het verwachte aantal gebeurtenissen in groepen die worden onderscheiden door risicoscores. Deze test is zeer gevoelig voor het aantal gekozen groepen en heeft de neiging de nulhypothese van adequate fit te ruim te verwerpen als er veel groepen worden gekozen, vooral in kleine datasets. De test mist echter de kracht om modelovertredingen te detecteren als er te weinig groepen worden gekozen. Om deze reden lijkt het onverstandig om alleen te vertrouwen op een goodness-of-fit-test om te bepalen of de gespecificeerde parametrische vorm redelijk is.

AIC kan ook worden gebruikt om modellen met verschillende parametrische vormen te vergelijken, waarbij de laagste AIC de beste pasvorm aangeeft. AIC kan echter niet worden gebruikt om parametrische en semi-parametrische modellen te vergelijken, aangezien parametrische modellen zijn gebaseerd op waargenomen gebeurtenistijden en semi-parametrische modellen zijn gebaseerd op de volgorde van gebeurtenistijden. Nogmaals, deze tools moeten worden gebruikt om te onderzoeken of de gespecificeerde vorm past bij de gegevens, maar plausibiliteit van het gespecificeerde onderliggende gevaar is nog steeds het belangrijkste aspect bij het kiezen van een parametrische vorm.

Zodra is vastgesteld dat de gespecificeerde parametrische vorm goed bij de gegevens past, kunnen vergelijkbare methoden als eerder beschreven voor semi-proportionele gevarenmodellen worden gebruikt om te kiezen tussen verschillende modellen, zoals residuele plots en goodness-of-fit-tests.

Wat als voorspellers in de loop van de tijd veranderen?

In de hierboven geschreven modelverklaringen zijn we ervan uitgegaan dat de blootstellingen constant zijn in de loop van de follow-up. Blootstellingen met waarden die in de loop van de tijd veranderen, of in de tijd variërende covariaten, kunnen in overlevingsmodellen worden opgenomen door de eenheid van de analyse te wijzigen van het individu naar de tijdsperiode waarin de blootstelling constant is. Dit verdeelt de persoon-tijd van individuen in intervallen die elke persoon bijdraagt ​​aan de risicoset van blootgesteld en niet-blootgesteld voor die covariabele. De belangrijkste aanname van het op deze manier opnemen van een in de tijd variërende covariaat is dat het effect van de in de tijd variërende covariaat niet afhankelijk is van de tijd.

Voor een Cox-model voor proportioneel gevaar zou het opnemen van een in de tijd variërende covariabele de vorm aannemen van: h(t) = h0(t)e^β1x1(t). Tijdvariërende covariaten kunnen ook worden opgenomen in parametrische modellen, hoewel het iets gecompliceerder en moeilijker te interpreteren is. Parametrische modellen kunnen ook in de tijd variërende covariaten modelleren met behulp van splines voor meer flexibiliteit.

Over het algemeen moeten in de tijd variërende covariabelen worden gebruikt wanneer wordt verondersteld dat het gevaar meer afhangt van latere waarden van de covariabele dan de waarde van de covariabele bij baseline. Uitdagingen die zich voordoen met in de tijd variërende covariaten zijn ontbrekende gegevens over de covariaat op verschillende tijdstippen, en een mogelijke vertekening in de schatting van het gevaar als de in de tijd variërende covariaat eigenlijk een bemiddelaar is.

Wat is een concurrerende risicoanalyse?

Traditionele overlevingsanalysemethoden gaan ervan uit dat er slechts één type gebeurtenis van belang plaatsvindt. Er bestaan ​​echter meer geavanceerde methoden om het onderzoek naar verschillende soorten gebeurtenissen in hetzelfde onderzoek mogelijk te maken, zoals overlijden door meerdere oorzaken. Voor deze onderzoeken wordt gebruik gemaakt van een concurrerende risicoanalyse waarbij de overlevingsduur wordt beëindigd door de eerste van meerdere gebeurtenissen. Er zijn speciale methoden nodig omdat het analyseren van de tijd tot elke gebeurtenis afzonderlijk vertekend kan zijn. Specifiek in deze context heeft de KM-methode de neiging om het aandeel proefpersonen dat gebeurtenissen meemaakt te overschatten. De analyse van concurrerende risico's maakt gebruik van de cumulatieve incidentiemethode, waarbij de algehele kans op een gebeurtenis op elk moment de som is van de gebeurtenisspecifieke kansen. De modellen worden over het algemeen geïmplementeerd door elke studiedeelnemer meerdere keren in te voeren - één per gebeurtenistype. Voor elke studiedeelnemer wordt de tijd tot een gebeurtenis gecensureerd op het tijdstip waarop de patiënt de eerste gebeurtenis meemaakte. Voor meer informatie, zie de advancedepidemiology.org pagina op: concurrerende risico's .

Wat zijn kwetsbaarheidsmodellen en waarom zijn ze nuttig voor gecorreleerde data?

Gecorreleerde overlevingsgegevens kunnen ontstaan ​​als gevolg van terugkerende gebeurtenissen die een individu heeft meegemaakt of wanneer observaties worden geclusterd in groepen. Ofwel vanwege een gebrek aan kennis of vanwege de haalbaarheid, kunnen sommige covariaten die verband houden met de gebeurtenis van belang niet worden gemeten. Kwetsbaarheidsmodellen verklaren de heterogeniteit die wordt veroorzaakt door ongemeten covariaten door willekeurige effecten toe te voegen, die multiplicatief werken op de gevarenfunctie. Frailty-modellen zijn in wezen uitbreidingen van het Cox-model met de toevoeging van willekeurige effecten. Hoewel er verschillende classificatieschema's en nomenclatuur zijn die worden gebruikt om deze modellen te beschrijven, zijn er vier veelvoorkomende typen kwetsbaarheidsmodellen: gedeelde, geneste, gezamenlijke en additieve kwetsbaarheid.

Zijn er andere benaderingen voor het analyseren van terugkerende gebeurtenisgegevens?

Gegevens over terugkerende gebeurtenissen zijn gecorreleerd omdat er meerdere gebeurtenissen kunnen plaatsvinden binnen hetzelfde onderwerp. Hoewel kwetsbaarheidsmodellen een methode zijn om deze correlatie in analyses van terugkerende gebeurtenissen te verklaren, is een meer eenvoudige benadering die ook deze correlatie kan verklaren, het gebruik van robuuste standaardfouten (SE). Met de toevoeging van robuuste SE's kan analyse van terugkerende gebeurtenissen worden uitgevoerd als een eenvoudige uitbreiding van semi-parametrische of parametrische modellen.

Hoewel eenvoudig te implementeren, zijn er meerdere manieren om terugkerende gebeurtenisgegevens te modelleren met behulp van robuuste SE's. Deze benaderingen verschillen in de manier waarop ze de risicoset voor elk recidief definiëren. Op deze manier beantwoorden ze enigszins verschillende onderzoeksvragen, zodat de keuze van de te gebruiken modelleringsaanpak gebaseerd moet zijn op de onderzoekshypothese en de validiteit van de modelleringsaannames.

Het telproces, of Andersen-Gill, benadering van terugkerende gebeurtenismodellering gaat ervan uit dat elke herhaling een onafhankelijke gebeurtenis is en houdt geen rekening met de volgorde of het type gebeurtenis. In dit model begint de follow-uptijd voor elk onderwerp aan het begin van het onderzoek en wordt deze opgedeeld in segmenten die worden gedefinieerd door gebeurtenissen (recidief). Onderwerpen dragen bij aan de risicoset voor een gebeurtenis zolang ze op dat moment worden geobserveerd (niet gecensureerd). Deze modellen zijn eenvoudig te passen als een Cox-model met de toevoeging van een robuuste SE-schatter, en hazard ratio's worden geïnterpreteerd als het effect van de covariabele op het recidiefpercentage gedurende de follow-upperiode. Dit model zou echter ongepast zijn als de onafhankelijkheidsveronderstelling niet redelijk is.

Voorwaardelijke benaderingen gaan ervan uit dat een proefpersoon geen risico loopt op een volgende gebeurtenis totdat een eerdere gebeurtenis plaatsvindt, en houden daarom rekening met de volgorde van de gebeurtenissen. Ze worden aangepast met behulp van een gestratificeerd model, met het gebeurtenisnummer (of het aantal herhalingen, in dit geval) als de stratavariabele en inclusief robuuste SE's. Er zijn twee verschillende conditionele benaderingen die verschillende tijdschalen gebruiken en dus verschillende risicosets hebben. De conditionele waarschijnlijkheidsbenadering gebruikt de tijd sinds het begin van het onderzoek om de tijdsintervallen te definiëren, en is geschikt wanneer de interesse ligt bij het volledige verloop van het proces van terugkerende gebeurtenissen. De gap-time-benadering stelt in wezen de klok voor elke herhaling opnieuw in door de tijd sinds de vorige gebeurtenis te gebruiken om tijdsintervallen te definiëren, en is meer geschikt wanneer gebeurtenis- (of herhaling)-specifieke effectschattingen van belang zijn.

Ten slotte beschouwen marginale benaderingen (ook bekend als de WLW-Wei, Lin en Weissfeld-benadering) elke gebeurtenis als een afzonderlijk proces, zodat proefpersonen vanaf het begin van de follow-up risico lopen op alle gebeurtenissen, ongeacht of ze een voorafgaande gebeurtenis. Dit model is geschikt wanneer wordt aangenomen dat de gebeurtenissen het gevolg zijn van verschillende onderliggende processen, zodat een proefpersoon bijvoorbeeld een 3e gebeurtenis kan ervaren zonder de 1e te ervaren. Hoewel deze aanname bij sommige soorten gegevens, zoals recidieven van kanker, ongeloofwaardig lijkt, zou het kunnen worden gebruikt om recidieven van letsels over een bepaalde periode te modelleren, wanneer proefpersonen verschillende soorten verwondingen kunnen ervaren gedurende de tijdsperiode die geen natuurlijke volgorde hebben. Marginale modellen kunnen ook worden aangepast met behulp van gestratificeerde modellen met robuuste SE's.

Lezingen

Dit project had tot doel de methodologische en analytische beslissingen te beschrijven waarmee men te maken kan krijgen bij het werken met time-to-event data, maar het is zeker niet uitputtend. Hieronder vindt u bronnen om dieper op deze onderwerpen in te gaan.

Studieboeken en hoofdstukken

Vittinghoff E, Glidden DV, Shiboski SC, McCulloch CE (2012). Regressiemethoden in biostatistiek, 2e New York, NY: Springer.

  • Inleidende tekst voor modellen voor lineaire, logistieke, overlevings- en herhaalde metingen, het beste voor diegenen die een basisbeginpunt willen.

  • Het hoofdstuk over overlevingsanalyse biedt een goed overzicht, maar geen diepgang. Voorbeelden zijn op STATA gebaseerd.

Hosmer DW, Lemeshow S, May S. (2008) Toegepaste overlevingsanalyse: regressiemodellering van tijd-tot-eventgegevens, 2e druk. Hoboken, NJ: John Wiley & Sons, Inc.

  • Diepgaand overzicht van niet-parametrische, semi-parametrische en parametrische Cox-modellen, het beste voor diegenen die kennis hebben van andere statistiekgebieden. Geavanceerde technieken worden niet diepgaand behandeld, maar er worden verwijzingen naar andere speciale leerboeken gegeven.

Kleinbaum DG, Klein M (2012). Overlevingsanalyse: een zelflerende tekst, 3e druk. New York, NY: Springer Science + Business Media, LLC

  • Uitstekende inleidende tekst

Klein JP, Moeschberger ML (2005). Overlevingsanalyse: technieken voor gecensureerde en afgekapte gegevens, 2e druk. New York, NY: Springer Science + Business Media, LLC

  • Dit boek is ontworpen voor afgestudeerde studenten en biedt veel praktische voorbeelden

Therneau TM, Grambsch PM (2000). Modellering van overlevingsgegevens: uitbreiding van het Cox-model. New York, NY: Springer Science + Business Media, LLC

  • Goede introductie tot de telprocesbenadering en het analyseren van gecorreleerde overlevingsgegevens. De auteur schreef ook het overlevingspakket in R

Allison PD (2010). Overlevingsanalyse met behulp van SAS: een praktijkgids, 2e ed. Cary, NC: SAS Institute

  • Een geweldige toegepaste tekst voor SAS-gebruikers

Bagdonavicius V, Nikulin M (2002). Versnelde levensmodellen: modellering en statistische analyse. Boca Raton, FL: Chapman & Hall/CRC Press.

  • Goede bron voor meer informatie over parametrische en semi-parametrische versnelde faaltijdmodellen en hoe deze zich verhouden tot proportionele gevarenmodellen

Methodologische artikelen

Inleidende/overzichtsartikelen

Hougaard P (1999). Grondbeginselen van overlevingsgegevens. Biometrie 55(1): 13-22. PMID: 11318147 .

Clark TG, Bradburn MJ, Liefde SB, Altman DG (2003). Overlevingsanalyse deel I: basisconcepten en eerste analyses. Br J Kreeft 89 (2): 232-8. PMID: 12865907

Clark TG, Bradburn MJ, Liefde SB, Altman DG (2003). Overlevingsanalyse deel II: multivariate data-analyse - een inleiding tot concepten en methoden. Br J Kreeft 89 (3): 431-6. PMID: 1288808

Clark TG, Bradburn MJ, Liefde SB, Altman DG (2003). Overlevingsanalyse deel II: multivariate gegevensanalyse: een model kiezen en de geschiktheid en geschiktheid ervan beoordelen. Br J Kreeft 89 (4): 605-11. PMID: 12951864

Clark TG, Bradburn MJ, Liefde SB, Altman DG (2003). Overlevingsanalyse deel IV: verdere concepten en methoden in overlevingsanalyse. Br J Kreeft 89 (5): 781-6. PMID: 12942105

  • De serie van vier artikelen hierboven is een uitstekend inleidend overzicht van methoden in overlevingsanalyse die buitengewoon goed geschreven en gemakkelijk te begrijpen is - het wordt ten zeerste aanbevolen.

Leeftijd als tijdschaal

Korn EL, Graubard BI, Midthune D (1997). Tijd-tot-gebeurtenisanalyse van longitudinale follow-up van een enquête: keuze van de tijdschaal. Am J Epidemiol 145(1):72-80. PMID: 8982025

  • Paper waarin wordt gepleit voor het gebruik van leeftijd als tijdschaal in plaats van tijd voor studie.

Ingram DD, Makuc DM, Feldman JJ (1997). Betreft: Time-to-event analyse van longitudinale follow-up van een enquête: keuze van de tijdschaal. Am J Epidemiol 146(6):528-9. PMID: 9290515 .

  • Geef commentaar op het artikel van Korn waarin de voorzorgsmaatregelen worden beschreven die moeten worden genomen bij het gebruik van leeftijd als tijdschaal.

Thiébaut AC, Benichou J (2004). Keuze van tijdschaal in Cox's modelanalyse van epidemiologische cohortgegevens: een simulatiestudie. Stat Med 30;23(24):3803-20. PMID: 15580597

  • Simulatiestudie die de omvang van de vertekening laat zien voor verschillende graden van associatie tussen leeftijd en de covariabele van belang bij het gebruik van tijd op studie als tijdschaal.

Canchola AJ, Stewart SL, Bernstein L, et al. Cox-regressie met verschillende tijdschalen. Verkrijgbaar bij: http://www.lexjansen.com/wuss/2003/DataAnalysis/i-cox_time_scales.pdf .

  • Een mooi artikel waarin 5 Cox-regressiemodellen worden vergeleken met variaties op tijd op studie of leeftijd als de tijdschaal met SAS-code.

censureren

Huang CY, Ning J, Qin J (2015). Semiparametrische waarschijnlijkheidsinferentie voor links-afgekapte en rechts-gecensureerde gegevens. Biostatistieken [epub] PMID: 25796430 .

  • Dit artikel biedt een mooie inleiding tot de analyse van gecensureerde gegevens en biedt een nieuwe schattingsprocedure voor de overlevingstijdverdeling met links-afgekapte en rechts-gecensureerde gegevens. Het is erg compact en heeft een geavanceerde statistische focus.

Cain KC, Harlow SD, Little RJ, Nan B, Yosef M, Taffe JR, Elliott MR (2011). Bias als gevolg van afknotting van links en censurering van links in longitudinale studies van ontwikkelings- en ziekteprocessen. Am J Epidemiol 173 (9): 1078-84. PMID: 21422059 .

  • Een uitstekende bron die de vooringenomenheid verklaart die inherent is aan links-gecensureerde gegevens vanuit een epidemiologisch perspectief.

Zon J, Zon L, Zhu C (2007). Testen van het proportionele odds-model voor interval-gecensureerde data. Lifetime Data Anal 13:37-50. PMID 17160547 .

  • Nog een statistisch uitgebreid artikel over een genuanceerd aspect van TTE-gegevensanalyse, maar geeft een goede uitleg van intervalgecensureerde gegevens.

Robins JM (1995a) Een analytische methode voor gerandomiseerde onderzoeken met informatieve censuur: Deel I. Lifetime Data Anal 1: 241–254. PMID 9385104 .

Robins JM (1995b) Een analytische methode voor gerandomiseerde studies met informatieve censuur: deel II. Levenslange gegevens Anal 1: 417-434. PMID 9385113 .

  • Twee papers die methoden bespreken om met informatieve censuur om te gaan.

Niet-parametrische overlevingsmethoden

Borgan Ø (2005) Kaplan-Meier-schatter. Encyclopedia of Biostatistics DOI: 10.1002 / 0470011815.b2a11042

  • Uitstekend overzicht van de Kaplan-Meier-schatter en de relatie met de Nelson-Aalen-schatter

Rodríguez G (2005). Niet-parametrische schatting in overlevingsmodellen. Beschikbaar van: http://data.princeton.edu/pop509/NonParametricSurvival.pdf

  • Inleiding tot niet-parametrische methoden en het Cox proportionele gevaarmodel dat de relaties tussen methoden verklaart met de wiskundige formules

Cole SR, Hernan MA (2004). Aangepaste overlevingscurven met inverse kansgewichten. Berekeningsmethoden Programma's Biomed 75(1): 35-9. PMID: 15158046

  • Beschrijft het gebruik van IPW om aangepaste Kaplan-Meier-curven te maken. Bevat een voorbeeld en SAS-macro.

ZhangM (2015). Robuuste methoden om de efficiëntie te verbeteren en vertekening te verminderen bij het schatten van overlevingscurven in gerandomiseerde klinische onderzoeken. Levenslange gegevens Anaal 21(1): 119-37. PMID: 24522498

  • Voorgestelde methode voor covariaat-aangepaste overlevingscurven in RCT's

Semi-parametrische overlevingsmethoden

Cox DR (1972) Regressiemodellen en overlevingstafels (met discussie). JR Statist Soc B 34: 187-220.

  • De klassieke referentie.

Christensen E (1987) Multivariate overlevingsanalyse met behulp van het regressiemodel van Cox. Hepatology 7: 1346-1358. PMID 3679094 .

  • Beschrijft het gebruik van het Cox-model aan de hand van een motiverend voorbeeld. Uitstekende beoordeling van de belangrijkste aspecten van Cox-modelanalyse, inclusief hoe een Cox-model te passen en het controleren van modelaannames.

    nba mobiele munt hack

Grambsch PM, Therneau TM (1994) Proportionele gevarentests en diagnostiek op basis van gewogen residuen. Biometrika 81: 515-526.

  • Een diepgaand document over het testen van de veronderstelling van proportionele gevaren. Goede mix van theorie en geavanceerde statistische uitleg.

Ng'andu NH (1997) Een empirische vergelijking van statistische tests voor het beoordelen van de aanname van proportionele gevaren van het model van Cox. Stat Med 16: 611-626. PMID 9131751 .

  • Nog een diepgaand artikel over het testen van de veronderstelling van proportionele gevaren, dit omvat een bespreking van het controleren van residuen en effecten van censuur.

Parametrische overlevingsmethoden

Rodrίguez, G (2010). Parametrische overlevingsmodellen. Beschikbaar van: http://data.princeton.edu/pop509/ParametricSurvival.pdf

  • korte inleiding tot de meest voorkomende verdelingen die worden gebruikt in parametrische overlevingsanalyse

Nardi A, Schepper M (2003). Vergelijking van Cox- en parametrische modellen in klinische onderzoeken. Stat Med 22 (23): 2597-610. PMID: 14652863

  • Geeft goede voorbeelden van het vergelijken van semi-parametrische modellen met modellen die gebruik maken van gemeenschappelijke parametrische distributies en richt zich op het beoordelen van modelfit

Royston P, Parmar MK (2002). Flexibele parametrische modellen voor proportionele risico's en proportionele kansen voor gecensureerde overlevingsgegevens, met toepassing op prognostische modellering en schatting van behandelingseffecten. Stat Med 21 (15): 2175-97. PMID: 12210632

  • Goede uitleg voor de basisprincipes van proportionele hazards en odds-modellen en vergelijkingen met kubische splines

Cox C, Chu H, Schneider MF, Muñoz A (2007). Parametrische overlevingsanalyse en taxonomie van gevarenfuncties voor de gegeneraliseerde gammaverdeling. Statist Med 26:4352-4374. PMID 17342754 .

  • Biedt een uitstekend overzicht van parametrische overlevingsmethoden, inclusief een taxonomie van de gevarenfuncties en een diepgaande bespreking van de gegeneraliseerde gamma-distributiefamilie.

Crowther MJ, Lambert PC (2014). Een algemeen raamwerk voor parametrische overlevingsanalyse. Stat Med 33 (30): 5280-97. PMID: 25220693

  • Beschrijft beperkende veronderstellingen van veelgebruikte parametrische distributies en verklaart beperkte kubieke spline-methodologie

Sparling YH, Younes N, Lachin JM, Bautista OM (2006). Parametrische overlevingsmodellen voor intervalgecensureerde gegevens met tijdafhankelijke covariaten. Biometrie 7 (4): 599-614. PMID: 16597670

  • Uitbreiding en voorbeeld van het gebruik van parametrische modellen met intervalgecensureerde gegevens

Tijdsafhankelijke covariaten

Fisher LD, Lin DY (1999). Tijdafhankelijke covariaten in het Cox-regressiemodel met proportionele gevaren. Annu Rev Volksgezondheid 20: 145-57. PMID: 10352854

  • Grondige en gemakkelijk te begrijpen uitleg van in de tijd variërende covariaten in Cox-modellen, met een wiskundige appendix

PetersenT (1986). Parametrische overlevingsmodellen inpassen met tijdsafhankelijke covariaten. Appl-statistiek 35 (3): 281-88.

  • Dicht artikel, maar met een bruikbaar toegepast voorbeeld

Concurrerende risicoanalyse

Zie Concurrerende risico's

Tai B, Machin D, White I, Gebski V (2001) Concurrerende risicoanalyse van patiënten met osteosarcoom: een vergelijking van vier verschillende benaderingen. Stat Med 20: 661-684. PMID 11241570 .

  • Goed diepgaand artikel dat vier verschillende methoden beschrijft voor het analyseren van concurrerende risicogegevens, en gegevens uit een gerandomiseerde studie van patiënten met osteosarcoom gebruikt om deze vier benaderingen te vergelijken.

Checkley W, Brower RG, Muñoz A (2010). Inferentie voor elkaar uitsluitende concurrerende gebeurtenissen door een mengsel van gegeneraliseerde gammaverdelingen. Epidemiologie 21 (4): 557-565. PMID 20502337 .

  • Paper over concurrerende risico's met behulp van de gegeneraliseerde gammaverdeling.

Analyse van geclusterde gegevens en kwetsbaarheidsmodellen

Yamaguchi T, Ohashi Y, Matsuyama Y (2002) Proportionele risicomodellen met willekeurige effecten om centrumeffecten te onderzoeken in multicenter klinische onderzoeken naar kanker. Stat-methoden Med Res 11: 221-236. PMID 12094756 .

  • Een paper met uitstekende theoretische en wiskundige uitleg over het in aanmerking nemen van clustering bij het analyseren van overlevingsgegevens van klinische onderzoeken in meerdere centra.

O'Quigley J, Stare J (2002) Proportionele gevarenmodellen met kwetsbaarheden en willekeurige effecten. Stat Med 21: 3219-3233. PMID 12375300 .

  • Een onderlinge vergelijking van kwetsbaarheidsmodellen en modellen voor willekeurige effecten.

Balakrishnan N, Peng Y (2006). Gegeneraliseerd gamma kwetsbaarheidsmodel. Statist Med 25: 2797-2816. PMID

  • Een paper over kwetsbaarheidsmodellen die de gegeneraliseerde gammaverdeling gebruiken als de kwetsbaarheidsverdeling.

Rondeau V, Mazroui Y, Gonzalez JR (2012). frailtypack: een R-pakket voor de analyse van gecorreleerde overlevingsgegevens met kwetsbaarheidsmodellen met behulp van bestrafte waarschijnlijkheidsschatting of parametrische schatting. Tijdschrift voor statistische software 47 (4): 1-28.

  • R-pakketvignet met goede achtergrondinformatie over kwetsbaarheidsmodellen.

Schaubel DE, Cai J (2005). Analyse van geclusterde gegevens over terugkerende gebeurtenissen met toepassing op ziekenhuisopnames bij patiënten met nierfalen. Biostatistieken 6(3):404-19. PMID 15831581 .

  • Uitstekend artikel waarin de auteurs twee methoden presenteren om geclusterde gegevens over terugkerende gebeurtenissen te analyseren, en vervolgens de resultaten van de voorgestelde modellen vergelijken met die op basis van een kwetsbaarheidsmodel.

Gharibvand L, Liu L (2009). Analyse van overlevingsgegevens met geclusterde gebeurtenissen. SAS Global Forum 2009 Papier 237-2009.

  • Beknopte en gemakkelijk te begrijpen bron voor analyse van tijd tot gebeurtenisgegevens met geclusterde gebeurtenissen met SAS-procedures.

Analyse van terugkerende gebeurtenissen

Twisk JW, Smidt N, de Vente W (2005). Toegepaste analyse van terugkerende gebeurtenissen: een praktisch overzicht. J Epidemiol Community Health 59 (8): 706-10. PMID: 16020650

  • Zeer eenvoudig te begrijpen introductie tot modellering van terugkerende gebeurtenissen en het concept van risicosets

Villegas R, Juliá O, Ocaña J (2013). Empirische studie van gecorreleerde overlevingstijden voor terugkerende gebeurtenissen met proportionele risicomarges en het effect van correlatie en censurering.BMC Med Res Methodol 13:95. PMID: 23883000

  • Gebruikt simulaties om de robuustheid van verschillende modellen voor terugkerende gebeurtenisgegevens te testen

Kelly PJ, Lim LL (2000). Overlevingsanalyse voor terugkerende gebeurtenisgegevens: een toepassing op infectieziekten bij kinderen. Stat Med 19 (1): 13-33. PMID: 10623190

  • Toegepaste voorbeelden van de vier belangrijkste benaderingen voor het modelleren van terugkerende gebeurtenisgegevens

Wei LJ, Lin DY, Weissfeld L (1989). Regressieanalyse van multivariate onvolledige faaltijdgegevens door marginale verdelingen te modelleren. Tijdschrift van de American Statistical Association84 (108): 1065-1073

Het originele artikel dat marginale modellen beschrijft voor analyse van terugkerende gebeurtenissen

Cursussen

Epidemiologie en Population Health Summer Institute aan de Columbia University (EPIC)

Statistical Horizons, particuliere aanbieder van gespecialiseerde statistische seminars die worden gegeven door experts in het veld

Interuniversitair Consortium voor Politiek en Sociaal Onderzoek (ICPSR) Zomerprogramma in Quantitative Methods of Social Research, onderdeel van het Institute for Social Research van de University of Michigan

  • 3-daags seminar over overlevingsanalyse, modellering van gebeurtenisgeschiedenis en duuranalyse aangeboden van 22-24 juni 2015 in Berkeley, CA, gegeven door Tenko Raykov van de Michigan State University. Uitgebreid overzicht van overlevingsmethoden over disciplines heen (niet alleen volksgezondheid): http://www.icpsr.umich.edu/icpsrweb/sumprog/courses/0200

Institute for Statistics Research biedt twee online cursussen voor overlevingsanalyse, die meerdere keren per jaar worden aangeboden. Deze cursussen zijn gebaseerd op het handboek Toegepaste analyse van Klein en Kleinbaum (zie hieronder) en kunnen à la carte worden gevolgd of als onderdeel van een certificaatprogramma in statistiek:

Het Institute for Digital Research and Education aan de UCLA biedt via hun website seminars aan voor overlevingsanalyse in verschillende statistische software. Deze seminars laten zien hoe toegepaste overlevingsanalyses kunnen worden uitgevoerd, waarbij de nadruk meer ligt op code dan op theorie.

Interessante Artikelen

Editor'S Choice

Virginia Lorenzi MS
Virginia Lorenzi MS
Bobby Art International v. Hoon
Bobby Art International v. Hoon
Columbia Global Freedom of Expression streeft naar een beter begrip van de internationale en nationale normen en instellingen die de vrije stroom van informatie en meningsuiting het beste beschermen in een onderling verbonden wereldwijde gemeenschap met grote gemeenschappelijke uitdagingen die moeten worden aangepakt. Om haar missie te bereiken, onderneemt en geeft Global Freedom of Expression onderzoeks- en beleidsprojecten, organiseert het evenementen en conferenties en neemt het deel aan en draagt ​​het bij aan wereldwijde debatten over de bescherming van de vrijheid van meningsuiting en informatie in de 21e eeuw.
Februari Virtuele Narrative Medicine-rondes met André Aciman
Februari Virtuele Narrative Medicine-rondes met André Aciman
Homo Irrealis: Essays,' een gesprek met schrijver André Aciman over zijn nieuwe boek Voor onze Narrative Medicine-rondes in februari verwelkomen we schrijver André...
Nigeriaanse immigratiedienst en de last van gegevensbescherming
Nigeriaanse immigratiedienst en de last van gegevensbescherming
Columbia Global Freedom of Expression streeft naar een beter begrip van de internationale en nationale normen en instellingen die de vrije stroom van informatie en meningsuiting het beste beschermen in een onderling verbonden wereldwijde gemeenschap met grote gemeenschappelijke uitdagingen die moeten worden aangepakt. Om haar missie te bereiken, onderneemt en geeft Global Freedom of Expression onderzoeks- en beleidsprojecten, organiseert evenementen en conferenties, en neemt deel aan en draagt ​​bij aan wereldwijde debatten over de bescherming van vrijheid van meningsuiting en informatie in de 21e eeuw.
Hij is een CNN-held: Alumnus David Flink beschouwt 'LD' als 'anders leren
Hij is een CNN-held: Alumnus David Flink beschouwt 'LD' als 'anders leren'
Teachers College alumnus David Flink (M.A. ’08), oprichter en Chief Empowerment Officer van Eye to Eye, een mentoringbeweging voor en door mensen met leerproblemen/ADHD, is uitgeroepen tot CNN Hero.
Martin Luther King Jr. in Columbia
Martin Luther King Jr. in Columbia
Op 27 oktober 1961 arriveerde Martin Luther King Jr., de voorzitter van de Southern Christian Leadership Conference (SCLC) en predikant van de Ebenezer Baptist Church in Atlanta, aan de Columbia University om een ​​toespraak te houden. King omhelsde christelijke liefde en Gandhiaanse geweldloosheid en stond erop dat Amerika zijn belofte van gelijke rechten voor iedereen waarmaakt. King, tweeëndertig, was de meest vooraanstaande burgerrechtenleider van het land. Hij had de Montgomery Bus Boycot in 1956 geleid en maakte de cover van TIME.
Klimaatverandering zorgt voor aanzienlijke toename van bosbranden in de VS
Klimaatverandering zorgt voor aanzienlijke toename van bosbranden in de VS