2026/03/28

Análisis de supervivencia: curvas Kaplan-Meier, log-rank y regresión de Cox

Guía práctica de análisis de supervivencia para investigación clínica: cuándo usarlo, cómo preparar los datos y cómo interpretar curvas KM y resultados de regresión de Cox.

Tu estudio compara los resultados entre dos grupos de pacientes y la variable final es el «tiempo desde la cirugía hasta la recidiva». Algunos pacientes recayeron, otros seguían libres de recidiva en el último seguimiento y otros se perdieron. No puedes usar simplemente un t-test para comparar tiempos medios entre grupos: para los pacientes que no recayeron, no sabes cuándo lo habrían hecho realmente.

Por eso necesitas análisis de supervivencia.

¿Qué es el análisis de supervivencia?

El análisis de supervivencia es una familia de métodos estadísticos diseñados para tratar datos de tiempo hasta evento. El «evento» no tiene por qué ser la muerte: puede ser cualquier desenlace de interés:

Recidiva tumoral
Progresión de enfermedad
Complicación postoperatoria
Fallo de injerto
Fallecimiento del paciente

La gran ventaja del análisis de supervivencia es que trata correctamente los datos censurados: personas que aún no han experimentado el evento al final del periodo de observación. Si las excluyes, introduces un sesgo serio. Si tratas su tiempo de seguimiento como si fuera tiempo hasta evento, los resultados también están equivocados. El análisis de supervivencia ofrece un marco matemático para aprovechar correctamente esa información incompleta.

¿Qué formato necesitan los datos?

Para análisis de supervivencia, cada paciente necesita al menos dos variables:

Variable de tiempo: duración desde el punto de inicio hasta la ocurrencia del evento o la censura. El punto de inicio suele ser la fecha de diagnóstico, cirugía o reclutamiento. La unidad puede ser días, meses o años, pero debe ser consistente
Variable de estado (indicador de evento): marca si el paciente experimentó el evento. Suele codificarse como 1 = evento, 0 = censurado

Por ejemplo:

ID paciente	Seguimiento (meses)	Estado	Grupo
001	24	1 (recidiva)	Tratamiento
002	36	0 (censurado)	Control
003	12	1 (recidiva)	Tratamiento
004	30	0 (censurado)	Tratamiento

¿Qué cuenta como censura?

El paciente no ha experimentado el evento al final del estudio
El paciente se perdió durante el seguimiento
El paciente abandonó por motivos ajenos al evento estudiado (mudanza, retirada del consentimiento, etc.)

Los errores más frecuentes en la preparación son cálculos de tiempo inconsistentes (algunos contados desde el diagnóstico, otros desde la cirugía) y un estado de censura impreciso. Verifica con cuidado antes de empezar el análisis.

El método Kaplan-Meier

El método Kaplan-Meier (KM) es la herramienta más fundamental y extendida en análisis de supervivencia. Estima la función de supervivencia: la probabilidad de que un paciente no haya experimentado el evento en cualquier punto temporal t.

Cómo se lee una curva KM

El eje X de una curva KM es el tiempo y el eje Y la probabilidad de supervivencia (de 0 a 1, o de 0 a 100%):

La curva arranca en 1,0 (100%) en la esquina superior izquierda
Cada vez que un paciente experimenta el evento, la curva baja un escalón
Las observaciones censuradas se marcan típicamente con pequeños trazos o signos «+» sobre la curva: la curva no baja en esos puntos, pero el número en riesgo disminuye
Una curva más plana indica menor tasa de eventos y mejor pronóstico
Mayor separación entre dos curvas indica una diferencia más amplia entre grupos

Mediana de supervivencia

La mediana de supervivencia es el valor temporal donde la curva KM cruza la línea del 50% de supervivencia. Significa que la mitad de los pacientes había experimentado el evento antes de ese punto.

Si la curva se mantiene por encima del 50% durante todo el seguimiento (más de la mitad no experimentó el evento durante la observación), la mediana de supervivencia no se puede calcular: es habitual en estudios con pronóstico favorable.

Tabla de número en riesgo

Una gráfica KM bien presentada incluye una tabla de riesgo bajo la curva, mostrando cuántos pacientes siguen «en riesgo» en cada punto temporal. Esa tabla importa porque las estimaciones del tramo final de la curva suelen apoyarse en muy pocos pacientes y tienen poca precisión. Si solo quedan 5 pacientes en un punto, las fluctuaciones de la curva no son fiables.

El test de log-rank

Las curvas KM muestran diferencias visuales, pero hace falta un test estadístico para determinar si la diferencia entre grupos es significativa.

El log-rank es el método estándar. Compara los eventos observados frente a los esperados en cada punto temporal entre grupos.

Hipótesis nula: las curvas de supervivencia de los dos grupos son idénticas
Salida: estadístico chi-cuadrado y p-value
Supuesto: el cociente de hazards entre grupos es aproximadamente constante a lo largo del seguimiento (es decir, las curvas KM no se cruzan)

Si las curvas KM se cruzan (por ejemplo, un tratamiento funciona mejor a corto plazo y peor a largo plazo), el log-rank pierde potencia. En esos casos, considera tests alternativos (Wilcoxon o un análisis por tramos).

Regresión de Cox de riesgos proporcionales

El log-rank dice si dos grupos difieren, pero no cuán grande es la diferencia, y no permite ajustar por factores de confusión. Ahí entra la regresión de Cox.

La regresión de Cox de riesgos proporcionales es el método multivariable más importante en análisis de supervivencia. Su salida es el hazard ratio (HR):

HR = 1: riesgo igual en ambos grupos
HR > 1: el factor aumenta el riesgo de evento (peor pronóstico)
HR < 1: el factor reduce el riesgo de evento (mejor pronóstico)

Por ejemplo, «HR del grupo de tratamiento frente a control = 0,62 (IC 95%: 0,45-0,85; p = 0,003)» significa que, tras ajustar por otras variables, el grupo de tratamiento presentó un 38% menos de riesgo del evento que el grupo control.

El supuesto de riesgos proporcionales

El supuesto clave de la regresión de Cox es el de riesgos proporcionales: el cociente de hazards entre grupos se mantiene constante durante todo el seguimiento.

Métodos de comprobación:

Test de residuos de Schoenfeld: un p-value significativo indica violación del supuesto
Inspección visual de las curvas KM: si se cruzan, el supuesto probablemente no se cumple

Si el supuesto no se mantiene, plantea estratificar por tiempo o usar un modelo de Cox dependiente del tiempo.

Regresión de Cox multivariable

En la práctica, la regresión de Cox suele reportarse en dos etapas:

Análisis univariable: testar cada variable de forma individual frente al desenlace y seleccionar las significativas (criterio habitual: p < 0,1 o p < 0,2 para inclusión)
Análisis multivariable: introducir todas las variables seleccionadas a la vez para obtener HR ajustados

Los resultados multivariables suelen presentarse como forest plots con HR en el eje X (escala logarítmica) y línea de referencia en HR = 1. Es una de las formas de presentación más habituales en artículos clínicos.

Errores frecuentes

1. Puntos de inicio inconsistentes

Algunos pacientes se miden desde la fecha de diagnóstico, otros desde la cirugía. El punto de inicio debe definirse claramente en el diseño del estudio y aplicarse de forma estricta a los datos.

2. Censura informativa

Si un paciente se pierde porque empeoró y se trasladó a otro hospital, la censura está relacionada con el evento, lo que viola el supuesto fundamental del análisis de supervivencia. El impacto de este sesgo debe discutirse en el artículo.

3. Tamaño muestral insuficiente

La regresión de Cox necesita normalmente al menos 10-20 eventos por variable predictora. Si tienes solo 30 eventos en total, puedes incluir como mucho 2-3 variables. Más variables llevan a sobreajuste del modelo.

4. Reportar p-values sin HR

Mucha gente que empieza escribe «la diferencia fue estadísticamente significativa (p < 0,05)» sin reportar el HR y el IC 95%. Los revisores casi seguro pedirán esa información.

El problema del flujo manual

Ejecutar análisis de supervivencia en SPSS implica fijar manualmente las variables de tiempo y evento, construir modelos de forma iterativa y dar formato a los KM a mano. R es más flexible pero tiene una curva más empinada: solo familiarizarse con los parámetros de los paquetes survival y survminer lleva tiempo.

La presentación de los resultados también suma detalles: los KM necesitan tabla de riesgo, la regresión de Cox necesita forest plots y hay que reportar los tests del supuesto de riesgos proporcionales. Cada detalle implica más código y más maquetación.

Cómo encaja Data2Paper

Data2Paper incluye un módulo completo de análisis de supervivencia. Sube un archivo de datos clínicos con variables de tiempo y de estado del evento, y el sistema detecta la estructura, genera curvas Kaplan-Meier con tabla de riesgo, ejecuta tests de log-rank, construye modelos de regresión de Cox y produce figuras y texto interpretativo listos para revista.

Sin escribir código, sin alternar entre software estadístico y documento: subes los datos, describes la pregunta y obtienes resultados completos para tu manuscrito.

Sube tus datos clínicos y empieza a generar tu artículo →

Todos los artículos

Autor

Equipo de Data2Paper

Categorías

Tutoriales

¿Qué es el análisis de supervivencia?¿Qué formato necesitan los datos?El método Kaplan-Meier Cómo se lee una curva KM Mediana de supervivencia Tabla de número en riesgo El test de log-rank Regresión de Cox de riesgos proporcionales El supuesto de riesgos proporcionales Regresión de Cox multivariable Errores frecuentes 1. Puntos de inicio inconsistentes 2. Censura informativa 3. Tamaño muestral insuficiente 4. Reportar p-values sin HR El problema del flujo manual Cómo encaja Data2Paper

Más artículos

Comparativas

Más allá de SPSS: una alternativa moderna para analizar datos de encuesta

Comparativa de SPSS, Jamovi, JASP y Data2Paper para análisis de encuestas: curvas de aprendizaje, automatización y flujos de investigación de extremo a extremo.

Equipo de Data2Paper

2026/03/25

Tutoriales

De los datos de encuesta al artículo de investigación: un flujo de extremo a extremo

Cómo pasar de exportaciones de encuesta en bruto a un artículo de investigación terminado: pipeline completo desde Google Forms o Qualtrics hasta entregables formateados.

Equipo de Data2Paper

2026/03/20

Capacidades del producto

Qué hace Data2Paper: de los datos de encuesta a artículos de investigación entregables

Data2Paper convierte exportaciones de encuestas, necesidades de redacción multilingüe y flujos de análisis con Python en artículos de investigación entregables.

Equipo de Data2Paper

2026/03/21

Únete a la comunidad

Suscríbete a la newsletter para recibir noticias y novedades

2026/03/28

Análisis de supervivencia: curvas Kaplan-Meier, log-rank y regresión de Cox

Guía práctica de análisis de supervivencia para investigación clínica: cuándo usarlo, cómo preparar los datos y cómo interpretar curvas KM y resultados de regresión de Cox.

Por eso necesitas análisis de supervivencia.

¿Qué es el análisis de supervivencia?

Recidiva tumoral
Progresión de enfermedad
Complicación postoperatoria
Fallo de injerto
Fallecimiento del paciente

¿Qué formato necesitan los datos?

Para análisis de supervivencia, cada paciente necesita al menos dos variables:

Variable de tiempo: duración desde el punto de inicio hasta la ocurrencia del evento o la censura. El punto de inicio suele ser la fecha de diagnóstico, cirugía o reclutamiento. La unidad puede ser días, meses o años, pero debe ser consistente
Variable de estado (indicador de evento): marca si el paciente experimentó el evento. Suele codificarse como 1 = evento, 0 = censurado

Por ejemplo:

ID paciente	Seguimiento (meses)	Estado	Grupo
001	24	1 (recidiva)	Tratamiento
002	36	0 (censurado)	Control
003	12	1 (recidiva)	Tratamiento
004	30	0 (censurado)	Tratamiento

¿Qué cuenta como censura?

El paciente no ha experimentado el evento al final del estudio
El paciente se perdió durante el seguimiento
El paciente abandonó por motivos ajenos al evento estudiado (mudanza, retirada del consentimiento, etc.)

El método Kaplan-Meier

Cómo se lee una curva KM

El eje X de una curva KM es el tiempo y el eje Y la probabilidad de supervivencia (de 0 a 1, o de 0 a 100%):

La curva arranca en 1,0 (100%) en la esquina superior izquierda
Cada vez que un paciente experimenta el evento, la curva baja un escalón
Las observaciones censuradas se marcan típicamente con pequeños trazos o signos «+» sobre la curva: la curva no baja en esos puntos, pero el número en riesgo disminuye
Una curva más plana indica menor tasa de eventos y mejor pronóstico
Mayor separación entre dos curvas indica una diferencia más amplia entre grupos

Mediana de supervivencia

La mediana de supervivencia es el valor temporal donde la curva KM cruza la línea del 50% de supervivencia. Significa que la mitad de los pacientes había experimentado el evento antes de ese punto.

Tabla de número en riesgo

El test de log-rank

Las curvas KM muestran diferencias visuales, pero hace falta un test estadístico para determinar si la diferencia entre grupos es significativa.

El log-rank es el método estándar. Compara los eventos observados frente a los esperados en cada punto temporal entre grupos.

Hipótesis nula: las curvas de supervivencia de los dos grupos son idénticas
Salida: estadístico chi-cuadrado y p-value
Supuesto: el cociente de hazards entre grupos es aproximadamente constante a lo largo del seguimiento (es decir, las curvas KM no se cruzan)

Regresión de Cox de riesgos proporcionales

El log-rank dice si dos grupos difieren, pero no cuán grande es la diferencia, y no permite ajustar por factores de confusión. Ahí entra la regresión de Cox.

La regresión de Cox de riesgos proporcionales es el método multivariable más importante en análisis de supervivencia. Su salida es el hazard ratio (HR):

HR = 1: riesgo igual en ambos grupos
HR > 1: el factor aumenta el riesgo de evento (peor pronóstico)
HR < 1: el factor reduce el riesgo de evento (mejor pronóstico)

El supuesto de riesgos proporcionales

El supuesto clave de la regresión de Cox es el de riesgos proporcionales: el cociente de hazards entre grupos se mantiene constante durante todo el seguimiento.

Métodos de comprobación:

Test de residuos de Schoenfeld: un p-value significativo indica violación del supuesto
Inspección visual de las curvas KM: si se cruzan, el supuesto probablemente no se cumple

Si el supuesto no se mantiene, plantea estratificar por tiempo o usar un modelo de Cox dependiente del tiempo.

Regresión de Cox multivariable

En la práctica, la regresión de Cox suele reportarse en dos etapas:

Análisis univariable: testar cada variable de forma individual frente al desenlace y seleccionar las significativas (criterio habitual: p < 0,1 o p < 0,2 para inclusión)
Análisis multivariable: introducir todas las variables seleccionadas a la vez para obtener HR ajustados

Errores frecuentes

1. Puntos de inicio inconsistentes

Algunos pacientes se miden desde la fecha de diagnóstico, otros desde la cirugía. El punto de inicio debe definirse claramente en el diseño del estudio y aplicarse de forma estricta a los datos.

2. Censura informativa

3. Tamaño muestral insuficiente

4. Reportar p-values sin HR

Mucha gente que empieza escribe «la diferencia fue estadísticamente significativa (p < 0,05)» sin reportar el HR y el IC 95%. Los revisores casi seguro pedirán esa información.

El problema del flujo manual

Cómo encaja Data2Paper

Sin escribir código, sin alternar entre software estadístico y documento: subes los datos, describes la pregunta y obtienes resultados completos para tu manuscrito.

Sube tus datos clínicos y empieza a generar tu artículo →

Todos los artículos

Autor

Equipo de Data2Paper

Más artículos

Comparativas

Más allá de SPSS: una alternativa moderna para analizar datos de encuesta

Comparativa de SPSS, Jamovi, JASP y Data2Paper para análisis de encuestas: curvas de aprendizaje, automatización y flujos de investigación de extremo a extremo.

Equipo de Data2Paper

2026/03/25

Tutoriales

De los datos de encuesta al artículo de investigación: un flujo de extremo a extremo

Cómo pasar de exportaciones de encuesta en bruto a un artículo de investigación terminado: pipeline completo desde Google Forms o Qualtrics hasta entregables formateados.

Equipo de Data2Paper

2026/03/20

Capacidades del producto

Qué hace Data2Paper: de los datos de encuesta a artículos de investigación entregables

Data2Paper convierte exportaciones de encuestas, necesidades de redacción multilingüe y flujos de análisis con Python en artículos de investigación entregables.

Equipo de Data2Paper

2026/03/21

Únete a la comunidad

Suscríbete a la newsletter para recibir noticias y novedades

Análisis de supervivencia: curvas Kaplan-Meier, log-rank y regresión de Cox

Autor

Categorías

Más artículos

Más allá de SPSS: una alternativa moderna para analizar datos de encuesta

De los datos de encuesta al artículo de investigación: un flujo de extremo a extremo

Qué hace Data2Paper: de los datos de encuesta a artículos de investigación entregables

Newsletter

Análisis de supervivencia: curvas Kaplan-Meier, log-rank y regresión de Cox

Autor

Categorías

Más artículos

Más allá de SPSS: una alternativa moderna para analizar datos de encuesta

De los datos de encuesta al artículo de investigación: un flujo de extremo a extremo

Qué hace Data2Paper: de los datos de encuesta a artículos de investigación entregables

Newsletter