
Análisis de supervivencia: curvas Kaplan-Meier, log-rank y regresión de Cox
Guía práctica de análisis de supervivencia para investigación clínica: cuándo usarlo, cómo preparar los datos y cómo interpretar curvas KM y resultados de regresión de Cox.
Tu estudio compara los resultados entre dos grupos de pacientes y la variable final es el «tiempo desde la cirugía hasta la recidiva». Algunos pacientes recayeron, otros seguían libres de recidiva en el último seguimiento y otros se perdieron. No puedes usar simplemente un t-test para comparar tiempos medios entre grupos: para los pacientes que no recayeron, no sabes cuándo lo habrían hecho realmente.
Por eso necesitas análisis de supervivencia.
¿Qué es el análisis de supervivencia?
El análisis de supervivencia es una familia de métodos estadísticos diseñados para tratar datos de tiempo hasta evento. El «evento» no tiene por qué ser la muerte: puede ser cualquier desenlace de interés:
- Recidiva tumoral
- Progresión de enfermedad
- Complicación postoperatoria
- Fallo de injerto
- Fallecimiento del paciente
La gran ventaja del análisis de supervivencia es que trata correctamente los datos censurados: personas que aún no han experimentado el evento al final del periodo de observación. Si las excluyes, introduces un sesgo serio. Si tratas su tiempo de seguimiento como si fuera tiempo hasta evento, los resultados también están equivocados. El análisis de supervivencia ofrece un marco matemático para aprovechar correctamente esa información incompleta.
¿Qué formato necesitan los datos?
Para análisis de supervivencia, cada paciente necesita al menos dos variables:
- Variable de tiempo: duración desde el punto de inicio hasta la ocurrencia del evento o la censura. El punto de inicio suele ser la fecha de diagnóstico, cirugía o reclutamiento. La unidad puede ser días, meses o años, pero debe ser consistente
- Variable de estado (indicador de evento): marca si el paciente experimentó el evento. Suele codificarse como 1 = evento, 0 = censurado
Por ejemplo:
| ID paciente | Seguimiento (meses) | Estado | Grupo |
|---|---|---|---|
| 001 | 24 | 1 (recidiva) | Tratamiento |
| 002 | 36 | 0 (censurado) | Control |
| 003 | 12 | 1 (recidiva) | Tratamiento |
| 004 | 30 | 0 (censurado) | Tratamiento |
¿Qué cuenta como censura?
- El paciente no ha experimentado el evento al final del estudio
- El paciente se perdió durante el seguimiento
- El paciente abandonó por motivos ajenos al evento estudiado (mudanza, retirada del consentimiento, etc.)
Los errores más frecuentes en la preparación son cálculos de tiempo inconsistentes (algunos contados desde el diagnóstico, otros desde la cirugía) y un estado de censura impreciso. Verifica con cuidado antes de empezar el análisis.
El método Kaplan-Meier
El método Kaplan-Meier (KM) es la herramienta más fundamental y extendida en análisis de supervivencia. Estima la función de supervivencia: la probabilidad de que un paciente no haya experimentado el evento en cualquier punto temporal t.
Cómo se lee una curva KM
El eje X de una curva KM es el tiempo y el eje Y la probabilidad de supervivencia (de 0 a 1, o de 0 a 100%):
- La curva arranca en 1,0 (100%) en la esquina superior izquierda
- Cada vez que un paciente experimenta el evento, la curva baja un escalón
- Las observaciones censuradas se marcan típicamente con pequeños trazos o signos «+» sobre la curva: la curva no baja en esos puntos, pero el número en riesgo disminuye
- Una curva más plana indica menor tasa de eventos y mejor pronóstico
- Mayor separación entre dos curvas indica una diferencia más amplia entre grupos
Mediana de supervivencia
La mediana de supervivencia es el valor temporal donde la curva KM cruza la línea del 50% de supervivencia. Significa que la mitad de los pacientes había experimentado el evento antes de ese punto.
Si la curva se mantiene por encima del 50% durante todo el seguimiento (más de la mitad no experimentó el evento durante la observación), la mediana de supervivencia no se puede calcular: es habitual en estudios con pronóstico favorable.
Tabla de número en riesgo
Una gráfica KM bien presentada incluye una tabla de riesgo bajo la curva, mostrando cuántos pacientes siguen «en riesgo» en cada punto temporal. Esa tabla importa porque las estimaciones del tramo final de la curva suelen apoyarse en muy pocos pacientes y tienen poca precisión. Si solo quedan 5 pacientes en un punto, las fluctuaciones de la curva no son fiables.
El test de log-rank
Las curvas KM muestran diferencias visuales, pero hace falta un test estadístico para determinar si la diferencia entre grupos es significativa.
El log-rank es el método estándar. Compara los eventos observados frente a los esperados en cada punto temporal entre grupos.
- Hipótesis nula: las curvas de supervivencia de los dos grupos son idénticas
- Salida: estadístico chi-cuadrado y p-value
- Supuesto: el cociente de hazards entre grupos es aproximadamente constante a lo largo del seguimiento (es decir, las curvas KM no se cruzan)
Si las curvas KM se cruzan (por ejemplo, un tratamiento funciona mejor a corto plazo y peor a largo plazo), el log-rank pierde potencia. En esos casos, considera tests alternativos (Wilcoxon o un análisis por tramos).
Regresión de Cox de riesgos proporcionales
El log-rank dice si dos grupos difieren, pero no cuán grande es la diferencia, y no permite ajustar por factores de confusión. Ahí entra la regresión de Cox.
La regresión de Cox de riesgos proporcionales es el método multivariable más importante en análisis de supervivencia. Su salida es el hazard ratio (HR):
- HR = 1: riesgo igual en ambos grupos
- HR > 1: el factor aumenta el riesgo de evento (peor pronóstico)
- HR < 1: el factor reduce el riesgo de evento (mejor pronóstico)
Por ejemplo, «HR del grupo de tratamiento frente a control = 0,62 (IC 95%: 0,45-0,85; p = 0,003)» significa que, tras ajustar por otras variables, el grupo de tratamiento presentó un 38% menos de riesgo del evento que el grupo control.
El supuesto de riesgos proporcionales
El supuesto clave de la regresión de Cox es el de riesgos proporcionales: el cociente de hazards entre grupos se mantiene constante durante todo el seguimiento.
Métodos de comprobación:
- Test de residuos de Schoenfeld: un p-value significativo indica violación del supuesto
- Inspección visual de las curvas KM: si se cruzan, el supuesto probablemente no se cumple
Si el supuesto no se mantiene, plantea estratificar por tiempo o usar un modelo de Cox dependiente del tiempo.
Regresión de Cox multivariable
En la práctica, la regresión de Cox suele reportarse en dos etapas:
- Análisis univariable: testar cada variable de forma individual frente al desenlace y seleccionar las significativas (criterio habitual: p < 0,1 o p < 0,2 para inclusión)
- Análisis multivariable: introducir todas las variables seleccionadas a la vez para obtener HR ajustados
Los resultados multivariables suelen presentarse como forest plots con HR en el eje X (escala logarítmica) y línea de referencia en HR = 1. Es una de las formas de presentación más habituales en artículos clínicos.
Errores frecuentes
1. Puntos de inicio inconsistentes
Algunos pacientes se miden desde la fecha de diagnóstico, otros desde la cirugía. El punto de inicio debe definirse claramente en el diseño del estudio y aplicarse de forma estricta a los datos.
2. Censura informativa
Si un paciente se pierde porque empeoró y se trasladó a otro hospital, la censura está relacionada con el evento, lo que viola el supuesto fundamental del análisis de supervivencia. El impacto de este sesgo debe discutirse en el artículo.
3. Tamaño muestral insuficiente
La regresión de Cox necesita normalmente al menos 10-20 eventos por variable predictora. Si tienes solo 30 eventos en total, puedes incluir como mucho 2-3 variables. Más variables llevan a sobreajuste del modelo.
4. Reportar p-values sin HR
Mucha gente que empieza escribe «la diferencia fue estadísticamente significativa (p < 0,05)» sin reportar el HR y el IC 95%. Los revisores casi seguro pedirán esa información.
El problema del flujo manual
Ejecutar análisis de supervivencia en SPSS implica fijar manualmente las variables de tiempo y evento, construir modelos de forma iterativa y dar formato a los KM a mano. R es más flexible pero tiene una curva más empinada: solo familiarizarse con los parámetros de los paquetes survival y survminer lleva tiempo.
La presentación de los resultados también suma detalles: los KM necesitan tabla de riesgo, la regresión de Cox necesita forest plots y hay que reportar los tests del supuesto de riesgos proporcionales. Cada detalle implica más código y más maquetación.
Cómo encaja Data2Paper
Data2Paper incluye un módulo completo de análisis de supervivencia. Sube un archivo de datos clínicos con variables de tiempo y de estado del evento, y el sistema detecta la estructura, genera curvas Kaplan-Meier con tabla de riesgo, ejecuta tests de log-rank, construye modelos de regresión de Cox y produce figuras y texto interpretativo listos para revista.
Sin escribir código, sin alternar entre software estadístico y documento: subes los datos, describes la pregunta y obtienes resultados completos para tu manuscrito.
Autor

Categorías
Más artículos

Más allá de SPSS: una alternativa moderna para analizar datos de encuesta
Comparativa de SPSS, Jamovi, JASP y Data2Paper para análisis de encuestas: curvas de aprendizaje, automatización y flujos de investigación de extremo a extremo.


De los datos de encuesta al artículo de investigación: un flujo de extremo a extremo
Cómo pasar de exportaciones de encuesta en bruto a un artículo de investigación terminado: pipeline completo desde Google Forms o Qualtrics hasta entregables formateados.


Qué hace Data2Paper: de los datos de encuesta a artículos de investigación entregables
Data2Paper convierte exportaciones de encuestas, necesidades de redacción multilingüe y flujos de análisis con Python en artículos de investigación entregables.

Newsletter
Únete a la comunidad
Suscríbete a la newsletter para recibir noticias y novedades