Cuando se utilizan datos de observación, la asignación a un grupo de tratamiento no es aleatoria y la inferencia causal puede ser difícil. Un enfoque común para abordar esto es la ponderación del puntaje de propensión, donde el puntaje de propensión representa la probabilidad de que un individuo sea asignado al brazo de tratamiento en función de sus características observables. Esta propensión a menudo se estima utilizando una regresión logística de características individuales sobre una variable binaria que dice si la persona recibió o no el tratamiento. Los puntajes de propensión se usan comúnmente para aplicar estimadores de probabilidad inversa del peso del tratamiento (IPTW) para obtener los efectos del tratamiento ajustados por factores de confusión conocidos.
Un artículo de Xu et al. (2010) muestra que el uso del enfoque IPTW puede conducir a una sobreestimación del tamaño de la pseudomuestra y aumentar la probabilidad de un error de tipo I (es decir, rechazar la hipótesis nula cuando en realidad es cierta). Los autores afirman que los estimadores de varianza robustos pueden abordar este problema, pero solo funcionan bien para muestras de gran tamaño. En cambio, Xu y los coautores propusieron usar pesos estandarizados en el IPTW como una estrategia simple y fácil de implementar. Asi es como funciona.
El enfoque IPTW simplemente examina la diferencia entre los grupos tratados y no tratados después de aplicar la ponderación IPTW. La frecuencia con la que se trata a alguien es:

Donde n1 es el número de personas tratadas y norte es el tamaño total de la muestra. Dejar p.ej=1 si la persona es tratada en los datos y p.ej=0 si la persona no es tratada. Suponga que cada persona tiene un vector de características del paciente, Xque afectan la probabilidad de tratamiento. Entonces la probabilidad de tratamiento se calcula de la siguiente manera:


Bajo IPTW estándar, los pesos utilizados serían:


Xu y los coautores crean una simulación para mostrar que el error de tipo 1 es demasiado alto, a menudo del 15 % al 40 %. Para corregir esto, se podrían usar pesos estandarizados (SW) de la siguiente manera:


El primero se utiliza para la población tratada (es decir, z=1) y el segundo para la población no tratada (z=0). Los autores muestran que bajo los pesos estandarizados, la tasa de error de Tipo 1 es de alrededor del 5%, como se esperaba. De hecho, los autores también muestran que la ponderación estandarizada a menudo supera a los estimadores robustos de varianza al estimar también los efectos principales.
Para más información, puedes leer el artículo completo aquí.