¿Qué es el sesgo de supervivencia?
El sesgo de supervivencia es una forma de sesgo de selección . Se produce cuando un conjunto de datos solo tiene en cuenta las observaciones existentes (o “sobrevivientes”) y no tiene en cuenta las observaciones que han dejado de existir.
Por ejemplo, al investigar la rentabilidad de la industria tecnológica, también hay que estudiar las empresas que quebraron, en lugar de centrarse sólo en las empresas que están actualmente en el mercado.
Centrarse en un subconjunto de la muestra que ya ha pasado por algún tipo de proceso de selección aumenta las posibilidades de sacar conclusiones incorrectas. Es posible que las observaciones “supervivientes” hayan sobrevivido precisamente porque son más resistentes a condiciones difíciles, mientras que otras han dejado de existir como resultado de esas mismas condiciones.
Un ejemplo clásico de sesgo de supervivencia proviene de la investigación sobre los bombarderos de la Segunda Guerra Mundial. Al principio, los investigadores estudiaban los aviones que habían regresado a las bases estadounidenses (es decir, los aviones supervivientes) para recomendar qué partes del avión necesitaban refuerzos.
Sin embargo, un ingeniero se dio cuenta de que los aviones más afectados nunca volvieron, por lo que las zonas que no mostraban daños en los aviones supervivientes eran en realidad las peores partes afectadas. Los aviones que se vieron afectados allí nunca volvieron, pero como solo se centraron en los datos de los aviones que regresaban, los investigadores se vieron inicialmente engañados por el sesgo de supervivencia.
¿Por qué es importante el sesgo de supervivencia?
Cuando un estudio se ve afectado por el sesgo de supervivencia, solo prestamos atención a una parte de los datos. Esto puede tener diversas consecuencias, como:
- Conclusiones demasiado optimistas que no representan la realidad, que nos llevan a pensar que las circunstancias son más fáciles o más propensas a funcionar a nuestro favor de lo que en realidad son. Estudiar solo a emprendedores o startups exitosas puede tener este efecto.
- Mala interpretación de la correlación , o ver una relación de causa y efecto cuando no la hay. Por ejemplo, los que abandonan la escuela secundaria o la universidad se convierten en empresarios exitosos a pesar de haber dejado la escuela, no gracias a ella.
- Toma de decisiones incompleta, omisión de información importante sobre aquellos que no “sobrevivieron”, como empresas que fracasaron a pesar de entornos de crecimiento aparentemente fértiles o fundadores que trabajaron duro.
Es importante ser consciente del sesgo de supervivencia porque afecta nuestra percepción, nuestro juicio y la calidad de nuestras conclusiones.
Cómo prevenir el sesgo de supervivencia
El sesgo de supervivencia es un error lógico común, pero puedes tomar varias medidas para evitarlo:
- Piense en lo que falta en sus datos y pregúntese: ¿su conjunto de datos está completo? ¿Qué observaciones no “sobrevivieron” a un evento o procedimiento de selección? Piense en empresas que ya no existen, en personas que abandonaron sus estudios y no se convirtieron en multimillonarios o en participantes de ensayos clínicos que no mostraron ninguna mejora.
- Seleccione fuentes de datos diseñadas para garantizar la precisión. Tenga cuidado de no omitir observaciones que ya no existen y que podrían cambiar su análisis o conclusiones. Por ejemplo, también busque revistas académicas que publiquen resultados de estudios negativos.
- Al limpiar sus datos , tenga cuidado con la eliminación de valores atípicos . Puede eliminar información crítica por accidente si no comprende lo que significan los valores atípicos. Es fundamental determinar si los valores extremos son realmente errores o representan algo más. Los expertos en el tema de su investigación pueden ayudarlo con esto, ya que conocen el campo mejor que nadie.
Ser consciente del sesgo de supervivencia, así como ser abierto y transparente acerca de sus suposiciones, es la mejor estrategia para prevenirlo.
Comentarios
Publicar un comentario