🗞️ Media y mediana. Como usarlas correctamente
Una guía practica de uso entre estas dos métricas.
👋 Hola soy Pavel, bienvenido a una nueva 🔒edición para suscriptores🔒 de El Descubrimiento. Cada semana hablamos sobre producto, growth y oportunidades en el sector tech.
Si aún no eres suscriptor, esto es lo que te has perdido en este mes:
Después de leer “How to Lie with Statistics” de Darrell Huff, me di cuenta de conceptos básicos de la estadística que pasamos por alto, y por tanto, cometemos errores constantemente en nuestro día a día.
Por lo tanto, si te saltaste las lecciones básicas en el colegio (como yo), te va a venir conocer estos principios antes de seguir leyendo:
La Tendencia Central es un concepto que se refiere al punto medio de un conjunto de datos. ¿Por qué es relevante? Porque identificar este punto medio te permite describir, graficar y modelar los datos con mayor precisión. Si el centro no está bien definido o está desviado (por ejemplo, al utilizar una media inadecuada), toda la distribución de los datos se verá afectada, lo que puede llevar a resultados erróneos en tu análisis, modelo, o test A/B.
En estadística, la precisión y la confianza comienzan con una correcta identificación del centro.
Las tres principales medidas de Tendencia Central son la media, la mediana y la moda.
Gran parte de tu análisis se basará en estas medidas. Una vez que determines el centro del conjunto de datos, podrás calcular los rangos, la varianza y la dispersión del conjunto.
Media y mediana
Elegir entre la media y la mediana depende principalmente de dos factores:
El tipo de datos con el que trabajas.
La distribución de los datos.
Cuando puedes usar ambas:
Cuando los datos están distribuidos normalmente (o cerca de una distribución normal), los valores están distribuidos uniformemente alrededor de un valor central.
Cuando los datos están distribuidos simétricamente.
Cuando los datos son continuos o discretos:
Discretos: (1, 2, 3, 4…)
Continuos: (1.1, 2.45, 3.543…), 26.5%, 30°C, 65°F, 12.3 millas, 2.5 horas, 10/3/2023…
Como ya sabes, la media es la estadística resumen más comúnmente utilizada. Es esencialmente un mini modelo de tu conjunto de datos.
Cuando no usar la media:
La media es sensible a los valores extremos o atípicos. Incluso un solo valor atípico puede afectar significativamente a la Media. Los valores extremos (en una cola extendida) alejan la Media del centro. A medida que la distribución se vuelve más sesgada, la Media se aleja más del centro.
Cuando trabajas con datos categóricos (por ejemplo, sí/no, género, frutas, marcas).
Cuando usar la mediana:
Continúa leyendo con una prueba gratuita de 7 días
Suscríbete a El descubrimiento para seguir leyendo este post y obtener 7 días de acceso gratis al archivo completo de posts.