Qué es un Diagrama de Dispersión y por qué utilizarlo
- afloresdel
- 11 nov 2022
- 5 Min. de lectura
Actualizado: 9 ene 2023
ĀæQue es un diagrama de dispersion?
En estadĆstica, los diagramas de dispersión son unos grĆ”ficos en el que los puntos de datos se trazan en dos ejes, generalmente el eje x y el eje y, para mostrar cuĆ”nto afecta una variable a otra. Los puntos de datos generalmente se representan como puntos en el grĆ”fico. Una correlación es una medida estadĆstica de la relación entre dos variables. Las correlaciones pueden ser positivas o negativas, lo que significa que a medida que aumenta una variable, la otra aumenta o disminuye. El siguiente diagrama de dispersión muestra la relación entre dos variables
GrÔfico de dispersión ejemplo:

La dispersión se puede observar en los puntos verdes en la grafica
Indice
Objetivo del Diagrama de Dispersión
El objetivo de un diagrama de dispersión es mostrar la relación entre dos variables. Las variables se trazan en un grÔfico y la relación se muestra por la forma en que se distribuyen los puntos. Si los puntos estÔn muy juntos, entonces existe una fuerte relación entre las variables. Si los puntos estÔn muy separados, entonces existe una relación débil entre las variables.
Diagrama de dispersión ejemplo
Para el siguiente ejemplo usaremos los siguientes datos en excel:
Como realizar un diagrama de dispersión paso a paso.
1. Decide quĆ© variable irĆ” en el eje x y cuĆ”l en el eje y. En la mayorĆa de los casos, no importa quĆ© variable sea cuĆ”l, pero a veces puede marcar la diferencia. Por ejemplo, si estuviera observando la relación entre la altura y el peso, desearĆa colocar la altura en el eje x porque las personas generalmente son mĆ”s altas que anchas.
2. Trace sus puntos de datos en un grƔfico. Cada punto de datos debe estar representado por un punto.
3. Mira tus datos para ver si hay una relación entre las dos variables. Una relación positiva significa que a medida que aumenta una variable, también lo hace la otra; una relación negativa significa que cuando una variable aumenta, la otra disminuye; ninguna relación significa que no hay un patrón claro entre las dos variables.
Como hacer un diagrama de dispersión en Excel
Insertar video short
Como hacer un diagrama de dispersión en Minitab
Insertar video short
Diferentes tipos de diagramas de dispersion
a) Grafico de dispersion Simple: Crear un grƔfico que muestra los valores de los datos en las coordenadas x y y.
b) Grafico de dispersion con Grupos: Crear una grÔfica de dispersión que diseñe los datos de los pares de variables para mostrar los valores y colocarlos en sus coordenadas para dividirlo en grupos - asociados a diferentes colores.
c) Grafico de dispersion con Regresión: Se agrega una lĆnea de regresión, creando una grĆ”fica de dispersión que muestre los valores de datos de un par de variables en sus coordenadas (x, Y)
d) Grafico de dispersion con Regresión y grupos: Crear una grĆ”fica de dispersión que muestre los valores de datos de los pares de variables en sus coordenadas (x, y), divididos en grupos. Incluir una lĆnea ajustada de regresión para cada grupo. Los grupos estĆ”n representados por diferentes colores
e) Grafico de dispersion con LĆnea de conexión: Crear una grĆ”fica de dispersión conectado con una lĆnea que muestre los valores de datos de un par de variables en sus coordenadas (x, y). Con esta misma se puede mostrar la forma cómo los valores de datos cambian con el tiempo.
f) Grafico de dispersion con LĆnea de conexión y grupos: Sirve para comparar mĆ”s de dos grupos a travĆ©s del tiempo.

Correlación
Cuando dos variables estÔn relacionadas, decimos que tienen una correlación. La fuerza de la correlación se mide por lo que se llama el coeficiente de correlación. El coeficiente de correlación es un número entre -1 y 1 que indica qué tan fuerte es la relación entre dos variables. Una correlación positiva significa que cuando una variable aumenta, la otra variable aumenta. Una correlación negativa significa que cuando una variable aumenta, la otra disminuye.
Una correlación positiva perfecta tiene un valor de 1, lo que significa que a medida que aumenta una variable también lo hace la otra y ambas siempre aumentan o disminuyen juntas. Una correlación negativa perfecta tiene un valor de -1, lo que significa que a medida que una variable aumenta, la otra disminuye y siempre se mueven en direcciones opuestas. Si las dos variables no estÔn relacionadas, el coeficiente serÔ 0.
Cuanto mĆ”s ceDiagrama de dispersión para quĆ© sirve? - Diagrama de Dispersiónrca estĆ© el coeficiente de 1 o -1 (ya sea positivo o negativo), mĆ”s fuerte serĆ” la relación entre las variables. Entonces, un coeficiente de 0.8 indicarĆa una relación positiva fuerte mientras que un coeficiente de -0.5 indicarĆa una relación negativa moderada
a) Para correlación lineal. La correlación de Pearson es el método mÔs común, mide la relación lineal entre dos variables continuas.
b) Para correlación No lineal. HabrĆa que utilizar la correlación del orden de los rangos de Spearman.
Como hacer una correlación en Minitab
Insertar video short
¿Cómo analizar los datos en una grÔfica de dispersión con correlación?
Paso 1.- Revisar si los datos caen dentro de una de las siguientes formas, o patrones:

Paso 2: Correr correlación, si la correlación estÔ cerca de 1, podemos concluir que las dos variables X y Y estÔn fuertemente asociadas por lo tanto podemos influir en la salida esperada.
Paso 3: Realizar una regresión lineal. (Ver el tema completo de regresión lineal)
Diagrama de dispersion ventajas y desventajas
Cuando se trata de diagramas de dispersión, hay ventajas y desventajas que deben considerarse antes de tomar cualquier decisión. En el lado positivo, los diagramas de dispersión se pueden usar para mostrar las relaciones entre dos variables continuas. Esto es Ćŗtil para identificar tendencias y patrones que pueden no ser evidentes de inmediato. AdemĆ”s, los diagramas de dispersión se pueden usar para detectar valores atĆpicos y puntos de datos inusuales. En el lado negativo, los diagramas de dispersión pueden ser difĆciles de interpretar, especialmente cuando hay muchos puntos de datos. AdemĆ”s, puede ser difĆcil notar la diferencia entre una relación fuerte y una dĆ©bil con solo mirar la trama. Finalmente, si las variables que se grafican no son realmente continuas (por ejemplo, si son categorĆas), es posible que un diagrama de dispersión no sea la mejor opción.
Relación con otras herramientas
Es parte de las 7 herramientas de calidad
Se hace antes de una regresión lineal.
Atraves de la hoja de verificación podemos obtener los datos del diagrama de dispersion.
Conclusión
Es importante recordar que correlación no implica causalidad. Una alta correlación entre dos variables puede ser el resultado de una tercera variable no medida. En otras palabras, el hecho de que dos cosas estén relacionadas no significa que una sea la causa de la otra.
A pesar de esto, los diagramas de dispersión y las correlaciones siguen siendo herramientas Ćŗtiles para explorar datos. Pueden ayudarnos a detectar tendencias y relaciones que de otro modo no notarĆamos. Y, al entender cómo interpretarlos, podemos usarlos para comprender mejor el mundo que nos rodea.