Salte al contenido

Estadística - Coeficiente de correlación

  • ImprimirImprimir

El coeficiente de correlación

La estadística puede entenderse como un conjunto de herramientas que involucran el estudio de métodos y procedimientos utilizados para recopilar, clasificar y analizar datos. Las herramientas de estadística también ofrecen los medios necesarios para realizar deducciones científicas a partir del resumen de los datos, como regresión lineal y predicción. Tanto la regresión lineal como la predicción se calculan con los parámetros que definen una curva (o línea) que mejor representa la muestra, dado que los datos trazados de una muestra de dos variables son lo suficientemente similares a una recta que puede representarse de esta manera. El coeficiente de correlación r se encuentra en el rango (-1 ≤ r ≤ 1) y mide qué tan similar es la muestra a una recta. Cuanto más similar sea la muestra a una recta, más similar será |r| a 1 y más similares serán los puntos predichos al comportamiento de la muestra.

El coeficiente de correlación en HP 12c Platinum

En la HP 12c Platinum, los datos estadísticos se almacenan como un conjunto de sumas que son el resultado de los datos recopilados en un principio. El conjunto de datos recopilados debe introducirse antes de usar cualquier función de estadística disponible en la HP 12c Platinum. La organización de la memoria de la HP 12c Platinum permite el estudio de datos estadísticos organizados como una muestra de una o dos variables. Como procedimiento general, los datos siempre se recopilan como un par de números n o valores (xn,yn), y la HP 12c Platinum calcula las siguientes sumas:
figura 1: Calcular los valores para x e y
Con estos valores actualizados y almacenados en la memoria, la HP 12c Platinum calcula el coeficiente de correlación con la siguiente expresión:
figura 2: Método para calcular el coeficiente de correlación
También hay funciones para predecir valores para cada una de las dos variables. Estas funciones están asociadas a las teclas (predicción de x a partir de y) y (predicción de y a partir de x). Cada vez que se calcula una nueva predicción, también se calcula el coeficiente de correlación, y pulsar después de o muestra su valor. La HP 12c Platinum usa las siguientes expresiones para calcular los valores predichos:
figura 3: Método para calcular los valores predichos

Practique cómo averiguar el coeficiente de correlación

Ejemplo 1

Un investigador inmobiliario quiere calcular la relación entre la superficie construida y la superficie de terreno de una comunidad, a fin de sugerir la superficie de construcción para una nueva casa con una superficie de terreno de 12.500 yardas cuadradas y la superficie de terreno sugerida para construcción con 3520 yardas cuadradas basada en los valores predichos. También quiere saber de qué manera se ajusta esta relación en una línea recta para saber si sus sugerencias son válidas. La tabla que figura a continuación resume sus mediciones.
Superficie de terreno (yardas cuadradas)Superficie de construcción (yardas cuadradas)Superficie de terreno (yardas cuadradas)Superficie de construcción (yardas cuadradas)
12000312090002080
100002560100002700
110002920130003280
140003300120003080

Solución

Asegúrese de borrar las memorias de estadística o suma antes de comenzar con el problema.
Pulsación de teclaPantalla
figura 4: Borrar la memoria de estadística o suma
Luego introduzca el primer punto de datos.
Pulsación de teclaPantalla
figura 5: Introducir los primeros datos
El primer valor introducido (superficie de construcción) se utiliza como la variable y, y el segundo valor (superficie de terreno) se usa como la variable x. El visor muestra el número de entradas cada vez que se pulsa . Asegúrese de que se introduzcan todos los datos:
Pulsación de teclaPantalla
figura 6: Introducir todos los datos
Debido a que los valores de y son la superficie de construcción, la superficie de construcción predicha (y) para una superficie de terreno de 12.500 yardas cuadradas se calcula pulsando:
Pulsación de teclaPantalla
figura 7: Calcular la superficie de construcción predicha
El coeficiente de correlación se calcula automáticamente cada vez que se realiza una predicción. Presione:
Pulsación de teclaPantalla
figura 8: Calcular el coeficiente de correlación
La superficie de terreno se almacena como valores x, por lo que para una superficie de construcción de 3520 yardas cuadradas, la superficie de terreno predicha es:
Pulsación de teclaPantalla
figura 9: Calcular la superficie de terreno predicha
Aunque el coeficiente de correlación tiene el mismo valor para la misma muestra, es fácil verificarlo:
Pulsación de teclaPantalla
figura 10: Calcular el coeficiente de correlación

Respuesta

Para una superficie de construcción de 3520 yardas cuadradas, se calcula que la superficie de terreno necesaria es de aproximadamente 14.140 yardas cuadradas. Para una superficie de terreno de 12.500 yardas cuadradas, se recomienda una superficie de construcción de aproximadamente 3140 yardas cuadradas . La muestra revela un coeficiente de correlación de 0,95, por lo que la predicción es cercana a los datos reales.

Ejemplo 2

Un accionista observa el mercado de valores extranjeros durante algún tiempo, a fin de componer una curva que relacione el monto de la inversión con las ganancias en una marca en particular. Decide analizar los datos y usar el coeficiente de correlación para medir el margen de error al predecir el monto de las ganancias, a partir del monto de la inversión. Si el coeficiente de correlación es menor que 0,80, no usará los datos para hacer futuras predicciones. Los datos recopilados hasta ahora son los siguientes:
Monto de inversiónMonto de gananciasMonto de inversiónMonto de ganancias
$1.200.000$91.000$1.450.000$112.000
$1.000.000$98.000$1.300.000$109.000
$900.000$85.000$1.150.000$99.000

Solución

Asegúrese de borrar las memorias de estadística o suma antes de comenzar con el problema.
Pulsación de teclaPantalla
figura 11: Borrar la memoria de estadística o suma
Tenga en cuenta que debe introducirse cada par para agregarlo a las sumas de estadísticas.
Pulsación de teclaPantalla
figura 12: Introducir los primeros datos
Recuerde que el visor muestra el número de entradas cada vez que se pulsa . Asegúrese de que estén introducidos todos los datos:
Para calcular el coeficiente de correlación, pulse:
Pulsación de teclaPantalla


NOTA:Cualquier valor servirá en lugar del 1 que aparece aquí.
figura 13: Calcular el coeficiente de correlación

Respuesta

El coeficiente de correlación para los datos recopilados es de 0,84 y es superior al que definió el accionista. Por consiguiente, los datos disponibles se usarán para predecir inversiones futuras.

Foros de HP Support

Encuentre soluciones y colabore con otras personas en el Foro de usuarios de HP