Dins l'entorn de l'estadística la covariància és una mesura de dispersió conjunta de dues variables estadístiques.[1][2]
Definició
La covariància de dues variables aleatòries i (de vegades també expressada ) es defineix com:
on és l'operador esperança.
Per a distribucions discretes la fórmula anterior es concreta en:[3]
Quan les variables aleatòries i són n-dimensionals, és a dir, i , la seva matriu de covariàncies és:
on és l'operador esperança.
Propietats
Les propietats de la covariància són les següents:
- Si tots els valors de la variable x, els sumem una constant k i a tots els valors de la variable y els sumem una constant k', la covariància no varia.
- Si tots els valors d'una variable x els multipliquem per una constant k i a tots els valors de la variable y els multipliquem per una constant k', la seva covariància queda multiplicada pel producte de les constants.
- A partir de les anteriors: si tenim dues variables SX, i amb la covariància , i transformacions lineals de les variables de la forma , la nova covariància es relaciona amb l'anterior de la forma: .
Si X , Y , W , i V són variables aleatòries de valors reals i a, b, c, d són constants ("constant" en aquest context significa no aleatori), després les següents veritats són conseqüència de la definició de covariància:
Càlcul incremental
La covariància es pot calcular de forma eficient incrementant els valors disponibles utilitzant una generalització de la fórmula per al càlcul de la variància:
No correlació i independència
Si X i Y són independents, llavors la seva covariància és zero. Això passa per la propietat d'independència,
El contrari, però, generalment no és cert: Alguns parells de variables aleatòries tenen covariància zero tot i que no són independents. Sota algunes hipòtesis addicionals, la covariància de valor zero implica independència, com per exemple en el cas de la distribució normal multivariant.
Relació amb el producte escalar
La majoria de les propietats de la covariància es poden derivar de les que comparteix amb el producte escalar:
- Bilinealitat: per a les constants a i b , i les variables aleatòries X, Y, i U,
- Simètrica:
- Definida positiva: , i implica que X és una variable aleatòria constant (K ).
Aquestes propietats impliquen que la covariància defineix un producte escalar sobre l'espai vectorial quocient que s'obté al considerar el subespai de variables aleatòries amb segon moment finit i identificar-ne cada parella que difereixi per una constant. Aquest espai vectorial quocient és isomòrfic al subespai de variables aleatòries amb segon moment finit i mitjana zero, i a aquest subespai, la covariància és el producte escalar de funcions reals a l'univers.
A conseqüència d'aquest resultat s'obté, a partir de la desigualtat de Cauchy-Schwarz, la següent desigualtat:
Referències
Vegeu també
|