A l'estudi de molts experiments aleatoris molt sovint no ens interessa el resultat que s'obté sinó alguna quantitat numèrica relacionada amb ell. Per exemple, quan algú aposta en un joc d'atzar no l'interessa tant conèixer el resultat com el benefici (o la pèrdua) obtingut. Informalment, es defineix variable aleatòria com una funció que assigna un valor numèric real a cadascun dels resultats possibles d'un experiment aleatori.
Definició
Designem per el conjunt de resultats possibles d'un experiment aleatori. Una variable aleatòria és una aplicació .[1][2] Vegeu la definició formal a la secció Definició formal de variable aleatòria. Quant a la notació, la variable aleatòria se sol indicar per (en majúscules) i el valor observat d'aquesta variable aleatòria per (és a dir, en minúscules).
Es diu "aleatòria" perquè el seu domini és constituït pels resultats d'un experiment influït per l'atzar i se'n diu "variable" perquè pren valors numèrics que varien (d'acord amb la probabilitat). Cal dir, però, que la paraula variable és una mica confusa, ja que, com hem comentat, una variable aleatòria és una funció o aplicació, i no es correspon al que en altres parts de la matemàtica s'anomena la variable d'una funció.
Exemple. Considerem l'experiència aleatòria del llançament de dos daus. El conjunt de resultats possibles d'aquesta experiència és: on el parell vol dir que al primer dau (dau1) hem obtingut el resultat i al segon dau (dau2) hem obtingut el resultat . En general els elements de es designen per .
Podem considerar la variable aleatòria que a cada resultat de l'experiència li assigna la suma dels punts dels dos daus, és a dir:
D'aquesta manera tenim una aplicació . Per exemple, el resultat (és a dir, dau1=1 i dau2=3) tindrà assignat el valor real 4: .-
Els valors possibles de la variable aleatòria serien: .
S'escriu per indicar l'esdeveniment format pels resultats que fan que . Per exemple,
Tipus de variables aleatòries
Estudiarem tres tipus de variables aleatòries: discretes, contínues (de fet, absolutament contínues) i mixtes.
Variables aleatòries discretes
Una variable aleatòria s'anomena discreta si pot prendre un nombre finit o infinit numerable de valors.
Exemples
La variable aleatòria que hem vist anteriorment del llançament de dos daus: suma dels punts dels dos daus, i que pot prendre un nombre finit de valors: 2,3, ...,12.
Una variable aleatòria amb distribució binomial, de paràmetres i , que pot prendre els valors . Per les seves aplicacions, és una de les distribucions discretes més importants.
Una variable aleatòria amb distribució de Poisson que pot prendre qualsevol nombre natural: ; per tant, pot prendre un nombre infinit numerable de valors.
Funció de probabilitat d'una variable aleatòria discreta
Considerem una variable aleatòria discreta i sigui , amb , el conjunt finit o infinit numerable de valors possibles que pot prendre. S'anomena funció de probabilitat[3] (o funció de massa de probabilitat) de a la funció definida per
Exemple. En el cas dels dos daus tenim, per exemple, que perquè l'esdeveniment té com a únic cas favorable (1,1) (és a dir, {dau1=1 i dau2=1}). Anàlogament, es calculen els altres valors de la funció de probabilitat:
Propietat. La funció de probabilitat determina totes les probabilitats relacionades amb :
Continuant amb l'exemple anterior, la probabilitat d'obtenir una suma dels dos daus menor o igual a 7 serà:
Observació. Alguns autors[4] defineixen la funció de probabilitat sobre tot el conjunt dels nombres reals: ,
Cal notar que a menys que per algun valor . A tots els efectes, ambdues definicions són equivalents.
Donada una variable aleatòria general la seva funció de distribució[5] és la funció definida per
Aquesta funció permet unificar l'estudi de diverses propietats de les variables aleatòries (vegeu la secció Definició formal de variable aleatòria). En particular, per a una variable discreta , amb les notacions anteriors, la seva funció de distribució vindrà donada perExemple. Suposem que llencem dues monedes a l'aire. Indiquem una cara amb i una creu amb . Els possibles resultats de l'experiment són observar dues cares , una cara seguida d'una creu , una creu seguida d'una cara i dues creus . Així,
Sigui la variable aleatòria que compta el nombre de cares obtingudes en el llançament. És a dir, és la funció
donada per
El conjunt possibles valors de és . O sigui, és una variable discreta, ja que només pot prendre els valors 0, 1 i 2.
La funció de probabilitat és . Vegeu la Figura 1.
La funció de distribució ve donada per
.
Vegeu la Figura 2.
Variables aleatòries contínues
Entre les variables aleatòries que poden prendre un nombre de valors no numerable, per exemple, una variable que pugui prendre qualsevol nombre real, tenen especial importància les variables aleatòries que tenen funció de densitat, les quals també s'anomenen variables aleatòries asolutament contínues, o senzillament variables contínues.
Una variable aleatòria es diu que té densitat o que és absolutament contínua o que és contínua si existeix una funció que compleix
1.
2. és integrable i és a dir, l'àrea total entre la gràfica de la funció de densitat i l'eix d'abscisses és 1. Vegeu la Figura 3.
3. Per a ,
Així, la probabilitat que la variable prengui un valor de l'interval és l'àrea de la zona limitada pel gràfic de la funció, l'eix de les i l les rectes i .Vegeu la Figura 4.
La funció s'anomena funció de densitat de . La funció de distribució és
Moltes de les variables d'estudis estadístics reals poden ser formalitzades amb el model d'una variable aleatòria contínua:
La mesura del temps d'avanç o retard amb què un tren arriba a la seva destinació.
El pes dels nadons en una població.
Les alçades de la població adulta.
La fracció de massa que s'ha desintegrat per unitat de temps en una substància radioactiva.
Exemples
1. El pes d'una persona és una variable contínua, assumint que podem mesurar el pes amb infinita precisió. Per exemple, podríem caracteritzar el pes amb una distribució normal amb mitjana 70 i desviació estàndard 10.
2. Distribució uniforme en un interval . La funció de densitat ve definida per:
i la funció de distribució és
3. Com a exemple de l'anterior podem considerar el següent: Per una parada d'autobusos en passa, amb absoluta regularitat, un cada 10 minuts, Si representa el temps que ha d'esperar una persona que arriba aleatòriament a la parada, aleshores té una distribució uniforme a l'interval . La funció de densitat de probabilitat de la variable aleatòria que es mostra al gràfic de la Figura 5. El valor de f(x) per a l'interval de temps s'ha fixat de manera que l'àrea sota la funció sigui 1. Si una persona arriba a la parada aleatòriament, quina és la probabilitat que hagi d'esperar-se 7 minuts o més? La resposta s'obté calculant l'àrea del rectangle ombrejat. El valor de serà, doncs, .
Observació. Les funcions de densitat no són úniques, i es poden modificar sobre un conjunt finit o infinit numerable de punts (de fet, sobre un conjunt de mesura de Lebesgue zero). Per exemple, retornant a l'exemple 2, la funció també és una funció de densitat de la distribució uniforme en l'interval .
Variables aleatòries mixtes
Hi ha variables aleatòries que són una combinació dels dos tipus anteriors. Per exemple, considerem un mecanisme aleatori com el de la Figura 6: si l'agulla va a parar a la zona de l'esquerra (àrea grisa) aleshores s'obté un 0; si va a parar a la zona de la dreta, aleshores s'obté un nombre decimal entre 0 i 1 amb distribució uniforme. Anomenen el resultat, que és una variable aleatòria que pot prendre un nombre no numerable de valors i, per tant, no és discreta, però d'altra banda , i tampoc és contínua. La funció de distribució val:
Vegeu la Figura 7. Una variable aleatòria d'aquest tipus es diu que és mixta[6].
Paràmetres de les variables aleatòries
Estudiarem dos paràmetres per mesurar numèricament "el centre" i "la dispersió" d'una variable aleatòria. Vegeu esperança matemàtica i variància
Variable aleatòria discreta
Mitjana
La mitjana o esperança matemàtica d'una variable aleatòria discreta es defineix en termes de la funció de probabilitat:
sempre que .
En l'exemple dels dos daus val:
La mitjana d'una variable aleatòria rep també el nom de valor esperat (o esperança) i es representa
Variància
En teoria de la probabilitat i estadística, Variància és un paràmetre estadístic que mesura la dispersió d'una variable aleatòria respecte la seva mitjana o esperança .[7]
sempre que
En el cas discret es calcula per la fórmula
La variància és el quadrat d'una altre paràmetre de dispersió, la desviació tipus, és a dir: .
La variància és representa mitjançant , , o simplement .
La variància té un paper central en: estadística descriptiva, inferència estadística, test d'hipòtesi, mètode Monte Carlo,...
És també molt important en les ciències que utilitzen sovint l'anàlisi estadística de les dades.
Variable aleatòria contínua
Mitjana
La mitjana o valor esperat d'una variable aleatòria contínua es defineix en termes de la funció de densitat de probabilitat:
sempre que .
Variància
La variància es defineix per la fórmula:
sempre que .
Funcions de variables aleatòries
A l'aplicar una funció a una variable aleatòria s'obté una altra variable aleatòria. Més concretament, si tenim una variable aleatòria i una funció , aleshores també és una variable aleatòria (vegeu a la darrera secció les condicions formals). La funció de distribució de és
Funcions de variables aleatòries amb densitat
Càlcul de la funció de densitat per derivació de la funció de distribució
Si coneixem la funció de densitat d'una variable aleatòria, aleshores funció de distribució val Si és contínua, llavors pel teorema fonamental del càlcul, la funció es pot derivar en tots els punts i En moltes situacions es pot calcular la funció de distribució d'una variable aleatòria, i si és contínua i derivable en quasi tots els punts, ens preguntem si la seva derivada és la funció de densitat. Això en general no es veritat; per exemple, la funció de distribució de la distribució de Cantor compleix que en quasi tots els punts i, per tant, tindríem que la funció de densitat seria zero quasi en tots els punts, la qual cosa és absurda. Una propietat molt útil dona condicions sota les quals la funció de densitat es pot obtenir derivant la funció de distribució.
Propietat.[8] Considerem una variable aleatòria amb funció de distribució . Suposem que
és continua en tots els punts.
és derivable en tots els punts, excepte, com màxim, en un nombre finit de punts.
La derivada és contínua en tots els punts excepte, com màxim, en un nombre finit de punts.
Aleshores és la funció de densitat d'aquesta variable aleatòria.
Exemple 1. Sigui una variable aleatòria uniforme en l'interval , , amb funció de densitat
Definim Volem calcular la funció de densitat de . Començarem calculant la seva funció de distribució, que designarem per .
1) Si , aleshores
2) Si , de manera semblant es comprova que
3) Finalment, per a , En resum,
Així, és derivable en tots els punts excepte als punts 0 i 1, vegeu la Figura 8. La derivada val
Noteu que aquesta funció no està definida a i , vegeu la Figura .Per tant, la funció de distribució de compleix les tres condicions de la propietat anterior, i per tant, la seva funció de densitat és (vegeu la Figura 9) Observació. Als punts 0 i 1 on no està definida i es pot donar a la funció de densitat qualsevol valor, ja que per calcular probabilitats relacionades amb allò que ens interessa és el valor de la integral de la densitat sobre subconjunts de . Així, podem prendre com a funció de densitat la funció
Fórmula de canvi de variables
Sota certes condicions, si és una variable aleatòria amb densitat i una bona funció, aleshores la variable aleatòria té funció de densitat. La funció no cal que estigui definida a tot i n'hi ha prou amb que ho estigui en el conjunt on pren valors la variable aleatòria .
Propietat.[9][10] Considerem una variable aleatòria amb funció de densitat , i tal que , on , amb . Sigui on , amb , una funció bijectiva, estrictament creixent o estrictament decreixent, contínua amb derivada contínua. Designem per la funció inversa. Aleshores la variable aleatòria té funció de densitat
Aquesta expressió també es pot escriure on és la funció indicador del conjunt : Noteu que la fórmula anterior també es pot escriure en termes de la funció , Exemple 2. Sigui una variable uniforme en l'interval (0,2), , que, per tant, està concentrada a l'interval (0,2): ; la seva funció de densitat és
Sigui . La funció és bijectiva, estrictament creixent i amb derivada contínua. La seva inversa és Llavors, la variable aleatòria tindrà funció de densitat Extensió a una funció més general
La propietat anterior exigeix condicions molt fortes que, a la pràctica, sovint no es compleixen. En l'Exemple 1 d'aquesta secció,
la funció no és bijectiva. Menys restrictiva és la següent propietat, on la funció se separa en diferents funcions, cadascuna de les quals té bones propietats.
Propietat.[11][12] Sigui una variable aleatòria amb funció de densitat , i tal que , amb intervals oberts disjunts dos dos. Considerem una funció tal que les restriccions siguin funcions bijectives, estrictament creixents o decreixents, contínues, derivables amb derivada contínua, amb inversa (els intervals no cal que siguin disjunts). Aleshores la variable aleatòria té funció de densitat
on
Exemple 1 (repetició per un altre mètode). Sigui i . Escrivim i . Tenim que i considerem les dues funcions que compleixen les condicions demanades, vegeu la Figura 10. Les inverses són Llavors,
Definició formal de variable aleatòria
Considerem un espai de probabilitat, on és un conjunt, és una σ-àlgebra sobre (la família d'esdeveniments) i és una probabilitat. Designem per la σ-àlgebra de Borel sobre els nombres reals . Una variable aleatòria[13] és una aplicació que és mesurable, és a dir, que per qualsevol ,
En les expressions com (1), els elements no s'acostumen a escriure (però cal tenir-los sempre presents), de manera que s'escriu en lloc de , o bé es posa
o altres expressions similars.
Donada l'estructura de la -algebra de Borel sobre els nombres reals, per demostrar la condició (1) n'hi ha prou amb comprovar-la per a qualsevol classe d'intervals de la forma o , etc.[14] Molts autors prenen aquest darrer tipus d'interval, de manera que la condició de variable aleatòria es pot formular:
Cas d'espais finits o numerables
Quan el conjunt és finit o infinit numerable, en molts casos es pot prendre com -àlgebra d'esdeveniments el conjunt de les parts de . Llavors[15], qualsevol aplicació compleix la condició de mesurabilitat (1) i, per tant, en aquest cas, la definició intuïtiva del principi i la formal coincideixen.
Operacions amb variables aleatòries
1. Si i són dues variables aleatòries, aleshores[16] son variables aleatòries, i si per tot , aleshores també és una variable aleatòria.
2. Si és una successió de variables aleatòries tals que per tot la successió numèrica convergeix, aleshores la funció definida per
3.Sigui una variable aleatòria i una funció mesurable respecte la -àlgebra de Borel. Aleshores també és una variable aleatòria.[17]
Observacions:
(a) La funció no cal que estigui definida a tot , sinó només al conjunt on pren valors la variable . Per exemple, si és discreta, ha d'estar definida en el conjunt dels punts tals que . O si és una variable no negativa, aleshores n'hi ha prou que estigui definida a .
. És a dir, és discontínua en el punt si i només si .
Observacions
1. Alguns autors[19] defineixen la funció de distribució per . Aquesta funció és contínua per l'esquerra.
2. En relació a les variables aleatòries discretes, als exemples que hem vist, així com en els casos més habituals, com la distribució binomial o la de Poisson, la funció de distribució és esglaonada, però en general no ha de ser així. El següent exemple és de Loeve[20]: sigui una ordenació dels nombres racionals, i sigui una variable aleatòria tal que
Aleshores la corresponent funció de distribució no és esglaonada; de fet, ni tan sols es pot dibuixar. (Recordeu que , on és la funció zeta de Riemann[21].)
3. Pel que fa referència a les variables absolutament contínues, des del punt de vista teòric, les funcions de densitat són mesurables de Borel i les integrals que apareixen són integrals de Lebesgue. Però a la pràctica, gaire bé totes les funcions de densitat són contínues o contínues a trossos, i les integrals es poden considerar integrals de Riemann ordinàries.[22].
4 Una variable aleatòria es diu que és contínua (respectivament absolutament contínua) si la seva funció de distribució és contínua (resp. absolutament contínua). El fet que hi hagi funcions de distribució que són contínues però no absolutament contínues com la distribució de Cantor fa que, en rigor, caldria distingir entre ambdós tipus de variables. Però les funcions de distribució contínues no absolutament contínues són excepcions, i molts autors de referència, com Johnson, Kotz and Balakrishnan[23], utilitzen el nom de variables contínues per referir-se a variables absolutament contínues.
Llei o distribució d'una variable aleatòria
Una variable aleatòria definida en un espai de probabilitat indueix una probabilitat, designada per , sobre l'espai mesurable de la següent manera: per qualsevol ,
Aquesta probabilitat s'anomena la llei[24] o la distribució de probabilitat[25] o senzillament distribució de la variable aleatòria , i no s'ha de confondre amb la funció de distribució que hem vist anteriorment; la seva relació ve donara perEn el cas discret, la forma habitual de referir-se a la llei és mitjançant la funció de probabilitat, i en el cas absolutament continu per la funció de densitat.
Igualtat en llei (o distribució) de variables aleatòries
Diem que dues variables aleatòries (que poden estar definides en diferent espai de probabilitats) són iguals en llei o distribució si les lleis són iguals.
Exemples
Juguem amb un dau perfecte, considerem la variable que val 1 si surt parell i 0 si surt senar. Tirem una moneda perfecta; sigui la variable que pren el valor 1 si surt cara i 0 si surt creu. Ambdues variables estan definides en espais de probabilitat diferents però són iguals en llei.
Dues variables poden estar definides en el mateix espai de probabilitat i ser iguals en llei, però ser distintes com aplicacions. A l'exemple inicial on tiràvem dos daus, si representa el resultat del primer dau i el del segon dau, aleshores ambdues variables són iguals en llei, però
Igualtat quasi segura de variables aleatòries
Es diu que dues variables aleatòries (definides en el mateix espai de probabilitat) són iguals quasi segurament o iguals amb probabilitat 1 si . Si dues variables són iguals quasi segurament, aleshores són iguals en llei. El recíproc no és cert, tal com mostra l'exemple 2 de l'apartat anterior.