Oggi cominciamo non a parlare ex novo, ma a richiamare brevemente i concetti principali sulle variabili aleatorie. Quindi sono cose che già conoscete. Se non le conoscete o non ve le ricordate, andatevi a guardare sui testi che avete utilizzato nell'altro corso o anche sui capitoli 3, 4, 5 del libro di Ross.
Quello che voglio dire è che io faccio una carrellata veloce, non mi fermo troppo, però se ci sono problemi o cose strane, come ho già sollecitato l'altra volta, interrompetemi e ne parliamo, ok? Allora, quindi ora cominceremo a parlare di variabili aleatorie che in linea di massima sintetizzeremo con VA. Come dicevamo, le avete già viste a probabilità e ne avete parlato e straparlato a probabilità.
Voi avete visto, ve le hanno introdotte come una variabile aleatoria, è una funzione che da uno spazio di probabilità, presumibilmente ω, f, p o qualcosa del genere, va allo spazio delle a... sintonizzarci sullo stesso linguaggio, anzi sintonizzarci perché è la prima volta che ci vediamo, e quindi per noi più semplicemente parliamo di variabile aleatoria, non tanto come funzione misurabile eccetera eccetera, ma come un esperimento probabilistico. in cui possibili sono numerici.
Ok? Voi, a probabilità, la terna base dello spazio di probabilità la chiamate omega fp? Cioè, voi avevate a probabilità...
Questa terna qui, allora, credo di darvi una buona notizia annunciandovi che le sigma algebre noi proprio le ignoreremo e parliamo di variabilità quando invece di un generico spazio omega abbiamo la retta reale. Ok? alla rete reale o un qualsiasi sotto insieme alla rete reale o insieme numerico. Esempio. Esempio, acquistiamo due componenti elettronici, ciascuno dei quali E io aggiungo, ci butto dentro concetti che già conoscete, indipendentemente l'uno dall'altro, concetto di indipendenza immagino che vi ritorni in mente, quindi ciascuno dei quali indipendente l'uno dall'altro può essere accettabile o difettoso.
Gra A come accettabile e D come difettoso. Ok? Con probabilità 0.7 accettabile, 0.3 è difettoso. Sostanzialmente, se i componenti elettronici che posso comprare, il 30% non funzionano. Ok?
Allora... Quello che può succedere qua è, avendo scelto, avendo comprato i due componenti elettronici, nel linguaggio di Mirko Dovidio avremmo ω che può essere accettabile, accettabile, accettabile, difettoso, difettoso, accettabile. Difettoso, difettoso. Con probabilità.
Accettabile, accettabile. Stiamo parlando di indipendenza l'uno dall'altro, quindi la probabilità che siano entrambi accettabili è uguale al prodotto delle due probabilità. Quindi questo è 0,7 per 0,7, cioè 0,49. Accettabile e difettoso. Con probabilità 0,7 per 0,3, che fa 0,21.
La stessa cosa qua. E questo è 0,09. Perché è difettoso o difettoso?
Con probabilità 0,3 per 0,3. Ok? Questo è...
La situazione O, F, abbiamo detto la ignoriamo, insomma la situazione dello spazio relativo all'esperimento probabilistico. Ma a noi di questa cosa interessa soltanto, quindi cancello tutto questo qua, siamo interessati solo a una cosa. Mi raccomando, soprattutto non cadete sotto le scale, ma questo... Ok.
Allora, tutta questa roba qua ci interessa molto relativamente. Quello che ci interessa è, la chiamo x, il numero... di componenti funzionanti accettabili ok allora Mirko vi avrebbe detto Consideriamo una funzione che ha ogni elemento di questo, associa un numero, eccetera, eccetera. Noi vogliamo semplificarci la vita, quindi tutto sto pippone ve lo faccio oggi, ma poi da domani non si farà più.
Che cosa succede? Il numero dei componenti citabili sono 0 o 1 o 2. Questo è quello che può succedere. Possono essere entrambe rotte, una rotta è una sana o entrambe sane.
Quindi i risultati possibili in questo esperimento visto così, dove questi sono i possibili esiti, sono dei numeri. Quindi stiamo parlando di una variabile aleatoria. In questo caso, poi, la probabilità che siano entrambe rotte è 0.09, la probabilità che siano entrambe accettabili è 0.49, E la probabilità di averne una sola accettabile è la somma di queste due e quindi è 0.42. Ok? In questo caso, quindi abbiamo un esperimento i cui esiti o risultati possibili sono dei numeri, ciascuno che si può verificare con determinate probabilità, questa x è una variabile aleatoria.
x è una variabile aleatoria. E come vi dicevo, d'ora in poi... ce ne freghiamo e ignoriamo totalmente la struttura omega fp che c'era sotto. Non perché non sia importante, ma perché tanto tutto questo l'avete già visto, per ristabilire il linguaggio ci basta solo questo. Altro esempio.
Arriviamo alla fermata dell'autobus. Lì sulla fermata c'è scritto che in questa fascia oraria il bus passa ogni 12 minuti. Non c'è scritto a che ora passa, ma c'è scritto fra mezzogiorno e le 5 l'autobus numero 247 passa ogni 12 minuti. Io non so quando è passato l'ultima volta, ma quello a cui sono interessato è x uguale quanto tempo devo aspettare il bus.
anche in questo caso il risultato è incerto Se io sapessi quando è passato l'ultimo e se sapessi che è vero che passa esattamente ogni 12 minuti, saprei esattamente quanto manca. Altrimenti, questo è un esperimento probabilistico in cui i risultati sono dei numeri. Perché? il tempo che io devo aspettare è un numero compreso tra 0 e 12 minuti. Mentre prima i risultati erano solo 3 possibili, 0, 1 o 2, qua i risultati sono tutti possibili risultati all'interno di un intervallo.
Ognuno con determinate probabilità, poi fra un po'andremo a vedere come funzionano queste probabilità. Ok? Questa, anche lei, è una variabile aleatoria.
Di una variabile aleatoria, in generale, noi siamo interessati a quella che è la distribuzione. Ok? Che vuol dire conoscere la distribuzione di una variabile aleatoria?
Vuol dire, saper dire, per ogni intervallo, diciamo, a b, io li metto così, aperto a sinistra e chiuso a destra, ma chiuso a sinistra, ogni intervallo, qualsiasi intervallo, chiuso o aperto dove vi pare, io devo saper dire per ogni intervallo, Qual è la probabilità che la variabile aleatoria assuma valori all'interno di quell'intervallo? Conoscere la distribuzione di una variabile aleatoria vuol dire essere in grado di fornire un numero per qualsiasi domanda di questo tipo con a e b reali. Qual è lo strumento base per conoscere la distribuzione di una variabile aleatoria?
È la sua funzione di ripartizione. La funzione di ripartizione di una variabile teoria x è, come dice il nome, una funzione che a ogni numero reale associa un valore nell'intervallo 0,1. Ed è definita così, f di x per ogni x reale qui dentro è uguale alla probabilità che la variabile a tori x grande assuma valori minori o uguali di x piccolo.
Domanda, che testo avete usato voi a probabilità? Cioè già sapevate tutto? Complimenti, no.
No, la domanda, allora la domanda è ancora più... La funzione di partizione è definita così, perché in alcuni testi è definita così. Solo col minore. Minore uguale?
Ok. Non è che cambi molto, però. Allora, questa è la funzione di ripartizione di una variabile aleatoria. Ha determinate proprietà che sono, per x piccolo che va a meno infinito, questa vale, le dico velocemente, questa vale 0 perché è la probabilità che qualcosa assuma valori più piccoli o meno infiniti.
Ed è impossibile. Per x che va più infinito, questa vale 1, perché la probabilità che x assuma un qualsiasi valore reale e quindi vale 1, è sempre non decrescente e poi ha delle proprietà di continuità che non stiamo a dare nel dettaglio. Se conosciamo questa, possiamo dare tutte queste risposte.
Perché? Perché posso scrivere qua probabilità che x appartiene all'intervallo AB chiuso a destra e aperto a sinistra è uguale alla probabilità che x sia minore o uguale di b meno la probabilità che x sia minore o uguale di a. Ok?
E questo è uguale a f di b meno f di a. Quindi la funzione di ripartizione ci consente di dare quella risposta che avevamo detto prima, di poter dare un numero per qualsiasi intervallo a B poter trovare la probabilità di quell'intervallo. Come vi dicevo, io l'ho messo aperto a sinistra e chiuso a destra perché viene comodo con questa definizione e ci dà la probabilità come differenza fatta così.
con pochi artifici, ma ve li devo accennare e ve li devo ricordare, dalla funzione di ripartizione, così come era definita, come verrà definita Mirko e come l'abbiamo riscritta qua, possiamo trovare la probabilità di qualsiasi tipo di intervallo, anche per esempio di intervalli così. facciamolo così, prima tutto chiuso anche intervalli chiusi a sinistra e aperti a destra o anche intervalli ok? Io adesso ve la scrivo direttamente.
Se siamo tutti d'accordo andiamo avanti, se invece non è chiaro perché, bloccatemi. Ok? Allora.
Abbiamo detto che per l'intervallo aperto a sinistra e chiuso a destra si basta fare la differenza. Questi intervalli qui cambiano rispetto a quello che avevo scritto prima per la chiusura delle parentesi, detta in modo diciamo improprio. Allora, questa probabilità qua si trova come f di b meno...
f di a meno, dove la convenzione è che questo f di a meno è il limite per x che tende ad a da sinistra di f di x. Ok? Quindi è quasi la stessa cosa, ma se in A la funzione di ripartizione non è continua, io devo andare a prendere il limite che tende alla sinistra. Perché in A e non in B?
Perché è in A che la parentesi è diversa da quella che avevo messo qua. Scusate, qua mi riscrivo. Se noi abbiamo come riflessione...
riferimento la probabilità che x è in AB così, uguale F di B meno F di A, per gli intervalli chiusi in modo diverso, io devo andare a vedere dove la parentesi non coincide con quelle qua. In questa prima riga la parentesi è diversa in A. Allora, invece di f di A ci metto f di A-.
Vi sto dando una regola mnemonica. Sotto c'è il teorema di continuità della probabilità, il fatto che la funzione di partizione è continua da sinistra e tutto un sacco di altre cose. Questo è solo un mnemonico.
Dove la parentesi è diversa ci devo mettere il limite sinistro. Per esempio qui, dov'è che è diversa la parentesi? Tutte e due, perché in A qui è chiusa e qui è aperta, in B lì è aperta e lì è chiusa, e allora in entrambi i casi ci devo mettere il limite sinistro. F di B meno, meno F di A meno.
Ok? Ancora, questa qua, dov'è che è diversa la parentesi? solo in B.
Quindi questo sarà F di B meno F di A. E in questo modo vi ho scritto, e spero di avervi richiamato alla mente, come dalla funzione di ripartizione io possa determinare la probabilità di un qualsiasi intervallo. La probabilità che una variabilità di x assuma valori in un qualsiasi intervallo. Adesso...
Vi ritorna in mente, come diceva Lucio Battisti, oppure c'è bisogno di qualche dettaglio in più, perché le cose funzionano così? Ti fidi? Però mi fido è classico che domani non te lo ricordi più. Cosa stai dicendo?
No, ok. Allora, possiamo andare avanti o dobbiamo spiegare il perché? No?
Ok. Andiamo avanti. E se no, lo andremo a chiedere a Mirko.
Il quale sarà sicuramente felice di rivedervi. Allora, continuiamo la nostra rapida carrellata. Variabili aleatorie ne vedremo e noi ci limiteremo a questo. Variabili aleatorie di due tipi. Variabili aleatorie discrete.
E poi fra un po'variabili aleatorie continue. Probabilmente nei corsi di probabilità seri, cioè quello che avete fatto a prima mano, avete visto anche variabiliatori che non sono né discrete né continue ma delle vie tra virgolette di mezzo, ma noi ci limiteremo a queste due categorie. Una variabilia discreta è una variabilia x è discreta. se può assumere al massimo un insieme numerabile di valori.
Cos'è un insieme numerabile? Ce lo ricordiamo. Un insieme, diciamo, che può essere messo in corrispondenza bionivoca con i naturali. Sostanzialmente si assume al massimo un numero finito di valori o una successione di valori. Se invece assume valori in un intervallo, non è più discreta.
Ok? Esempio, il numero di componenti accettabili di cui parlavamo prima. Vi ricordo che i valori possibili erano 0, 1, 2. che è un insieme finito e quindi siamo all'interno di questo schema perché al massimo è un insieme numerabile quindi finito o numerabile in genere per una variabilità discreta Indichiamo con x1, x2 e così via, xn se sono il numero finito o continuiamo, mettiamo dei puntini se abbiamo tutta un'intera successione. Indichiamo con x, con i, i valori che può assumere. Nel nostro esempio delle componenti elettroniche avevamo x1 uguale 0, 2 uguale 1, x3 uguale 2. Poteva assumere solo tre valori.
Ok? A ciascuno di questi associamo P1. P2, Pn, eventualmente altri puntini se andiamo avanti all'infinito, dove ciascuno è la probabilità che la variabile aleatoria assuma esattamente quel valore corrispondente. Ok? Nel nostro caso avevamo...
P1 che era la probabilità che x era uguale a x1 cioè uguale a 0, avevamo detto che era 0.09 mi pare. P2 probabilità di avere una sola componente sana che era uguale a 0.42 e P3 tutte componenti sane, probabilità che x uguale 2 ed era 0.49. Ok? Le x con i e le p con i definiscono totalmente la distribuzione della variabilatoria. Se conosco tutte le x con i e tutte le p con i, Allora conosco la distribuzione di x.
Come? Velocissimamente. Me la scrivo così per ora.
La probabilità che la variabilità torre a suma valori in un qualche intervallo non è altro che la somma per estesa alle x con i che appartengono all'intervallo e p con i corrispondenti. Quindi, dalle picconi alla probabilità di un generico intervallo si può passare così, oppure volendo si può fare il passaggio intermedio per la funzione di ripartizione f di x. che sarà uguale alla somma delle p con i estesa a tutti i valori x con i che sono minore o uguali di x.
Se volete io dalle p con i mi posso trovare la funzione di ripartizione e poi della funzione di ripartizione la probabilità degli intervalli come avevamo visto prima. Tanto per fare, nell'esempio banale di prima, x il numero di componenti sane, qual è la probabilità di avere almeno una componente sana? Questa è la probabilità che x assuma valori maggiori o uguali di 1, ok? O, ma che spero siamo d'accordo, che x sia nella semiretta, non è un intervallo, è una semiretta, ma insomma 1 più infinito e mi posso calcolare questa probabilità facendo la somma Somma, adesso sto facendo dei passaggi che non bisogna fare così al compito, ma... Somma, per tutte le x con i che appartengono a 1 più infinito, delle piccole i.
Quali sono le x con i che appartengono a 1 più infinito? Nel nostro esempio? 1 e 2. Quindi questa è... Queste x con i qua, 1 e 2 le avevamo chiamate x2 e x3, mi pare, e quindi questa sarà P2 più P3. Ok?
Quindi, come vedete, se conosco le p, mi posso trovare le probabilità di qualsiasi intervallo. Ripeto, non vi sognate l'esame di fare tutta questa cosa qua, per un esempio così banale. Va bene?
Allora, abbiamo parlato, come dicevo, solo per richiamare i concetti, di variabili aleatorie discrete. Una variabile aleatoria, invece, è continua, x, e immagino che in questo caso... Mirko e Barbara vi hanno detto assolutamente continua.
Io uso il linguaggio del ROS e quindi dico continua, ma è quello che avete studiato come assolutamente continua. X non avrebbe la teoria continua se esiste una funzione F Definita su tutta la retta reali a valori non negativi, tale che la probabilità che x assuma valori in un intervallo a b è uguale all'integrale fra a e b di f di x in dx. ok anche la Mirko e Barbara verranno definita per ogni insieme misurabile boreliano, ci basta saperlo dire per un qualsiasi intervallo, poi voi sapete che i boreliani si possono sempre ottenere come unioni, intersezioni, giochi simili sugli intervalli.
Morale della favola, x è una variabile continua se ammette funzione di densità, detta ex post dopo che abbiamo fatto tutto il corso e quindi già lo sappiamo come va a finire. Quella f è la funzione di densità. Allora, scriviamolo. f è detta di densità, ok?
E deve soddisfare due condizioni. Uno, f di x maggiore o uguale di zero, tra zero e più infinito. In teoria è troppo forte, basterebbe che sia maggiore o uguale a 0 su ogni intervallo, ma può essere anche negativo, nei singoli punti può assumere o ricevare, ma questo lo ignoriamo.
Sarebbe un maggiore o uguale a 0 quasi ovunque. Ma che voleva dire Mirko quando diceva quasi ovunque? Come?
Lo sapete benissimo cosa voleva dire, quindi non c'è. Ok. Parlo di Mirko, ma Barbara lo stesso, conosco un po'meglio Mirko, ma credo parlassero lo stesso linguaggio, russo o giù di lì.
La seconda condizione è che f deve integrare a 1 su tutto r, cioè l'integrale fra meno infinito e più infinito. di f di x in dx deve essere uguale a 1 se valgono queste due condizioni f è una funzione di densità e quindi funziona tutti i giochi che dicevamo là per esempio nell'esempio che abbiamo fatto prima della fermata dell'autobus Io posso definire questa funzione qua. Se io definisco questa funzione qua, questa funzione soddisfa queste due condizioni, è non negativa, è facile da vedere, integra 1, un po'più difficile, ma direi che ce la possiamo fare, ok?
Questa potrebbe essere una funzione che rappresenta la densità per quell'esempio. E quindi con che probabilità aspetto fra 5 e 8 minuti? Anzi, facciamolo prima così. La probabilità che x appartiene all'intervallo 5 e 8, cioè che aspetto fra 5 e 8 minuti.
Per quello che avevamo scritto prima, l'integrale tra 5 e 8 di quella funzione. Adesso, nell'intervallo fra 5 e 8, questa funzione vale sempre un dodicesimo, quindi io adesso cancello qua e voi invece sul foglio la riscrivete. Questo è un integrale difficile, ma voi siete quasi ingegneri, ce la potete fare a farlo. Ok? Un dodicesimo va fuori di un integrale, qua rimane uno, l'integrale di una costante è x, e quindi l'integrale di uno è l'ampiezza di un intervallo, questo è 3 per...
un dodicesimo uguale un quarto. Con probabilità un quarto, aspetto un intervallo di tempo fra 5 e 12 minuti. Ok? Non è necessariamente questo, ma insomma, cioè, non è necessariamente questa la densità di quella variabilità. Io posso essere particolarmente sfortunato che sono arrivato subito prima, con probabilità alta, subito, scusate, subito, subito dopo che sia passato l'autobus, eccetera, eccetera, però questa è una densità che può essere utilizzata per probabilizzare questa situazione.
La riconoscete, questa è una densità uniforme, ma su quello ci ritorniamo fra un po'. Vi faccio presente che gli integrali... anzi, scusate...
Prima di questo, una cosa, relazione tra, come prima avevamo visto per variabili discrete, dalle picconi come si arriva alla funzione di ripartizione, lo vediamo anche per queste continue, cioè se io conosco la f posso trovare anche la funzione di ripartizione. Allora usciamo dal nostro esempio, mettiamoci nel caso generale Abbiamo una variabile editoria x che ha una densità f che soddisfa queste due condizioni. Se voglio trovare la funzione di ripartizione in un certo punto, chiamiamolo per ora z, dove z è un qualsiasi reale, Questa qua è la probabilità che x appartenga all'intervallo meno infinito z.
Per quanto detto prima, per una variabilità continua, questa probabilità si calcola come integrale esteso all'intervallo, che in questo caso è una semiretta, di f di x in dx. Ok? Quindi che relazione c'è fra la funzione di ripartizione e la densità?
che la funzione di ripartizione è una primitiva della funzione di densità, primitiva nel senso dell'analisi, dei corsi di analisi. Una primitiva specifica, esattamente quella che vale 0 a meno infinito, perché voi sapete che esistono infinite primitive a meno di una costante, ma insomma è quella che va 0 per z che va a meno infinito. Quindi f è primitiva di f piccolo. E se f grande è primitiva di f piccolo, f piccolo che cos'è rispetto a f grande?
È la derivata. Ok? Quindi il passaggio tra funzioni di ripartizione e densità si ottiene facendo l'integrale per andare in un verso, la derivata per andare nell'altro verso. Poi c'è questa cosa per cui io, quest'anno è stato un caso che non l'abbia sbagliata, ma in genere la sbaglio sempre. Cioè, che noi indichiamo in genere come argomento della funzione di partizione ci mettiamo x, come argomento della densità ci mettiamo x, e allora tipicamente verrebbe da scrivere questo.
Ok? Me ne sono ricordato giusto in tempo, forse avevo addirittura cancellato e messo z. In genere questa qui la trovate scritta così.
Cioè state attenti a non far casino tra la variabile di integrazione e la variabile estremo dell'integrale che deve essere la stessa dove state calcolando. Ok? Domanda, perché l'integrale di una densità deve essere pari a 1? Risposta? Perché ha scritto il professore.
Fate bene a fidarvi di quello che scrivo io, ma non troppo, quindi... Perché deve essere pari a 1? Qualcuno ce l'ha una risposta? Allora, questa roba qua. Limite per z che se ne va più infinito della funzione di ripartizione.
Ok? Che cos'è di suo in termini di probabilità? La scrivo qui, è la probabilità che x minore o uguale di z, e ho scritto la funzione di ripartizione.
limite per z che tende a più infinito. Che cos'è? È la probabilità, allora questa è la probabilità che x sia minore o uguale a z, ma quando mando z a più infinito questa diventa la probabilità che x assuma un qualsiasi valore reale, giusto? Quindi questa qua da una parte, e lo scrivo qui, è la probabilità che x assuma un qualsiasi valore reale.
Siamo d'accordo? Se invece ci andiamo a scrivere f di z in questo modo, questa diventa limite per z che tende a più infinito, anzi scusate, prima di andare a scrivere questo in questo modo, quanto vale la probabilità che x assuma un qualsiasi valore reale? Uno.
Questo è il limite per z che va più infinito di questo integrale. Ok? Uguale ancora.
Esistono teoremi che permettono di questo limite di passarlo qua. Questa è l'opera integrale meno infinito più infinito f di x in dx. Allora se noi ci andiamo a fare a ritroso tutte queste cose, vediamo che questo integrale deve essere uguale a 1. Ed è proprio questa condizione qua.
Cioè la condizione, praticamente, questa condizione ci garantisce che la probabilità di tutto lo spazio sia uguale a 1, che come sapete è uno degli assomigli della probabilità. Quest'altra condizione qua, messa quasi ovunque, come ve lo dicevo, Mirko, serve per evitare che ci possano essere intervalli che hanno probabilità negative. Che se noi avessimo f di x negativa su qualche intervallo, andiamo a fare l'integrale su quell'intervallo e ci viene una probabilità negativa, cosa che ovviamente non ha senso. Ah, cosa importante!
Allora, voi sapete dai corsi di analisi, sicuramente non ve lo ricordate, però diamo per buono che lo sapete, che un oggetto di questo tipo Cioè, in una relazione di questo tipo, il termine di sinistra è una funzione continua. Ok? Cioè, se x è una variabilità continua, il che vuol dire che la funzione di ripartizione può essere scritta in questo modo, attraverso un'opportuna funzione di densità, allora la funzione di ripartizione corrispondente alla x è una funzione continua.
Il che vuol dire che f di a o f di a meno sono sempre la stessa cosa. f di b o f di b meno sono sempre la stessa cosa. che se una funzione è continua, la funzione del punto coincide con il limite, in questo caso la sinistra.
E quindi, tanto per fare un esempio, probabilità che x appartiene a questo intervallo è probabilità che x appartiene a quest'altro intervallo tutto chiuso, queste due probabilità sono uguali tra loro, perché questa era f di b meno f di a e questa era f di b meno f di a meno e quindi coincidono, ok? Se queste sono uguali, per ogni a, per ogni b, per ogni tutto, la differenza fra le due Questa differenza ha che cosa uguale? Ha zero.
Se sono uguali, la differenza è zero. Ma a sinistra, questa differenza che cos'è? Allora, probabilità che x appartiene all'intervallo AB chiuso sia a destra che a sinistra.
Meno probabilità che x appartenga all'intervallo AB chiuso a sinistra ma aperto a destra. La differenza fra i due, che probabilità è? Questa è la probabilità che x sia esattamente uguale ad A.
Ok? Ed è uguale a zero. E questo vale per ogni reale.
Cioè se x è una variabile diatoria continua, la probabilità che assuma un valore esatto è sempre uguale a 0 per tutti i possibili valori reali. È una cosa controintuitiva, perché sembrerebbe che ciascun valore di per sé è impossibile, è un evento quasi impossibile, però poi messi tutti insieme alla fine uno deve venire, ok? Però, quindi sono variabili attorie un po'controintuitive, ma così è la situazione, ok? Se x è una variabile attoria continua, la probabilità che assuma uno specifico valore è 0, e questo è vero per qualsiasi valore reale. Questo ovviamente non è vero per le variabili a tori discrete, l'abbiamo visto prima, perché possono assumere dei valori con probabilità positive.
In particolare, se x è una variabile a tori discreta, com'è fatta la sua funzione di ripartizione? La funzione di partizione è una funzione a gradini. Perché?
Proviamo a farla su... Proviamo a vederla sull'esempio banale e facile di prima. Vi ricordo che avevamo questi tre punti. x1 uguale 0 con p1 uguale 0.09 x2 uguale a 1 con P2 che era uguale a 0.42 se non ricordo male e x3 uguale a 2 con il corrispondente P3 uguale a 0.49. Ok?
Andiamoci a calcolare la funzione di ripartizione. E ovviamente ce la vogliamo calcolare per ogni x reale. Cominciamo da sinistra, quindi cominciamo per valori a sinistra di 2. ce la vogliamo calcolare da questa parte qua dell'asse, quindi per x minore di 0. Funzione di partizione di x uguale probabilità che x grande assuma valori minore o uguali di x.
Abbiamo detto prima uguale, somma, estesa alle x con i minore o uguali di x, somma di che cosa? Delle p con i corrispondenti. Ok? Questi passaggi che ho scritto qua sono quelli che avevamo già visto prima, valgono quale che sia la x. Adesso andiamo a vedere che succede al variare della x piccola.
Per x negativo, quali sono le x con i più piccoli o minori uguali di x? Nessuna. Ok? Quindi, quali sono le piccoli che devo sommare?
Ok, quindi per x negativo... f grande di x è 0, perché non devo sommare nulla. La funzione di partizione a sinistra di 0 vale 0. Adesso mettiamoci fra 0 e 1, prendiamo un x qua dentro.
Per ora li faccio tutti aperti e poi andiamo a chiudere, poi vediamo come chiuderli. Per x compreso fra 0 e 1, funzioni di partizione, questi tre passaggi sono identici, quello che cambia è quali sono le x con i che devo sommare. Solo la prima. Perché l'unica minore di un numero compreso fra 0 e 1 è 0. Quindi devo sommare solo P con 1 che vale 0.09.
Quindi fra 0 e 1 la dimensione di partizione vale... 0.09 e tutti questi punti non cambia mai esattamente in 0? cioè per x questo qua uguale a 0 cosa succede qui? chiedi a me allora Abbiamo x minuscolo in 0,1. Calcoliamo la funzione di partizione in questo punto.
Probabilità che x è meno 1, arriviamo qua. Questo è un numero compreso fra 0,1, per esempio 0,4. Dobbiamo fare la somma di tutte le x con i minori di 0,4. Quali sono?
Solo questa. La p con il corrispondente è questa. Ok?
Se invece 0,4 prendo 0,1, 0,7 è esattamente lo stesso. Se prendo 0,92 è uguale. Quindi per tutte le x comprese in 0,1 aperto la funzione di partizione vale 0,09.
Per x esattamente uguale a 0. Per x esattamente uguale a 0 che succede? Tutto uguale qua, devo prendere le x con i minori o uguali a 0, quindi la prima la devo prendere. Quindi, effettivamente, è chiuso così. E qua ci mettiamo un bel pallocchio per indicare che in x uguale a 0 vale 1. Adesso prendiamo x fra 1 e 2, adesso andiamo più velocemente. Per esempio, x uguale a 1,6.
Faccio questi passaggi. Quali sono le x con i minori uguali di 1,6? Le prime due. E quindi devo fare la somma delle prime due.
f di x uguale 0.51 non è proprio in scala facendo vedere Vedete che vi è una funzione a gradini. Se prendo x maggiore di 2, li dovrò sommare tutti e quindi f di x viene uguale a 1, maggiore o uguale di 2. Sarà un po'qua sopra se lo volessi fare in scala, ma insomma... E così abbiamo visto su un esempio, il che non dimostra nulla, ma voi fidate di me, mi credete e quindi vi sta bene così, che se una variabilità è discreta, la sua funzione di partizione è a gradini. In particolare i salti sono nei punti x con y. Se voi vedete i salti sono esattamente nei valori che può assumere la variabilità e l'ampiezza del salto è esattamente uguale alla P con i corrispondente.
Qua l'ampiezza è da 0 a 0,09 quindi è questa. Qua... L'ampiezza è tra 0,09 e 0,51, cioè esattamente questa.
E così via. Quindi una variabilità discreta ha funzione di ripartizione a gradini, in cui i salti sono nei punti x con y e hanno altezza, l'altezza del salto è il picco nico rispondente. Ci sono domande, obiezioni, cose non chiare, cose che non vi tornano in mente, di queste viste? Tutto ok?
Allora, continuiamo la nostra rapida carrellata parlando brevemente di variabiliatorie doppie. x, y è una variabile aleatoria doppia, che vuol dire che sostanzialmente in un qualche esperimento aleatorio invece di andare a guardare un solo risultato numerico, ne guardiamo due simultaneamente. Come l'altra volta avevo detto... avevo detto... Se io guardo in quest'aula, non mi ricordo se ho fatto l'esempio di peso e velocità nel correre 100 metri o cose del genere.
Pesco uno studente a caso e vado a vedere il peso e la velocità massima che ha nel correre 100 metri. Tanto per fare un esempio. Se x è una variabile a doppia, conoscere la distribuzione di x di xy, scusate, vuol dire saper rispondere alla domanda, saper calcolare probabilità che xy, la scrivo così per ora, elemento di... un qualche rettangolo per ogni rettangolo contenuto nel piano. Ok?
Conoscere la distribuzione di x e y vuol dire, se questo è l'asse x e questo è l'asse y, io prendo un qualsiasi rettangolo sul piano e so dire quanto vale la sua probabilità. Se chiamiamo questi due punti sulla x a b Questi due punti delle y cd, la probabilità di questo rettangolo è come dire probabilità che x appartiene all'intervallo a b e simultaneamente, quello è il simbolo di intersezione, l'ho fatto un po'storto ma è quello, y appartiene all'intervallo cd. Per conoscere la distribuzione devo saper rispondere a tutte domande di questo tipo, quale sia a, b o c o d.
scrittura più sintetica di questo che non mi sembra un'innovazione che ha cambiato la storia del mondo è che invece di intersezione la convenzione vuole ci smetta una virgola ok? ma è la stessa cosa Poi, voi che avete visto le sigma algebra con Mirko e con Barbara, sapete che se sapete rispondere a domande di questo tipo, allora poi siete in grado di trovare probabilità anche di insieme molto più complicati. di trovare probabilità di rettangoli, scusate, di triangoli o di qualsiasi insieme misurabile, ma come vi dicevo noi queste cose non... ok? Allora, qual è lo strumento?
Per calcolare queste probabilità, cioè io conosco la distribuzione della variabile doppia se conosco la funzione di ripartizione congiunta. F, ci metto un x, y come pedice qua, è la funzione di ripartizione doppia, che è definita come? È una funzione che a ogni punto del piano associa un numero ed è definita così. Fxy nel generico punto del piano xy è uguale alla probabilità che la variabile a x assuma valori minore uguale di x, virgola o intersezione che è la stessa cosa, y assuma valori minore uguale di y.
E voi sapete che attraverso opportune differenze seconde, da questo potete trovare le probabilità di qualsiasi rettangolo. In particolare, come per le variabili semplici, noi tratteremo variabili doppie o discrete o continue. Anzi, scusate, una cosa sola.
Ho riscritto la definizione di funzione di partizione di una variabile attoria doppia. perché volevo ricordarvi quale sono le relazioni tra la funzione di partizione doppia e le funzioni di partizione delle due variabiliatorie semplici x e y prese separatamente in particolare vi ricordo che la funzione di partizione della x in un generico x si può ottenere come deri No, non mi dovete stare a sentire perché dico sempre un sacco di fesserie. Come limite per y che tende a più infinito della doppia.
Quindi se io voglio la funzione di ripartizione della prima variabile, Prendo quella congiunta e mando la seconda variabile all'infinito. Perché è vero questo? Se io mando la seconda variabile all'infinito, è come dire x minore uguale di x, y minore uguale di più infinito, cioè y assume un qualsiasi valore. E quindi mi rimane soltanto la condizione x minore uguale di x.
Ricordiamoci, la variabile da mandare all'infinito è quella che non mi interessa. E ovviamente la funzione di partizione. di y si otterrà come limite mandando all'infinito la x ok?
in genere si usa questa nomenclatura la x presa da sola La distribuzione della x da sola è la distribuzione marginale di x, distribuzione marginale di y, distribuzione congiunta xy. Ok? Allora, si ha x, una variabile aleatoria semplice, discreta, che assume valori x1, x2, puntini puntini, x con i, eventualmente anche puntini puntini.
Ok? y, variabile aleatoria discreta, ha valori. y1, y2, puntini puntini, yj e eventualmente puntini puntini. Possono essere finiti o anche un insieme numerabile. Quindi ho due variabili datorie discrete.
Se considero la congiunta xy è discreta perché può assumere al più un'infinità numerabile di valori, che sono x1, y1, x1, y2 e così via, cioè fissato x1 e poi tutte le y possibili, o ancora x2, y1, x2, y2, 2, e così via, e così via per tutti gli altri. Abbiamo una riga che contiene un'infinità numerabile di punti, la prima riga, e abbiamo... Un'infinità numerabile di righe è così, ma voi sapete che un'unione numerabile di insiemi numerabili è ancora numerabile.
E quindi tutti i valori possibili sono ancora un insieme numerabile. In particolare, siccome non abbiamo lavagna sufficiente per scriverli tutti, questi valori li indichiamo con x con i, y con j, dove i scorre qua e j scorre qua. Ok?
Comunque un insieme numerabile per cui la congiunta è discreta. Viene indicato in genere con probabilità che xy assuma valore xyj viene indicato questo con pij. Questa è la probabilità che la prima variabile assuma il valore x con i e la seconda il valore y con j.
Scusate, voglio riscrivere questa perché c'è una cosa che non ve l'ho detto qua. Quindi in questo modo abbiamo in qualche modo definito la variabilatoria doppia discreta, poi alla fine... è impiccioso e noioso la simbologia, ma concettualmente sono semplici da trattare tanto quanto le altre.
Qui mi ero dimenticato di dirvi una cosa. Quando parlavo della relazione fra variabilatoria doppia e le due variabilatorie marginali, guardate una cosa, se io conosco questa, Se questa è nota, io posso da questa derivare le altre due. Se la congiunta è nota, posso tirarmi fuori le due marginali. Viceversa, note le marginali, in generale non è possibile tirare fuori la congiunta.
Quindi la congiunta in sé contiene più informazione delle due marginali. Il caso in cui, e ci torneremo fra poco, dalle marginali riesco a tirar fuori la congiunta è quando le due marginali sono indipendenti tra loro, ma ne parleremo fra un po'. Grazie. La scrivo un attimo e poi è analoga alla definizione di variabilità d'autoria doppia continua. È analoga a quella semplice, ma doppia.
E adesso la finisco di scrivere e poi la discutiamo. Allora, una variabilità doppia x, y è continua se esiste una funzione, questa volta non definita sulla retta ma definita su tutto il piano. a varianti non negativi, tale che la probabilità che la doppia assuma valori in un qualsiasi intervallo può essere scritta come integrare doppio, scusate, in qualsiasi rettangolo, può essere scritta come integrare doppio sul rettangolo di questa funzione. E questa qui è ovviamente la densità doppia.
congiunta di xy. È tutto analogo a quello che succede in R, però invece di intervalli trattiamo di rettangoli perché stiamo lavorando sul piano. Relazioni fra Come per la funzione di ripartizione possiamo stabilire una reazione tra la congiunta e le marginali?
Anche qui, f. La funzione di densità della variabile a teoria x può essere ottenuta dalla densità congiunta come Dery? No. Come? No.
Allora, scusate, ho provato a dargli derivata ma non mi hanno più creduto. Hanno rilanciato col limite, diciamo in analogia con quello che funzionava per la funzione di partizione, ma non è vero. In particolare come... meno infinito più infinito integrata rispetto alla seconda variabile ora magari faremo un esercizietto su questo tanto per richiamarle alla mente ne avete fatte a migliaia al corso di probabilità ma insomma quindi se io ho la congiunta x, y e voglio trovare la densità marginale della x, devo integrare rispetto all'altra variabile, rispetto alla y e viceversa se mi interessa la marginale della y.
Cerchiamo di capire perché è vera sta cosa, se ci riusciamo. La funzione di partizione marginale della x calcolata in un punto, lo chiamo u per non fare casini, quelli che dicevo prima di calcolata in un punto u, sappiamo per quello che avevamo visto prima sulle relazioni fra funzione di partizione e densità per le variabili aleatorie unidimensionale è l'integrale fra meno infinito e u di f di x di x. Ok? Tutti d'accordo? Questo l'avamo visto poco fa.
Ma questa qua la posso scrivere come probabilità che x è minore uguale di u, y appartiene a tutta la retta reale. Tutti d'accordo? Siete d'accordo con questo uguale o vi sembra strano? Ok. Vuol dire...
Se questo è l'asse x e questo è l'asse y e questo è il generico valore u, che sto calcolando la probabilità di tutta questa parte qua del piano. Ok? Allora, è una variabilità doppia.
Come si fa a calcolare la probabilità di questa specie di rettangolone un po'degenere, perché di fatto è un semipiano? Si fa come? Integrare doppio, l'avevamo detto prima, della densità congiunta su... Quello integrale strano che è meno infinito u per meno infinito più infinito.
Ok? Integrale doppio di x di y. Ok? Allora, come ho detto prima, la probabilità di un qualsiasi rettangolo, anche degenere come questo, che è più che un rettangolo, è un semipiano, si ottiene come integrale doppio sull'insieme della densità doppia congiunta.
Adesso... Scritto come sappiamo scrivere, per quello che sappiamo scrivere gli integrali doppi, è come integrare tra meno infinito, cioè lo scriviamo come due integrali uno dentro l'altro, integrale fra meno infinito e u rispetto alla x, e poi internamente integrale fra meno infinito e più infinito rispetto alla y. Ok?
E quello che stiamo integrando è la nostra f. x, y in x, y. Siamo d'accordo? Ci siamo con tutti i passaggi che ho fatto fino a qua?
Cioè, integrale scritto così, usiamo il teorema di Fubini. No, no, no, no. Allora, no.
Un integrale doppio in condizioni abbastanza regolari lo possiamo scrivere come due integrali semplici uno dentro l'altro. Vi piace di più detta così? Ok.
Va bene. Ve la passo, anzi voi me la dovete passare a me. E quindi lo scriviamo così.
Adesso, guardate sta roba qua. Uguale, uguale, uguale, uguale, uguale, guardate questa roba qua. O integrale fra meno infinito e u, integrale fra meno infinito e u di x.
Quindi la differenza fra quelle due scritture è che qua ho questa parentesi quadra e lì ho la densità fx di x. Questo vuol dire che questa densità deve essere uguale alla parentesi quadra. E la parentesi quadra è proprio, come avevo scritto prima, integrale fra meno infinito e più infinito di questa cosa qua.
Ok? Questo era per argomentarvi, e così ve lo ricordate, e non andate per tentativi, derivata o limite o quello che è. Ok, per ricordarvi come dalla densità congiunta è possibile ricavarsi la densità marginale di una delle due variabili.
Ovviamente se mi interessa quell'altra, devo utilizzare il teorema innominabile che diciamo due integrazioni una dentro l'altra, però devo fare nell'altro ordine. Ok? E così abbiamo scritto la relazione fra... fra densità marginale e densità congiunte vogliamo vedere un esempio prima di andarsene?
ma si dai abbiamo scritto formule per un'ora e mezza? almeno vediamo un esempio Allora, un esempio di come si tratta una variabile a teoria doppia, in cui non dobbiamo calcolare integrali complicati perché voi siete ingegneri e siete bravi, ma io sono statistico e non li so calcolare. Sono sicuramente esempi che avete già visto. Consideriamo xy, variabile a teoria doppia.
con densità congiunta f xy nel punto generico del punto xy uguale, questa è la più facile che vi potrà capitare, 1 se x è tra 0 e 1 e y è tra 0 e 1 e 0 altrove. Addirittura da ridere? No.
Allora, chiediamo, primo, verificare che f xy è una densità. doppia. Due, calcolare le densità marginali delle variabili aeree x e y. Questo oggetto qua l'avete visto almeno un milione di volte al corso di probabilità, non è altro che una densità uniforme sul quadrato 0,1 per 0,1.
È comoda perché non bisogna fare gli integrali. Primo punto, verifica, allora, innanzitutto come è fatta? Se questo è il nostro piano, anzi, non è il nostro piano, se questo è il piano cartesiano, variabile x, variabile y, 1, 1, quella densità vale 1 qua dentro e 0. fuori. Ok? Andiamo a verificare che è una densità doppia.
Che dobbiamo verificare? Primo punto che sia non negativa. Lo è? Sì. Vale 0 o 1, quindi è non negativa.
Secondo punto, che l'integrale su tutto il piano deve essere uguale a 1. Ok? L'integrale su tutto il piano di questa roba, come lo calcolo? È dura, eh? Zero?
Allora. Devo calcolare, anzi la scrivo così, l'integrale doppio su r quadro f di x, y in dx di y. Ok?
Mi passate la notazione questo quadrato qui. Allora, Così come non so calcolare l'integrale perché 0 da qualche parte, cioè definite in modi diversi su regioni diverse. Allora mi vado a spezzare l'integrale doppio nelle varie regioni a seconda di come è definita. Se voi mi passate che questo quadrato lo chiamo q come quadrato, questo diventa l'integrale doppio sul quadrato sempre di fxy più l'integrale doppio sul complemento del quadrato, q complemento. Ci siamo?
Tutti d'accordo? Ho riscritto questa cosa spezzando l'integrale sul quadrato e l'integrale sul complemento. Perché? Perché la funzione è definita in due modi diversi a seconda di se siamo sul quadrato o no. Adesso, Io lo cancello a mano.
Sul quadrato la funzione da integrare vale 1. Sul complemento del quadrato la funzione da integrare vale 0. Ok? Adesso... Quanto vale l'integrale di una funzione che vale sempre 0 da valer tutto?
Allora, se vi ricordate... Quando facciamo un integrale semplice, integrale univariato di 1 è uguale alla lunghezza dell'intervallo. L'integrale di 1 su un intervallo è uguale alla lunghezza dell'intervallo. L'integrale doppio di 1 su una regione è pari all'area della regione. Perché è come il volume del solido, eccetera, eccetera, però siccome l'altezza è sempre 1 viene uguale all'area.
Quindi questo integrale qua... è l'area del quadrato. Quindi quell'integrale doppio, io cancello tutto, rimane soltanto uguale area del quadrato.
Adesso, perfino uno che non è ingegnere ma che ha fatto statistica, sa che l'area del quadrato è lato al quadrato, qua la lunghezza del lato è 1, l'area di questo quadrato è 1. Quindi questa F è effettivamente una densità. Adesso se voi mi date 5 minuti calcoliamo una delle due densità marginali e poi l'altra ve la fate voi. Io rifaccio qui il disegnino del quadrato.
La densità vale 1 qui e 0 da tutte le altre parti. Ok? Voglio calcolare...
fx nel generico x, che per quanto avevamo detto prima è l'integrale fra meno infinito e più infinito della congiunta, integrata rispetto alla y, rispetto all'altra variabile. Quanto vale quest'integrale? Detta così non lo possiamo sapere perché che cosa stiamo facendo? Guardiamo su questo piano.
Se x è, se scelgo questo qua come x, se questo è il mio valore x in cui calcolo la densità, state presenti quella sto calcolando per x variabile. Allora andiamo a cercare cercare di capire in quale x la sto cercando. Se x è questo, io devo fare l'integrale, tengo la x ferma e integro rispetto a tutti i possibili valori della y, quindi devo fare l'integrale di quella funzione doppia lungo questa retta, ok? Ma lungo questa retta la funzione integrale a quanto vale?
Sempre 0. Ok? Se invece x sta qua, io che sto integrando? Integro, sempre con la funzione doppia, ma la integro lungo questa retta qua.
Quanto vale la funzione lungo questa retta qua? Un po'0 o un po'1 a seconda, vale 0 qua, 1 qua e poi 0 di nuovo. Morale della favola, per risolvere quell'integrale devo andarmi a vedere caso per caso in quale x sto lavorando. In particolare, se x è minore di 0, pesco sempre 0. Quindi metto una bella variante di graffa.
Considero x minore di 0. Allora, se x è minore di 0, cioè siamo qua, Lungo questa retta e becco sempre la funzione integranda che vale 0. Quindi è integrale tra meno infinito e più infinito di 0 di y. Se x è maggiore di 1, cioè ritorniamo in questo primo punto, quanto vale la funzione integranda? Sempre 0. Integrale tra meno infinito e più infinito di 0 di y. E se x è fra 0 e 1, invece siamo qua in mezzo. Cosa deve integrare?
Ora la faccio su tre pezzi, ma fra un po'farete solo la parte che conta. Devo integrare prima 0 fra meno infinito e 0, poi 1 qua e poi di nuovo 0. Quindi, quella integrale su tutta la retta sarà l'integrale fra meno infinito e 0 di 0 di y, più l'integrale fra 0 e 1 di 1 di y. più integrale fra 1 e più infinito di 0 di y. Questi tre valgono per x compreso fra 0 e 1. Ok?
Siamo d'accordo come l'abbiamo impostato? Che succede? Una cavola?
Allora, io ho messo volutamente soltanto i minori. Ok? Non li ho messi gli uguali, perché sugli uguali alla fine siamo sempre un po'indecisi, ma soprattutto sugli uguali non ce ne frega niente.
Perché non ce ne frega niente? Scusate se lo dico in francese. Perché non ci interessa? Perché noi sappiamo che la funzione di densità, se la cambio in un solo punto, non cambia nulla nel calcolo degli integrali.
E quindi non cambia la funzione di partizione. Quindi io me la calcolo in tutti gli intervalli aperti. Poi negli uguali posso mettere quello che mi pare e non cambia nulla. Ok? Allora, quanto vale questo primo integrale?
Zero. Quanto vale questo secondo integrale? Zero. Quanto vale questo qui? Cazzo sei fortissimo a fare gli integrali, eh?
Questo? E questo? Morale della favola?
La nostra fx in x vale, scrivo prima questo, vale 1 se x è compreso tra 0 e 1 e vale 0 altrove. Ok? Poi... come ho detto un attimo fa a lui qui l'ho messo aperto lo posso mettere chiuso lo posso mettere chiuso da una parte e aperto dall'altra per variabili datori continue anzi, in genere, nella definizione delle densità i singoli punti non contano nulla potrei scrivere 247 per x uguale a 1. Poi vado a fare tutti i conti e viene esattamente lo stesso. La funzione di partizione che viene fuori è esattamente la stessa.
Quindi l'importante è quello che succede sugli intervalli. Nei singoli punti non cambia. Ok?
Allora, voi a casa vi fate la marginale della y, che verrà uguale. E poi, quando ci vediamo martedì alle 9, non alle 10, ne facciamo uno simile ma un po'diverso. Ok? Ragazzi, buon fine settimana, ci vediamo martedì.