Alcunidadi a sei facce, spesso utilizzati per spiegare il calcolo delle probabilità.
Il concetto diprobabilità, utilizzato a partire dalXVII secolo, è diventato con il passare del tempo la base di diverse discipline scientifiche rimanendo tuttavia non univoco. In particolare su di esso si basa una branca dellastatistica (lastatistica inferenziale), cui fanno ricorso numerose scienze sianaturali chesociali.
I primi studi che portarono successivamente a concetti legati alla probabilità possono essere trovati a metà delXVI secolo inLiber de ludo aleæ diCardano (scritto nel 1526, ma pubblicato solo un secolo e mezzo dopo, nel 1663) e inSulla scoperta dei dadi diGalilei (pubblicato nel 1656). In particolare, Galileo spiegò come mai, lanciando tre dadi, la probabilità di uscita delle somme 10 e 11 sia più probabile dell'uscita del 9 e del 12, nonostante entrambi i risultati si ottengano da un uguale numero di combinazioni.[1] Il problema della ripartizione della posta in gioco nel caso che un gioco d'azzardo debba essere interrotto venne affrontato daPacioli nellaSumma de arithmetica, geometria, proportioni et proportionalita (pubblicata nel 1494) e successivamente daTartaglia, per poi essere risolto daPascal eFermat.
La nascita del concetto moderno di probabilità viene attribuita a Pascal e Fermat. IlCavalier de Méré (un accanito giocatore) aveva calcolato che ottenere almeno un 6 in 4 lanci di undado non truccato era equivalente ad ottenere almeno un doppio 6 in 24 lanci, sempre di un dado non truccato. Tuttavia, giocando secondo tale convinzione, invece di vincere perdeva e scrisse a Pascal lamentando che la matematica falliva di fronte all'evidenza empirica.[2] Da ciò scaturì una corrispondenza tra Pascal e Fermat in cui iniziò a delinearsi il concetto di probabilità nell'accezione frequentista.
Pascal annunciò nel 1654 all'Accademia di Parigi che stava lavorando sul problema della ripartizione della messa in gioco. E in una lettera del 29 luglio dello stesso anno a Fermat propose la soluzione del problema, affrontato con il metodo per ricorrenza, mentre Fermat utilizzava metodi basati sulle combinazioni. Nel 1657Huygens scrisse unLibellus de ratiociniis in ludo aleæ,[3], il primo trattato sul calcolo delle probabilità, nel quale introduceva il concetto divalore atteso. I suoi lavori influenzarono tra l'altroMontmort, che scrisse nel 1708 unEssai d'analyse sur le jeux de hasard, ma ancheJakob Bernoulli ede Moivre.
Nel 1713 viene pubblicato postumoArs conjectandi diJakob Bernoulli, dove veniva dimostrato ilteorema che porta il suo nome, noto anche comelegge dei grandi numeri. Successivamente, de Moivre pervenne a una prima formulazione, poi generalizzata daLaplace, delteorema centrale del limite. La teoria delle probabilità raggiunse così basi matematicamente solide e, con esse, il rango di nuova disciplina. In essa esercita un ruolo centrale il rapporto tra casi favorevoli e casi possibili e la probabilità è un numero intrinsecamente legato ad un evento. Negli anni centrali delXX secolo, tuttavia, primade Finetti e poiSavage hanno elaborato una concezione soggettiva della probabilità, secondo cui essa è il grado di fiducia che una persona ha nel verificarsi dell'evento.
Nello stesso periodo,Kolmogorov ha dato inizio alla moderna teoria assiomatica (Grundbegriffe der Wahrscheinlichkeitsrechnung, 1933), ispirandosi allateoria della misura. Si è così affermata una teoria della probabilità puramente matematica, che generalizza il patrimonio matematico comune alle diverse impostazioni.
In probabilità si considera un fenomeno osservabile esclusivamente dal punto di vista della possibilità o meno del suo verificarsi, prescindendo dalla sua natura. Tra due estremi, dettievento certo (ad esempio: lanciando un dado a sei facce si ottiene un numero compreso tra 1 e 6) edevento impossibile (ottenere 1 come somma dal lancio di due dadi), si collocanoeventi più o meno probabili (aleatori).
Si usa il linguaggio dellateoria degli insiemi: un insieme non vuoto (dettospazio delle alternative) ha come elementi tutti i risultati possibili di un esperimento; l'evento che risulta verificato da un unico risultato (un unico elemento di) viene dettoevento elementare; altri eventi sonosottoinsiemi di costituiti da più risultati.[4]
Gli eventi vengono normalmente indicati con lettere maiuscole. Dati due eventi e, si indica con la loro unione, ovvero l'evento costituito dal verificarsi dell'evento oppure dell'evento. Si indica con la loro intersezione, ovvero l'evento costituito dal verificarsi sia dell'evento che dell'evento.[5] Se i due eventi e vengono dettiincompatibili (non possono verificarsi simultaneamente). Ilcomplemento di un evento rispetto a,, è dettonegazione di e indica il suo non verificarsi (ovvero il verificarsi dell'evento complementare).
Secondo la prima definizione di probabilità, per questo detta «classica», la probabilità di unevento è il rapporto tra il numero dei casi favorevoli e il numero dei casi possibili.[6]
Indicando con l'insieme di casi possibili e con la suacardinalità, con un evento e con la sua cardinalità, ovvero il numero dei casi favorevoli ad (ad esempio, nel lancio di un dado,,"esce unnumero pari",), la probabilità di, indicata con, è pari a:
Dalla definizione seguono tre regole:
la probabilità di un evento aleatorio è un numero compreso tra e;
la probabilità dell'evento certo è pari a, la probabilità dell'evento impossibile è pari a: ad es. se"esce un numero compreso tra 1 e 6", e, se invece"esce un numero maggiore di 6", e.
la probabilità del verificarsi di uno di dueeventi incompatibili, ossia di due eventi che non possono verificarsi simultaneamente, è uguale alla somma delle probabilità dei due eventi; ad esempio se"esce un numero pari", con, e"esce il numero 3", con, la probabilità che tirando un dado si ottenga un numero pari oppure un 3 è:
Come elemento propedeutico alla successiva definizione frequentista Introduciamo, appunto, il concetto di frequenza. Nell'esempio del lancio del dado con evento"numero pari", indichiamo come successi () il numero di volte che otteniamo un numero pari ed () il totale dei lanci effettuati, la frequenza è uguale a. Il rapporto indica la frequenza dell'evento favorevole "uscita numero pari". Inoltre per lalegge dei grandi numeri con un numero elevatissimo di lanci il valore di tende a quello di che è interpretata, dalla definizione frequentista della probabilità descritta di seguito, come limite a cui tende.
La definizione classica consente di calcolare effettivamente la probabilità in molte situazioni. Inoltre, è una definizione operativa e fornisce quindi un metodo per il calcolo. Presenta tuttavia diversi aspetti negativi non irrilevanti:
dal punto di vista formale, è una definizione circolare: richiede che i casi possiedano tutti la medesima probabilità, che è però ciò che si vuole definire;
non definisce la probabilità in caso di eventi non equiprobabili;
presuppone un numero finito di risultati possibili e di conseguenza non è utilizzabile nelcontinuo.
Per superare tali difficoltà,von Mises propose di definire la probabilità di un evento comeillimite cui tende la frequenza relativa dell'evento al crescere del numero degli esperimenti:
La definizione frequentista si applica ad esperimenti casuali i cui eventi elementari non siano ritenuti ugualmente possibili, ma assume che l'esperimento sia ripetibile più volte, idealmente infinite, sotto le stesse condizioni.
Anche tale definizione consente di calcolare la probabilità di molti eventi e da essa si ricavano le stesse tre regole che seguono dalla definizione classica. È sufficiente, infatti, sostituire il rapporto tra numero dei casi favorevoli e numero dei casi possibili con il limite del rapporto per tendente all'infinito.
Tuttavia:
il "limite" delle frequenze relative non è paragonabile all'analogo concetto matematico; ad esempio, data unasuccessione, si dice che è il suo limite se per ogni esiste unnumero naturale tale che per ogni, e, comunque dato, è sempre possibile calcolare; nella definizione frequentista, invece, non è sempre calcolabile;
non tutti gli esperimenti sono ripetibili; ad esempio, ha sicuramente senso chiedersi quale sia la probabilità che vi sia vita suMarte o che tra 50 anni iltasso di natalità inAfrica diventi la metà di quello attuale, ma in casi simili non è possibile immaginare esperimenti ripetibili all'infinito.
De Finetti eSavage[7] hanno proposto una definizione di probabilità applicabile ad esperimenti casuali i cui eventi elementari non siano ritenuti ugualmente possibili e che non siano necessariamente ripetibili più volte sotto le stesse condizioni:la probabilità di un evento è il prezzo che un individuo ritiene equo pagare per ricevere 1 se l'evento si verifica, 0 se l'evento non si verifica.
Al fine di rendere concretamente applicabile la definizione, si aggiunge un criterio di coerenza:le probabilità degli eventi devono essere attribuite in modo tale che non sia possibile ottenere una vincita o una perdita certa.
In tal modo è possibile ricavare dalla definizione soggettiva le stesse tre regole già viste.
: infatti se fosse si avrebbe un guadagno certo, viceversa se fosse si avrebbe una perdita certa;
: se l'evento è certo, si riceverà sicuramente 1, ma se fosse si avrebbe un guadagno certo, pari a, se invece fosse si avrebbe una perdita certa;
se. Si osserva preliminarmente che sen eventi sono incompatibili (non possono presentarsi insieme) e necessari (uno di loro deve necessariamente verificarsi), allora si ha: infatti si paga per ciascun evento, quindi se la somma fosse inferiore a 1 si avrebbe un guadagno certo, se fosse superiore si avrebbe una perdita certa. Si considerano poi gli eventi incompatibili e e l'evento complemento della loro unione; i tre eventi sono incompatibili e necessari e si ha: Sono però incompatibili anche l'unione di e ed il suo complemento: Dalle due uguaglianze segue: se, allora
La definizione soggettiva consente quindi di calcolare la probabilità di eventi anche quando gli eventi elementari non sono equiprobabili e quando l'esperimento non può essere ripetuto. Rimane fondata, tuttavia, sull'opinione di singoli individui, che potrebbero presentare diverse propensioni al rischio. Basta pensare che molti sarebbero disposti a giocare 1 euro per vincerne 1000, ma pochi giocherebbero un milione di euro per vincerne un miliardo.
L'impostazione assiomatica della probabilità venne proposta daAndrey Nikolaevich Kolmogorov nel 1933 inGrundbegriffe der Wahrscheinlichkeitsrechnung (Concetti fondamentali del calcolo delle probabilità), sviluppando la ricerca che era ormai cristallizzata sul dibattito fra quanti consideravano la probabilità come limiti di frequenze relative (cfr. impostazione frequentista) e quanti cercavano un fondamento logico della stessa.
Va notato che la definizione assiomatica non è unadefinizione operativa e non fornisce indicazioni sucome calcolare la probabilità. È quindi una definizione utilizzabile sia nell'ambito di un approccio oggettivista che nell'ambito di un approccio soggettivista.
Il nome deriva dal procedimento per "assiomatizzazione" quindi nell'individuare i concetti primitivi, da questi nell'individuare ipostulati da cui poi si passava a definire iteoremi.
L'impostazione assiomatica muove dal concetto diσ-algebra, o classe additiva. Dato un qualsiasi esperimento casuale, i suoi possibili risultati costituiscono gli elementi di un insieme non vuoto, dettospazio campionario, e ciascun evento è un sottoinsieme di. La probabilità viene vista, in prima approssimazione, come unamisura, cioè come una funzione che associa a ciascun sottoinsieme di un numero reale non negativo tale che la somma delle probabilità di tutti gli eventi sia pari a.
Se hacardinalità finita o infinita numerabile, l'insieme di tutti i suoi sottoinsiemi, dettoinsieme delle parti, ha, rispettivamente, cardinalità o lacardinalità del continuo. Tuttavia, se ha la cardinalità del continuo, il suo insieme delle parti ha cardinalità superiore e risulta "troppo grande" perché si possa definire su di esso una misura. Si considerano pertanto i soli sottoinsiemi di che costituiscono una classe additiva, ovvero un insieme non vuoto tale che
se un evento appartiene ad, vi appartiene anche il suo complemento:
se un'infinità numerabile di eventi,, appartiene ad, vi appartiene anche l'evento costituito dalla loro unione:
Una classe additiva è quindi un sottoinsieme dell'insieme delle parti di che risultachiuso rispetto alle operazioni di complemento e di unione numerabile.
Si può aggiungere che una classe additiva è chiusa anche rispetto all'intersezione, finita o numerabile, in quanto per leleggi di De Morgan si ha:
dove il secondo membro dell'uguaglianza appartiene alla classe in quanto complemento di un'unione numerabile dei complementi di insiemi che vi appartengono.
Si pongono i seguenti assiomi (che includono le tre regole ricavabili dalle definizioni precedenti):
Dagli assiomi si ricavano immediatamente alcune proprietà elementari della probabilità:
Se è la probabilità di un evento, la probabilità dell'evento complementare è. Infatti, poiché l'intersezione di e del suo complemento è vuota e la loro unione è, dagli assiomi 3 e 4 si ricava:
La probabilità dell'evento impossibile è pari a zero. Infatti l'insieme vuoto è il complemento di e si ha:
La probabilità di un evento è minore o uguale a. Infatti, dovendo la probabilità essere non negativa per il secondoassioma, si ha:
Se un evento è incluso in un evento, allora la sua probabilità è minore o uguale a quella di. Infatti, se include può essere espresso come unione di insiemi disgiunti e si ha:
Dai suddetti assiomi derivano alcuni teoremi e concetti fondamentali.
Ilteorema della probabilità totale consente di calcolare la probabilità dell'unione di due o più eventi, ovvero la probabilità che si verifichi almeno uno di essi. Essa è la somma delle probabilità dei singoli eventi se sono a due a due incompatibili; in caso contrario, alla somma va sottratta la somma delle probabilità delle intersezioni due a due, poi aggiunta la somma delle probabilità delle intersezioni a tre a tre e così via. Ad esempio, nel caso di tre eventi:
Si diceprobabilità condizionata di dato, e si scrive, la probabilità che l'evento ha di verificarsi quando si sa che si è verificato:
Attraverso tale concetto si perviene alteorema della probabilità composta, che consente di calcolare la probabilità dell'intersezione di due o più eventi, ovvero la probabilità che essi si verifichino tutti. Nel caso di due eventi (che può essere generalizzato), si ha:
Se, i due eventi e vengono definitiindipendenti stocasticamente (oprobabilisticamente) e dalla stessa definizione segue una diversa formulazione della probabilità composta, caso particolare del precedente:.
Ilteorema di Bayes consente di calcolare laprobabilità a posteriori di un evento, quando si sappia che si è verificato un evento. Se appartiene ad uninsieme finito o numerabile di eventi a due a due incompatibili, e se si verifica allora si verifica necessariamente uno degli eventi di tale insieme (ed uno solo, dato che sono incompatibili), allora, conoscendo leprobabilità a priori degli eventi e le probabilità condizionate e sapendo che si è verificato, si può calcolare laprobabilità a posteriori di un particolare:
Più discorsivamente: se si conoscono sia le probabilità a priori delle diverse possibili "cause" di (ma non si sa per effetto di quale di esse si è verificato), sia le probabilità condizionate di data ciascuna delle cause, è possibile calcolare la probabilità che si sia verificato per effetto di una particolare causa.
Quante insidie vi siano nei ragionamenti sulle probabilità - al di là delle difficoltà nella comprensione di cosa possa essere la probabilità - viene messo in evidenza da alcuni cosiddetti paradossi, dove in realtà si tratta di domande con risposte controintuitive:
nelparadosso delle tre carte l'errore consiste solitamente nel non avere identificato correttamente quali siano gli eventi: i lati delle carte e non le carte stesse;
nelparadosso dei due bambini l'errore consiste solitamente nel non distinguere eventi diversi, ossia nel considerare un unico evento quelli che in realtà sono due;
nelproblema di Monty Hall la difficoltà consiste anzitutto nell'accettare l'idea che una nuova informazione può modificare le probabilità di eventi, senza che il mondo reale cambi, l'altro errore consiste nel non analizzare completamente e dunque valutare correttamente la nuova informazione acquisita.
Un'ulteriore fonte di confusione può essere data dal presupporre (sbagliando) che il fatto che un evento abbia probabilità implica che esso avvenga sempre (invece chequasi certamente).
^Il 9 si ottiene con le sei combinazioni, il 10 con le sei combinazioni, l'11 con e il 12 con. Tuttavia, mentre una combinazione di tre numeri uguali può presentarsi in un solo modo, una con due numeri uguali può presentarsi in tre modi diversi, una con tre numeri diversi in sei modi diversi. Si può quindi ottenere il 10 e l'11 in 27 modi, il 9 e il 12 in 25 modi.
^Secondo il Cavaliere, essendo la probabilità del 6 con un dado, in quattro lanci la probabilità sarebbe; la probabilità del doppio 6 in due lanci è invece e, per arrivare a, occorrono 24 lanci:. In realtà la probabilità di ottenere almeno un 6 si calcola meglio a partire dall'evento complementare, "nessun 6 in quattro lanci", che è, e sottraendo questa da, ottenendo il; nello stesso modo si calcola che la probabilità di almeno un doppio 6 in 24 lanci è.
^Ad esempio, nel lancio di un dado l'insieme è costituito dai sei risultati; l'evento "esce il 3" è rappresentato dall'insieme, l'evento "esce un numero pari" è rappresentato dall'insieme.
^Ad esempio, restando al lancio di un dado, se e, l'evento è, ovvero "esce un numero pari". Se invece "esce un numero pari" e "esce un numero minore o uguale a 3",.