Unbigrama odigrama és un grup de dues lletres, dues síl·labes, o dues paraules. Els bigrames són utilitzats comunament com a base per a l'anàlisi estadística de text simple. S'utilitzen en un delsmodels de llenguatge més exitosos per alreconeixement de veu.[1] Es tracta d'un cas especial delN-grama.
Els Bigrames ajuden a proporcionar la probabilitat condicional d'una paraula donada la paraula precedent, quan la relació de laprobabilitat condicional s'aplica:
És a dir, la probabilitat d'una paraula, donada la paraula precedent, és igual a la probabilitat del seu bigrama, o la co-ocurrència de les dues paraules, dividit per la probabilitat de la paraula precedent.
Els bigrames de paraules s'usen enmodels de llenguatge per a reconeixement de llenguatge natural.
Els bigrames de lletres es poden usar per a la identificació de l'idioma d'un text. També poden ser usats per a fer uncriptoanàlisi d'un text xifrat.