Movatterモバイル変換


[0]ホーム

URL:


Vés al contingut
Viquipèdial'Enciclopèdia Lliure
Cerca

Bigrama

De la Viquipèdia, l'enciclopèdia lliure

Unbigrama odigrama és un grup de dues lletres, dues síl·labes, o dues paraules. Els bigrames són utilitzats comunament com a base per a l'anàlisi estadística de text simple. S'utilitzen en un delsmodels de llenguatge més exitosos per alreconeixement de veu.[1] Es tracta d'un cas especial delN-grama.

Els Bigrames ajuden a proporcionar la probabilitat condicional d'una paraula donada la paraula precedent, quan la relació de laprobabilitat condicional s'aplica:

P(Wn|Wn1)=P(Wn1,Wn)P(Wn1){\displaystyle P(W_{n}|W_{n-1})={P(W_{n-1},W_{n}) \over P(W_{n-1})}}

És a dir, la probabilitatP(){\displaystyle P()} d'una paraulaWn{\displaystyle W_{n}}, donada la paraula precedentWn1{\displaystyle W_{n-1}}, és igual a la probabilitat del seu bigrama, o la co-ocurrència de les dues paraulesP(Wn1,Wn){\displaystyle P(W_{n-1},W_{n})}, dividit per la probabilitat de la paraula precedent.

Aplicacions

[modifica]

Els bigrames de paraules s'usen enmodels de llenguatge per a reconeixement de llenguatge natural.

Els bigrames de lletres es poden usar per a la identificació de l'idioma d'un text. També poden ser usats per a fer uncriptoanàlisi d'un text xifrat.

Referències

[modifica]
  1. Michael Collins.A new statistical parser based on bigram lexical dependencies. In Proceedings of the 34th Annual Meeting of the Association of Computational Linguistics, Santa Cruz, CA. 1996. pp.184-191.

Vegeu també

[modifica]
Obtingut de «https://ca.wikipedia.org/w/index.php?title=Bigrama&oldid=27414044»
Categories:

[8]ページ先頭

©2009-2025 Movatter.jp