Movatterモバイル変換


[0]ホーム

URL:


Hopp til innhold
Wikipedia
Søk

N-gram

Fra Wikipedia, den frie encyklopedi

N-gram er en sekvens av ett eller flere elementer (vanligvis ord) i tekst og tale. Begrepet er mye brukt idatalingvistikk ogsannsynlighetsteori. N-grammer genereres vanligvis ut fra etkorpus (en avgrenset samling tekst som ofte er digitalt tilrettelagt).

Et n-gram bestående av ett ord betegnes som et "unigram", et "bigram" består av to ord og et "trigram" av tre osv.

En anvendelse av n-gram er Google Ngram Viewer der man kan søke etter ordfrekvenser og ordtrender i hele tekstkorpuset Google Books.

Eksempel

[rediger |rediger kilde]
Eksempel pån-gram
Ordsekvens1-gram-sekvens2-gram-sekvens3-gram-sekvens
unigrambigramtrigram
… to be or not to be ……, to, be, or, not, to, be, ……, to be, be or, or not, not to, to be, ……, to be or, be or not, or not to, not to be, …
… dette er et eksempel ……, dette, er, et, eksempel, ……, dette er, er et, et eksempel, ……, dette er et, er et eksempel, …

Eksterne lenker

[rediger |rediger kilde]
Denne artikkelen er enspire. Du kan hjelpe Wikipedia ved åutvide den.
Autoritetsdata
Hentet fra «https://no.wikipedia.org/w/index.php?title=N-gram&oldid=22270501»
Kategorier:
Skjulte kategorier:

[8]ページ先頭

©2009-2026 Movatter.jp