Statistically improbable phrase (SIP) literalmente "Frases estatisticamente improváveis" (eminglês), são uma ferramenta estatística lançado em 2005 pelo site dee-commerceAmazon.com para o seu programa de indexação de conteúdo "busca dentro dos livros", é comparar o texto de todos os livros indexados a fim de encontrar para cada um deles um conjunto de frases que aparecem mais frequentemente do que em outros livros.
O interesse para identificar essas passagens é que eles são considerados o representante mais significativo da maior parte do livro, constituindo o equivalente a resumos oupalavras-chave, tendo a vantagem de ser determinada de maneira automatizada.[1]
Estesmetadados são apresentados ao usuário sobre os cartões para cada livro. Cada SIP é acompanhada por uma hiperligação que permite ao visitante, encontrar os outros livros com a mesma expressão entre os seus SIP.[2] Na verdade, estruturas idênticas de SIP provavelmente abordam os mesmos temas[3] e também são susceptíveis de interessar ao visitante.Bill Carr, vice-presidente executivo de mídia digital daAmazon, enfatiza que o sistema de reconciliação destaca livros que seriam difíceis de encontrar sem ele, como parte dacauda longa catálogo[4]
A utilidade desse recurso para os visitantes não se sabe com certeza.[5] Benjamin Vershbow, pesquisador do Instituto para o Futuro do Livro, vê um equivalente a etiquetas automatizadas (Tag) que, são a base daWeb 2.0, mas acredita que o sistema funcione melhor para o trabalho de não-ficção e romance[6].
Amazon está a considerar várias outras maneiras de colocar esta ferramenta para uma boa utilização, por exemplo, integrando o sistema de recomendação que já existe, ou para responder a perguntas usando textos de autoridade no campo. Além disso pesquisadores propuseram uma aplicação deste sistema paraMEDLINE.[7]