いまやネットの世界を左右する強力な検索エンジンとなったGoogle。日本ではまだYahoo!の方がはるかに利用者が多いのでさほどではないですが、アルゴリズムの基本的な考えが似ているため、同じような結果が出てきます。つまり、既存の検索エンジンのその基礎となった一番最初のGoogleの検索アルゴリズムを理解すれば、検索エンジン対策にも役立つはず。 ということで、初代Googleのアルゴリズムをできるだけわかりやすく解説してみます。既存の他サイトの解説とは違い、きちんとした最初のGoogleの数式に基づいています。 詳細は以下から。The Anatomy of a Search Engine http://www-db.stanford.edu/~backrub/google.htmlGoogleの画期的なランク付けの方法が数式による全自動のページランクというのは聞いたことがあると思いますが、

Web検索エンジンは、大きく分けて次の2つからなります。利用者からのクエリーを直接受ける検索サーバ検索サーバから利用されるインデックス世界中のWebサイトを集めてきて解析し、インデックスに登録するクローラインデックスというのは、利用者から検索される単語をあらかじめ列挙しておいて、単語からWebサイトのURLを引くのに必要なデータ構造のことです。検索エンジンはGoogleを支える技術にあるように、「下準備があればこその高性能」なわけです。 インデックスを作成するためには、あらかじめWebページの内容を単語に分割する必要があります。英語では単語と単語の間をスペースで区切るため、この作業はさほど難しくありません。しかし日本語では、単語の境界はそれほど自明ではないため、日本語特有の処理をする必要があります。 日本語の文から単語に分解するには、形態素解析を使う場合と、N-gramを使う場合があり、そ
世界中のネットユーザーが、未読メッセージで溢れる電子メールの受信ボックスに頭を抱えているが、Microsoftの研究者らはあるツールを投入し、この問題の緩和に役立てたいと考えている。 同社は先週、新しい方法で電子メールを整理するユーティリティツールを無償で公開した。このツールのユーザーは、受信したメッセージを着信順だけでなく、送信者との関係の深さによっても並べ替えることができるというものだ。 「SNARF(SocialNetwork And Relationship Finder)」と呼ばれるこのプログラムは、人は自分が大切に思っている相手からのメッセージほど、それに答えを返す傾向が強いという事実にもとづいたアプローチを採用している。Microsoftの研究者の1人で、SNARFを開発したMarc Smithは、「人は全部のメールに返信するわけではないし、反対に全員から返信が来るわけで

1リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く