いまやネットの世界を左右する強力な検索エンジンとなったGoogle。日本ではまだYahoo!の方がはるかに利用者が多いのでさほどではないですが、アルゴリズムの基本的な考えが似ているため、同じような結果が出てきます。つまり、既存の検索エンジンのその基礎となった一番最初のGoogleの検索アルゴリズムを理解すれば、検索エンジン対策にも役立つはず。 ということで、初代Googleのアルゴリズムをできるだけわかりやすく解説してみます。既存の他サイトの解説とは違い、きちんとした最初のGoogleの数式に基づいています。 詳細は以下から。The Anatomy of a Search Engine http://www-db.stanford.edu/~backrub/google.htmlGoogleの画期的なランク付けの方法が数式による全自動のページランクというのは聞いたことがあると思いますが、

10年間泥のように働いて花が咲きましたのぶくまのコメントにこういうのがありました。 経営層がプログラムの品質を度が越えたほどに軽視する理由の 一つが説明されてます。目から鱗です。意外とみんな知らないようなので、「SI業界の経営層の考えが古い理由」をきちんと説明したいと思います。 汎用機あるいはオフコンの時代は、COBOLやRPGなど(他にもありますが私が経験したものをあげています)の言語が使われていました。 昔の言語は、誰が書いても同じようなコードになると思われていました。もっというと、コピペしてちょっと書き換えるという開発スタイルが多かったのです。もちろん現場によって開発スタイルは違うと思いますが、コピペが横行してたんじゃないかなぁ。 コピペでの開発なら、そりゃ誰が書いても同じようなコードになるよね。 再利用性、保守性より「最初にとりあえず動かすこと」が重要視された。コピペでちょろっと変
(ちょっとだけ追記しました。その他1/25のあたりも見てみてください。) "Canprogramming be reinvented?"というタイトルでの発表。東工大と東大で似たような発表をしたのだが、ストーリーラインが比較的新しいため、先にやった東工大での発表には反省点がいろいろあり、それが東大での発表に生かされた形になったのは否めない、かもしれない。以下は、かなり再現性の低いメモ。詳細はさらに聞いてください。「私」はもちろんAlan Kayを指します。 近所の人から、「なんで新しいコンピュータのほうがWindowsの起動やMS Wordの起動が遅いの?」、「大きいディスクがついているはずなのに、なぜ使える容量が少なくなるの?」、「アップデートをしたら、何で再起動しなくてはいけないの?」という質問をされる。なかなか良い質問である。 私自身も、コンピュータに関する疑問がある。「なぜ、コン
livedoorblogはずっと使わせていただいて愛着もあるのですが、https対応の予定が今後もない、という状態が続くようでもあるので、noteの方に引っ越します! (そしてクレディセゾンでの5年間の活動の振り返りを投稿しました) クレディセゾンでDXを進めてきた5年間を振り返る 2019年にクレディセゾンに入社して、3年の月日が経った。 これまで基本的にシステムに関するすべてを外部に委託してきたこの事業会社で、ゼロから内製チームを組成し、70名規模に拡大し(※1)、データ駆動経営の推進チームも組成した。また、日本の大手金融会社として初めてSlackを全社導入するなどデジタル人材の採用・育成による内製開発を武器に、デジタルの力を事業会社のど真ん中にインストールしていくことはそれなりにできてきたかな、と感じている。 そして1年前に大きな転機があり、CTOに加えてCIOの仕事もすることにな

Web検索エンジンは、大きく分けて次の2つからなります。利用者からのクエリーを直接受ける検索サーバ検索サーバから利用されるインデックス世界中のWebサイトを集めてきて解析し、インデックスに登録するクローラインデックスというのは、利用者から検索される単語をあらかじめ列挙しておいて、単語からWebサイトのURLを引くのに必要なデータ構造のことです。検索エンジンはGoogleを支える技術にあるように、「下準備があればこその高性能」なわけです。 インデックスを作成するためには、あらかじめWebページの内容を単語に分割する必要があります。英語では単語と単語の間をスペースで区切るため、この作業はさほど難しくありません。しかし日本語では、単語の境界はそれほど自明ではないため、日本語特有の処理をする必要があります。 日本語の文から単語に分解するには、形態素解析を使う場合と、N-gramを使う場合があり、そ
大ざっぱに言って、グーグルには2つの側面がある。見えるグーグルと、見えないグーグルだ。「見えない」は言い過ぎでも、グーグルの中には、普通に外から眺めているだけでは見えてこない、エッジな分散コンピューティングの世界が広がっている。 検索やメール、カレンダーなどは外から見えている分かりやすいグーグルだ。逆にこうしたサービスを支えるインフラ技術は、かなり一生懸命見る気にならないと、見えてこない。 ある技術系イベントの席で、たまたま隣になったグーグルの技術者が、私にこう言った。「アプリはあんまりやらないんですよ。画面とか、面倒くさいでしょ。グーグルドキュメントとか別に消えていいって感じ。インフラに興味があるんです。OS? OSなんて、どうでもいいし」。 変わった人だなという印象を受けた。今の時代はインフラよりもサービスに華がある。フロンティアが広がっているのもサービスの分野だ。そう思っていた。しか
このごろIT(情報技術)の世界でメディアをにぎわせている話題に「ICタグ」がある。商品につけた半導体チップに情報を入れ、電波で受信して在庫管理や防犯などに使おうというものだ。国際的には、MIT(マサチューセッツ工科大学)を中心にして決められた規格「オートID」が標準になり、ウォルマートなどが採用を決めた。日本でも、慶応大学にオートIDセンターができ、実装が進んでいる。 ところが、そこに「ユビキタスID」というのが現れた。まだ規格も固まらず、作っているメーカーは2社だけだが、そのリーダーである東大の坂村健教授は「米国にあわせる必要はない。日本独自の標準を作ることが国益にかなう」として政府の関与を求めている。これは「バーコードは米国の規格だから、日本独自の国定コードを作ろう」というようなものである。 坂村氏がこういうナショナリズムをあおるのは、今回が初めてではない。15年前に彼が進めた「トロン
人工無脳は気軽に「らしさ」を楽しむことができる、知能を持たない会話プログラムです。しかし人工無脳との会話はときとして、論理で固められた人工知能が持ち得なかった人間らしさ ― 即興、いたずら心、感情 ― を私たちに感じさせてくれます。その意味では知能の本質を追求するための別の切り口なのかもしれません。このようなロマンを追い求めて日頃とりとめもなく考える雑談的トピックをまとめてみました。 最近の記事より 厳選おすすめ&人気書籍 2008/09/28■自我状態を考慮した人工無脳 - 追記 人工無脳は会話の中でユーザに不自然さを感じさせ、会話が続かなかったり、拒絶されるという点が課題となっている。この原因の一つに人工無脳の印象やムードがでたらめに変化し安定していないことが挙げられる。一方、人は通常意識することなく相手に不適切なメッセージが伝わることを避けてうまくコミュニケーションをはかっている。
将棋ソフトと対戦する加藤幸男朝日アマ名人(左) 千葉県木更津市で5日開かれた「第18回世界コンピュータ将棋選手権」(コンピュータ将棋協会主催)のエキシビションマッチで、朝日アマ名人の加藤幸男(ゆきお)さん(26)とアマ名人の清水上徹(しみずがみ・とおる)さん(28)というアマチュアトップ2人が将棋ソフトと対戦し、ともに敗れた。アマのタイトル保持者が公開の場で将棋ソフトに敗れるのは初めて。 世界コンピュータ将棋選手権は将棋ソフト同士が実力を競う大会。3〜5日に40チームが参加して開かれ、「激指(げきさし)」が3年ぶりに優勝、「棚瀬将棋」が準優勝した。エキシビションでは、加藤さんが棚瀬将棋と、清水上さんが激指と対戦した。持ち時間は15分、無くなると1手30秒未満で指すルール。加藤さんは攻め倒され、清水上さんは中終盤の競り合いで負けた。 コンピュータ将棋協会の滝沢武信会長は「予想外の結果。
連載 .NET&Windows Vistaへ広がるDirectXの世界 第1回 DirectXの真実 NyaRuRu 2006/06/21Windows Vistaの発売(2007年1月発売予定)が近づいてくるに伴い、同OSの新しいグラフィックス環境について一般利用者向けの記事もいくつか散見されるようになった。 それらの記事でたびたび目に付くのが、「Windows Vistaの描画は、DirectXをベースとしているので高速になる」という説明だ。確かにこの説明は、宣伝文句としてはインパクトがあるかもしれない。だが、もしあなたが開発者であれば、このような説明に納得すべきではない。DirectXは決して「定義上高速」なのではなく、特定のシナリオで性能を発揮するようにデザインされたライブラリにすぎないからだ。 この事実は、ゲーム開発者にはよく知られた話であるが、一般的なWindowsアプリケー
Hope is agood thing, maybe the best of things, and nogood thing ever dies. (希望は良いもの、おそらく最上のものだ。そして、良いものは決して消えない。:『ショーシャンクの空に』より) 高林さんとのつながり -- 今回は、高林さんからのご紹介ですが、どういったつながりですか? 実は、直接お会いしたことは一度もないんです。一番最初はですね、Paul Graham の『Beating the Averages』 っていうのを、私が翻訳(邦題『普通のやつらの上を行け』)させて頂きまして、それの感想をメールで頂いたのがきっかけです。それから、私が開発している Scheme 処理系(Gauche)を使って頂いています。 -- 川合さんにとって翻訳って、あれは自分で読んで面白いものをみんなに見てもらう、っていうところですか?

以前に書いた百万ベンチャーの方などがたくさん集まる百万ベンチャーの夜(本当はそんな名前ではない)があったので参加してきた。異業種交流会ということでフューチャーラボラトリの橋本さんや、CO-CONVの丸山さんなどが中心となって開催されたイベントだった。 京大の近くの百万遍周辺のIT系ベンチャーの方や京大の学生、Googleの及川さん、ドワンゴの溝口さん、関西一円のIT系企業の方々、ベンチャーなどに興味のある関西の学生、話を聞きつけて東京からやってきた方、というような方々が総勢100人くらい集まる会だった。ものすごい人の数で盛り上がっていた。 以前京都に居た頃には、異業種交流会なんていってこういう雰囲気の人が集まる会は無かったように思う。はてなの事を知って頂いている方と会うことも珍しかったし、ベンチャーに興味のある京大生、みたいなグループもあまり見かけなかったように思うので隔世の感がある。最近
(08/09/28) すっかり活動のメインがブログのほうになっちゃいましたが,こっちもちゃんと管理していきたいと思います. 今のところ企んでる特集企画が4〜5つあるので,なんとか暇を作って書きたいと思います. さて,すでにご存知だとは思いますが,当サイトの人気記事であるARToolKit特集が本になりました. ARToolKitの導入部分についてはサイトの内容とかぶるところはありますが,VRMLの表示のさせ方や,表示領域を複数持つアプリケーションの作り方,OpenCVとの連携など,新しい情報をあれこれ詰め込んでいるので是非手にとってみてください. (07/06/01) 新しい特集記事を書きました! 「攻殻機動隊」「電脳コイル」の世界を実現! ARToolKitを使った拡張現実感プログラミング 今回は過去最高の執筆時間を要した,とても濃い内容になってます. (07/03/02
1リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く