Movatterモバイル変換

joker1007 id:joker1007

javaとsoftwareに関するjoker1007のブックマーク (3)

記載したリストを順次ダウンロードする·Download Machine MOONGIFT
DownloadMachineはJava製のオープンソース・ソフトウェア。ダウンロードアプリケーションというと、GUIでURLを登録してリストの上から処理されていく…そんなイメージがあった。そういうアプリケーションの場合、システムと連携して自動化というのはなかなか難しい。ファイルを更新するとダウンロードが開始するダウンロードのリストを渡しておくだけで、後は自動でダウンロードを行ってくれるソフトウェアがDownloadMachineだ。常時起動するソフトウェアで、ダウンロードリストを監視しているのでシステムと連携するのも簡単にできそうだ。デフォルトでqueueというファイルを作成し、そこにURLを記述していけばOKだ。ファイルにURLがあればDownloadMachineが自動的に感知してダウンロードを実行する。完了するとqueueファイルから該当行を削除する仕組みになっている。
joker10072009/11/10
software
download
java
linux
リンク
MergeDoc Project
joker10072009/08/11
java
eclipse
development
software
ide
リンク
MOONGIFT: » Java製のクローリングシステム「InfoCrawler」:オープンソースを毎日紹介
Webサービスを作る上で、外部のデータを取得して何かしたいといったことは良くある。いや、外部に限ったものではない。ローカルのデータであっても取得して、それを検索したいという要望は良くあるものだ。ユーザ側の検索画面そうした時にクローラーを自作したりすると思うのだが、robots.txtの解釈や効率的なクローリング法を習得するのは大変なことだ。そこで試してみたいのがこれだ。今回紹介するオープンソース・ソフトウェアはInfoCrawler、Java製のWebクローラーだ。 InfoCrawlerは設定項目も数多く、クローリングシステムとして優秀なものになると思われる。複数サーバ設置して分散化もできるようだ。HTMLや画像、各種バイナリ等ファイル種別を指定してクローリングを行うか否かを指定できる。インデックスするファイルを指定する画面認証が必要なサーバにも対応し、言語によってフィルタリン
joker10072008/04/28
crawler
java
software
リンク
1