Movatterモバイル変換


[0]ホーム

URL:


BLOGTIMES

cles::blog

平常心是道
« :: »cles::blog >ArchiveList >2013-9 > 2013-9-7
«Prev ||1 || Next»
2013/09/07

jar を非圧縮にすると java アプリの起動が速くなるらしい

tuning  java 

非圧縮の jar を使うと java アプリの起動が速くなるというテクニックが興味深かったのでメモ。
言われてみれば解凍の手間が減る分、確かに早くはなりそうですね。

JJBugでJava VMの起動高速化の話をしました - nekopの日記

Japan JBoss User Group - 灼熱の JBossでJava VMの起動高速化の話をしました。非圧縮jarによる高速化はみなさんも使っている有名なソフトウェアで採用されていますが、あまり知られていないチューニングだと思います。大抵の場合200%くらいの高速化ができます。

今度、ちゃんとベンチとってみようと思いますが、とりあえずスライドにあった flatjar という非圧縮 jar をつくるスクリプトだけ動くようにしてみました。

flatjar

#!/bin/bash# Example: $ find . -type f -name \*.jar | xargs -n1 flatjarset -erealpath() { DIRNAME=`dirname $1` PWDPATH=`cd $DIRNAME && pwd` FILEPATH=${PWDPATH}/$1 if [ -e $FILEPATH ]; then echo $FILEPATH else return 1 fi}JARFILE=$(realpath $1)TMPDIR=/tmp/flatjar.tmpecho "Fat $JARFILE"rm -rf $TMPDIRmkdir -p $TMPDIR(cd $TMPDIR; jar xf $JARFILE)if [ -f $TMPDIR/META-INF/MANIFEST.MF ]; then jar c0fm $JARFILE $TMPDIR/META-INF/MANIFEST.MF -C $TMPDIR .else jar c0f $JARFILE -C $TMPDIR .firm -rf $TMPDIR

    at 20:55 |
    2013/09/07

    PDFBox で PDF からテキストを抽出する

    java  apache  pdf 

    PDF からテキストを抽出するいい方法がないかなと思っていたら、Apache PDFBoxで簡単に実現できたのでメモ。
    この手のライブラリとしてはXpdf なんかもありますが、PDFBox は日本語用に CMap の設定が必要なかったりするのでこちらの方がセットアップはかなり楽です。

    Apache PDFBox | A Java PDF Library

    The Apache PDFBox™ library is an open source Java tool for working with PDF documents. This project allows creation of new PDF documents, manipulation of existing documents and the ability to extract content from documents. Apache PDFBox also includes several command line utilities. Apache PDFBox is published under the Apache License v2.0.

    アプリに組み込んだりするのであればライブラリとして使った方がよいと思いますが、単にテキストが欲しいという場合にはコマンドラインからそのまま使うことができます。試しに昨日のドコモの iPhone 発売騒ぎに対する開示文書からテキストを抜き出してみるとこんな感じになります。予期しない所に改行やスペースが入ったりするので、見栄えを考えるとやはり何かしらの加工は必要そうですね。

    $ java -jar pdfbox-app-1.8.2.jar ExtractText -console 140120130906020385.pdf2013年 9月 6日各 位本日の一部報道について 本日、一部報道機関において、当社がアップル社の「iPhone」を発売する旨の報道がありましたが、当社が発表したものではございません。また、現時点において、開示すべき決定した事実はございません。以 上会 社 名 株式会社エヌ・ティ・ティ・ドコモ代表者名 代表取締役社長 加藤 薰(コード:9437、東証第一部)問合せ先 総務部 株式担当(TEL.03-5156-1111)

      at 18:55 |
      «Prev ||1 || Next»
      « :: »cles::blog >ArchiveList >2013-9 > 2013-9-7
      Copyright © 2004-2023 by CLES All Rights Reserved.
      サイト内検索
      検索ワードランキング
      へぇが多いエントリ
      閲覧数が多いエントリ
      1 .アーロンチェアのポスチャーフィットを修理(100396)
      2 .福岡銀がデマの投稿者への刑事告訴を検討中(99738)
      3 .年次の人間ドックへ(99711)
      4 .三菱鉛筆がラミーを買収(99314)
      5 .2023 年分の確定申告完了!(1つめ)(99287)
      最新のエントリ
      cles::blogについて
      誰が書いてる?
      最近行った場所
      サイトポリシー
      タグ一覧
      検索ワードランキング

      Referrers

        Powered by CLES
        Nucleus CMS v3.31SP3/w memcached
        21388970(W:9381 Y:1555 T:0942)
        cles::blogのはてなブックマーク数
        benchmark


        [8]ページ先頭

        ©2009-2025 Movatter.jp