TeX が苦手とする処理 †TeX Forum やTeX Q & A などでしばしば話題になる処理のうち,TeX本体では提供されず,ときとしてTeX 自身は不得手とする処理について挙げます。 既製品があるものについては既製品も紹介していますが,それらを用いた場合の出力結果に不満がある場合には,ユーザ自身で対処することになります。 ここに挙げる処理を行うのが単なる「書き手の趣味」である場合には,無理をせずに書き手自身の腕で無難にできる範囲の処理で済ませるか,画像にしてしまう方が賢明である場合もあることでしょう。 複数行にわたる下線(あるいは波線・破線など) † まず,qa:32045 でコメントされている現実があることを認識してください。 その上で既製品にあたると,大石氏のサイトに下線類を作成するマクロについての比較を行った文書「下線に関するマクロ比較」(ただし,未完成)があり,その
関数MBCodeGetUTF8ByteLen()は、UTF-8コードの文字を入力し、 引数戻り値に、その文字のバイト数を返す。 ASCII文字は1バイトで、日本語は大部分が3バイトである。 //////////////////////////////////////////////////////////////////////////////// // //UTF-8:文字のバイト数を得る // int MBCodeGetUTF8ByteLen ( char *s, // (i) 文字列(UTF-8であると想定) int *u8len // (o)UTF-8のバイト数 // 0:終端(0)またはBOMまたはUTF-8でない // 1:ASCII // 2-4:UTF-8コード長 ) { int len; unsigned char c[ 4 ]; if((s == NULL)||
「プログラマのための文字コード技術入門」を読んで自分なりに理解した点をザックリとまとめてみる。 それほど正確性を求めて書いているわけではないので、間違ってる可能性大です。 間違いなどあればコメントなど頂けるとありがたいです。 それぞれの文字コードはどう違うのか? 日本語の文字コードは大きく以下の2つに分けられる JIS X 0208 文字集合をベースにしたもの Unicode文字集合をベースにしたもの JIS X 0208 文字集合をベースにした文字コードには、EUC-JP, Shift_JIS, ISO-2022-JP がある。 Unicode文字集合をベースにした文字コードには、UTF-8, UTF-16 などがある。 上で挙げた「文字コード」とは正確には「エンコーディング(文字符号化方式)」の事を指す。 文字符号化方式 文字集合って? 読んでそのまんま”文字の種類の集まり”。「キャラ
コードを読まないで理解するというと何やら心眼で読めとかテレパシーを使えとか、そーゆー荒唐無稽な方向に走れという事ではなく大局的に理解しましょうという話である。 カーネル読書会のネタで今回はmallocのお話だったのだが、そこでRubyのささださんがいらっしゃっていて、GC(ごみ集め)と記憶域管理の関係について熱い議論が沸騰し、その後いろいろブログなどでフォローされていたりする。 わたしもRubyでmallocやGCがどう実装されているか興味があったのでoprofileで実行プロファイルをとってみたりした。日頃利用しているノートPCでRubyのテストプログラム(test/runner.rb)を実行してoprofileしたのは先日ブログに書いたとおりである。 「それとわたしのノートPCではキャッシュミスを測定できないので、Xeonのマシンでキャッシュミスを測定すると面白いと思った。GCの時ぼろ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く