全文検索エンジンとしてmroongaを使おうとインストールしてたら盛大にはまったのでシェア * [mroongaとは](http://mroonga.github.com/ja/docs/characteristic.html#what-is-mroonga) * [groongaの特徴](http://groonga.org/ja/docs/characteristic.html) ## 環境 環境は下記の通り ##MySQLインストール remiリポジトリからインストールしています。 ここまでは普通 ## groongaインストール マニュアルにあるとおりにインストール [2.5. CentOS groonga v2.1.1ドキュメント](http://groonga.org/ja/docs/install/centos.html) ここまでは順調 ## mroongaのインストール
送信Formを埋め込みたいWebページの日本語文字コードと、送信先のURLの日本後文字コードが異なる場合のお話。 例えば、EUC-JPでエンコードされているブログページに送信Formを貼り付けたいが、送信先のURLはShift-JISだった場合など。 よくある対策は、 <form method="get" action="xxx.html" Accept-charset="Shift_JIS"> <input type="text" name="word" size=20 > <input type="submit" value="送信" > </form> のようにAccept-charset属性で送信先URLの日本語文字エンコード(Shift-JIS)を指定して促す方法である。 しかしこの設定はFirefoxなどでは有効だが、IEでは無効である。 そこで、Javascriptを使ってF
携帯サイトの開発中。PC から動作確認して大丈夫、と思って携帯でアクセスしてみたら、POST した内容が urlencode された状態で表示される。ぐぐってみたところ、au の場合、form タグに enctype="multipart/form-data" をつけるとこの現象が発生する模様。 知らない属性なら無視すればいいのに、au は余分なことをやっている、というブログエントリも発見した。が、やっぱり知らない属性だから無視しているんじゃないかと推測。 つまり、デフォルトの enctype は "application/x-www-form-urlencoded" で、POST した内容は urlencode された状態でサーバに飛ぶ。サーバ側のフレームワーク (たとえばPHP) は enctype を見て urlencode されているのだから、と urldecode してアプリケ
何故かあたり前にならない文字エンコーディングバリデーション | yohgaki'sblog ってあるように、いまいち文字コードの不正な判定による危険性ってのが分かってない。 SJISの問題は、(2/3)SQLインジェクションを根絶!セキュア開発の極意 - 第5回■注目される文字コードのセキュリティ問題:ITproの記事がわかりやすかった。 というか、やっぱりPHP使ってると誰でも一度は「なんじゃこの『¥』は?」って思うもんなんで。 なるほど、確かに↓の図のように「あるバイト」が2つの意味を持つっていう文字コード形態はやばいんだなと。 EUC-JPはそんなことはしないで、1つのバイトには1つの意味しか取らせない。 だけど、これでも文字化けが起こることがある。経験的には、「マルチバイトをXX文字で切り落としたい」とかやった場合。ちゃんと文字コードを判定してくれるPHPでいえばmb_subst

はてなグループの終了日を2020年1月31日(金)に決定しました 以下のエントリの通り、今年末を目処にはてなグループを終了予定である旨をお知らせしておりました。 2019年末を目処に、はてなグループの提供を終了する予定です -はてなグループ日記 このたび、正式に終了日を決定いたしましたので、以下の通りご確認ください。 終了日: 2020年1月31日(金) エクスポート希望申請期限:2020年1月31日(金) 終了日以降は、はてなグループの閲覧および投稿は行えません。日記のエクスポートが必要な方は以下の記事にしたがって手続きをしてください。はてなグループに投稿された日記データのエクスポートについて -はてなグループ日記 ご利用のみなさまにはご迷惑をおかけいたしますが、どうぞよろしくお願いいたします。 2020-06-25 追記はてなグループ日記のエクスポートデータは2020年2月28
From: "Shuichi Tamagawa" <"Shuichi Tamagawa" <tamagawa@xxxxxxxxxx>> Date: Mon, 7 Nov 2005 18:16:22 +0900 Subject: [mysql 12372]MySQL 日本語問題吐き出し緊急オフ会 - まとめ 玉川です。 11/4(金)の日本語問題オフ会にて議論が交わされた結果、 以下の点を優先度の高い課題として改善を要求することになりました。 a) 文字コードの自動変換に伴う文字化けへの対応 4.1以降クライアント/サーバー間で文字コードの自動変換が行われる ようになったことに伴い、文字化けが頻繁に発生している。 *--skip-character-set-client-handshakeオプションだけでは不十分 *libmysqlにmy.cnfファイル、又は環境変数に設定されたオプション
この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。 出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "半角カナ" – ニュース · 書籍 · スカラー · CiNii · J-STAGE ·NDL · dlib.jp · ジャパンサーチ · TWL (2023年11月) 半角カナ(はんかくカナ)、半角片仮名(はんかくかたかな, Halfwidth Katakana)とは、コンピュータで使用される文字集合のひとつで、もっぱら幅が通常の半分(半角)で表示または印刷される特殊な片仮名のことである。 日本におけるパーソナルコンピュータの黎明期から存在し、後に平仮名や漢字など多様な文字が利用可能になるまではコンピュータ上で日本の文字で日本語を書き表すことができる唯一の手段だった。 ASCII普及前、大型コンピュータ(メインフレーム)で
unsigned longmysql_real_escape_string(MYSQL *mysql, char *to, const char *from, unsigned long length)mysql は有効な開いている接続でなければなりません。エスケープはサーバーで使用されている文字セットによって異なるため、これが必要です。 説明 この関数は、SQL ステートメントで使用できる正当なSQL 文字列を作成するために使われます。セクション9.1.1「文字列リテラル」を参照してください。 from 内の文字列は、接続の現在の文字セットを考慮して、エスケープされたSQL 文字列にエンコードされます。結果は to に置かれ、終端の NULL バイトが付加されます。エンコードされる文字は 「\」、「'」、「"」、NUL (ASCII 0)、「\n」、「\r」、および Contro
■ツール 手っ取り早く試してみて下さい。(ポップアップでウインドウが開きます) ※IE6 + xmlをリクエスト + リクエストするファイルの文字コードShift-JISまたはEUC-JP + 受け取る形式がresponseText、この組み合わせの場合、ブラウザがフリーズします。つまりこの組み合わせはIE6をフリーズさせる組み合わせでありサイトでは使用してはイケナイ組み合わせという事になります 元のHTMLファイルの文字コード指定 Shift-JIS EUC-JPUTF-8 上記をクリックして下さい ■分析結果 サーバーについて 静的コンテンツのリクエストについて、POSTの使用の可否はサーバーの設定に依存する POSTが使えた場合でもWindows2000のFirefox2の場合はContent-Lengthがセットされず(もしくはサーバーに必要なヘッダがつかず)411のエラーが返る
携帯の文字コードと絵文字の基礎知識 説明 これは日本の携帯電話の文字コードと絵文字まわりの仕様をまとめた資料です。Encode::JP::Mobile の開発の中で作成されました。 記述に関してはできるだけ公式資料の URL を併記していますので合わせて参照してください。公式資料に言及されていない内容については [unofficial] を併記してあります。 修正・追記歓迎です。 DoCoMo絵文字リスト: 基本 http://www.nttdocomo.co.jp/service/imode/make/content/pictograph/basic/index.html 拡張 http://www.nttdocomo.co.jp/service/imode/make/content/pictograph/extention/index.html DoCoMo Web 表示できる c
昔から思うのですが、マイクロソフトの日本語表記ルールは実に奇妙です。現在は、広く一般に公開されていますので、ぜひ目を通してみてください。 まず、マイクロソフトは世界中の多くの言語をサポートすることを強調しています。そのためのポータルサイトも設置されています。しかし、そのサイトの日本語名は「マイクロソフト ランゲージ ポータル」。「ランゲージ」という言葉は決して一般的な用語ではありません。「ポータル」が一般に通じるかどうかも怪しいものです。各国の言語を尊重しているようにはとても思えません。 ちなみに、フランス語サイトもスペイン語サイトも、最初のパラグラフに登場する英語は「Microsoft」だけです。なお、かなに相当する文字を持つ言語はどうだろうと思い、韓国語サイトを開いてみましたがハングルは読めませんでした。 次に、各言語のスタイルガイドを見てみましょう。一覧の中で、私が知っている言語は日

Webサイト制作。PHPとかMySQLとかプログラム寄り。symfony、CakePHP。Perlと和解交渉中。 自分は遭遇した事無いけど、今後の参考に。PHPの内部処理の文字コードがEUCベースな為、UTF-8で作っていくとフォーム値が文字化けしてしまう事があるらしい。 結構多いトラブルの模様。 解決策としては、内部処理の文字コードをUTF-8に変更してから受け取る様にすると良い。 自分の経験で悩まされたのは、DBの文字化け。DBを一から構築する場合は最初からUTF-8で作っていけば良いけど、サーバの移転だったり既存のデータを使ったプログラムを組みときは文字化けが大変。EUC-JPが多い。 その時は以下のコードで文字コードを指定したクエリを発行して乗り越えられた。 <? mb_language("uni"); mb_internal_encoding("utf-8"); /
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く