文字コード
2年目社員への挑戦状w もともとx-IBM1399の文字化け調査をするために書いた簡易な検査コードを転用して、 すべての利用可能な文字コードに同じことを試したところ、出るわ出るわになった。 いつもなら自分の趣味としてPMRをオープンするんだが、 なんか職場…
暇つぶしの文字コード調査なり。 x-IBM943は基本的にはJIS X 0208だったかと思う。 x-IBM943Cとは何者か。 プログラムで検証してみたところ、どうやらたった2文字の違いしか無いように思える。 1つ目の文字。 U+000A5(YEN SIGN)とU+0203E(OVERLINE) IBM943も…
nioのEncoderをベースに調査してみた。 いちおうioの方も試しているけども・・・。 suspicious codepoint encode()========= 15 codepoints U+0000A U+00085 6F codepoints U+0003F U+0303F U+0FFE8 U+0FFE9 U+0FFEA U+0FFEB U+0FFEC U+0FFED U+0FFEE 0E60F1…
ibm.swapLFにかかりきり。 System.outに使われるクラスが、 WAS for z/OSでは普通のプラットフォームとは違うクラスであることが分かった。 USSでWAS付属のjava叩いても、WAS上とは違いがでる。 com.ibm.ws390.SystemOutErrCodepageというプロパティがあるこ…
ibm.swapLFのつづき。 別に進展らしい進展はないのだけれど、 気になったことが増えたので書いておく。 0x15(EBCDICのNL)を0x25(EBCDICのLF)に変えるこのプロパティ。 分散系との互換のためにあるのだと思っていたらどうも違うっぽい? java.nioのおさらいも…
ibm.swapLFなるものを調査する機会があった。 正直まだよく分かってない。。。 IV18977: IMPLEMENTING SWAPLF FUNCTIONALITY FOR IBM-037 CODEPAGE このへんの話だ。 ちょっと表を添えておくよ。 EBCDIC ASCII CR 0x0D 0x0D LF 0x25 0x0A NL 0x15 この-Dibm.…
暇つぶしにやってみました。 chcpコマンドを使います。 chcp — Set or query ASCII/EBCDIC code pages for the terminal UNIX System Services Command Referenceより TSO/E経由でOMVSを触る人は使わないでください。 chcp -q これで現在の設定を確認します…
TSOで見てると化けてなく、hex onして見ても普通のEBCDIC。 ftpを使って、特にMBCSじゃなくSBCSのデフォルト設定のままgetしてきて、 ローカルで見ると文字化けしてるように見える。 おいおいただのEBCDIC-ASCII変換だろ。 これが前から謎だったんだけど、ど…
どうやら僕が最後に乗り越えないといけない事象は、これと同一に思える。 http://masaru.org/diary/20031211.html ここにもある。 http://www.logos.ic.i.u-tokyo.ac.jp/~kabe/pukiwiki/index.php?Programming%2FC%2Flibiconv 出力バッファの最後に、ポイン…
3時間の処理が、1時間になっちゃった。 vmstatに現れていた妙なスワップもなくなった。 良かったね。 お客さんもさぞや満足してくれてるだろう。 いや、ひょっとすると、いろんなところをもっと速く出来るんじゃないかと思ったかも?? 裏方で支援してるオイ…
Oracleのグローバリゼーション・サポートを調べてた。 JDBC開発者ガイドおよびリファレンスの他に、グローバリゼーションに関するマニュアルも必読だ。 10g以降はorai18n.jarを使う。 thin driverにはNLS_LANGは関係ない。 ドライバとサーバ間はUTF-8でやり…