2005-06-01から1ヶ月間の記事一覧

nkf/skf vs iconv

iconvもいいかなぁと思っていたけれども、最近は思い直してきた。iconvはどうしてもエンコーディング名のみで指定する方向に行くわけで、これはちょっと微妙。euc-jp-ms-dosとか、指定としてありえないじゃん。オプション的なものを付けづらってのもあるし。…

Chat XML DTD 0.2

http://www.airemix.org/TR/ChatXML/DTD/ChatXML-0.2.dtd Revision: 1.2 (2005-07-15)

Unicode正規化について

Unicode正規化 NFC (Normalization Form C), NFD (Normalization Form D), NFKC (Normalization Form KC) ,NFKD (Normalization Form KD)とある。CはComposition。つまり、合成して完成形にする。 DはDecomposition。つまり、分解する。 KはCompatibility。…

Encode.pm

Perl5.8ではEncode.pmという巨大な文字コード変換ライブラリが入っています。しかし、日本語の変換に際しては、さまざまな問題があります。まずEUC-JPへと変換する場合の問題の回避策は以下の通り。 Encode($str, 'utf-8', 'EUC-JP', Encode::FB_HTMLCREF); …

Chat XML Working Draft 2案 Example

<feed version="0.2" xmlns="http://airemix.org/2005/ChatXML"> <updated>2005-07-15T00:39:49+09:00</updated> <system> <uri>http://airemix.com/Marldia/1.31</uri> <name>Marl…</name></system></feed>

Chat XML WD2で予定される変更

絶対URI URIは原則絶対URIにする。 発言者の情報 article/author に入れる name, uri, email, color, icon home要素 uri要素に変更 body要素 タグを使っている場合、どうするか。 CDATAされたHTMLをデフォルトにする方向で。 でも、それだと将来辛そうだから…

Chat Log XMLの懸案

意見を募集しています。 絶対URI MUSTにする項目 発言者の情報 article/author に入れるようにしようか home要素 linkに変えようか body要素 タグを使っている場合、どうするか。 XHTML?CDATAedHTML?CDATAedPlainText?

Chat Log XML Working Draft 1

概要 チャットが出力するXMLの仕様。 エンコーディング UTF-8を推奨するが、EUC-JPでもよい。 document要素 説明 Chat XMLのルート要素 内容 updated system site (optional) entry 備考 entry要素以外は一つしか持たない。 updated要素 説明 親要素が更新さ…

文字

each_charってどうよ?って話だけれど、characterで正しいと思います。letterやglyphは違う意味ですしね。「文字構成要素でも符号位置を持っていれば,それをcharacterと呼ぶことがSC 2の定義であり,これらを合成した結果の"いわゆる文字"はcombining seque…