2006-03-01から1ヶ月間の記事一覧

String#each_char

rubyco さんのところで、String#each_char って便利じゃない?って話が出ています。 これはすでにjcode.rbに存在しますね。組み込みにしようよと、まつもとさんに提案したこともあります。って、ここで String#each_char は HEAD に入れますとあるのに今も入…

文字を数える

artonさんの出題と解答例とか。以下のような解き方もおもしろいかな。もちろんUTF-8決め打ちならkconv不要。 require'kconv' "日本語".toutf8.unpack('U*').sizeArray#injectは凄い便利なので、artonさんのString#char_countも以下のように書き換えられます…

UTF-8の正規表現

弾さんのところにUTF-8 vs. ISO-10646というentryが。PerlではルーズなUTF-8のことをutf8と読んでましたね。 というわけで、UTF-8 の文字にマッチする正規表現という話。蛇足になりますけれど、もっと厳密にしますと、最短でないUTF-8表現を除外できるので、…