読者です 読者をやめる 読者になる 読者になる

鬼車はバイト単位だから

oniguruma

そんなわけで「ISO-2022-JP だって根性さえあれば余裕だし?」などと思い始めるわけですが、当然状態はどうすんだよとなるわけですな。自分にはそんな根性はないものの適当に妄想してみることにする。

  1. 起動時に直前のエスケープシーケンスまで戻って(マッチ開始位置sstartから文字列開始位置strまで戻れる)状態を取ってくる
  2. そこからマッチ開始位置まで進める (ここで中途半端な位置だとどうしようね)
  3. reg に入っている正規表現と粛々とマッチ

粛々とマッチとは言っても、実際のところここをいったいどうするかが問題で、無駄なエスケープシーケンスをどうするかや、同じ文字でもバイト列が異なる表現になりうる場合とかを考え出すと、いくらか工夫が必要なんだろうなぁ。enclen や mbc_to_code も状態を取れるバージョンが必要だろうし。しかし、不可能ではなさそうな気配もしてきますな。