「コードポイント」は何ビットか
Unicode だと 21bit なんですが。
まぁ、Ruby にもGB18030が 32bit フルに使うので、signed int だと涙目って話はありまして。というか、あったが、codepoint codepoint 連呼する人々がいるんで怖くなり、あわてて unsigned int に直したので、関係する方々はご注意を、っていう話。エラー値が負だとか思っていると泣きを見ます。
Unicode だと 21bit なんですが。
まぁ、Ruby にもGB18030が 32bit フルに使うので、signed int だと涙目って話はありまして。というか、あったが、codepoint codepoint 連呼する人々がいるんで怖くなり、あわてて unsigned int に直したので、関係する方々はご注意を、っていう話。エラー値が負だとか思っていると泣きを見ます。