Unicode 5.0 & ICU 3.6

しかしバージョン上がるたびに6000円だか7000円払うのはなぁ.いやまぁ買うんだけれどっていうかさっき注文したところだけれど.あと,この本分厚すぎるの何とかしてくれっぽ.テーブル削って規格の文言だけ抜き出したバージョンきぼんにゅ.あの厚さだとどう考えても持ち運べません.
ICU のバージョンも 3.6 に上がって 5.0 対応って言ってるのでまた規格とつき合わせて色々調べないと. ICU 使って locale 周りさえ実装すれば,プラットフォーム非依存で wide stream も Boost.Regex も Boost.Spirit も Unicode でとりあえずまわせるようにできるのは確認したけれど, collation とかは O.K. としてプロパティどうするのかなぁ. UTF-8UTF-16 の状態のままで Boost.Regex や Boost.Spirit でプロパティ(conformance 的にとりあえず normative properties ができたら O.K. と思ってるんだけれど)使うようにできるのかな?(そもそもそういう設計が正しいのかどうかすらもちゃんと rationale 追っていないけれど)
#っていうか TR18 がそのものっぽいじゃないかっ!あとで読んでおこうっと.
#今ちょーてけとーに TR18 読んだパンダ.UTF-16 のさろぐぇーとぺあだろうが, UTF-8 の4バイトだろうがとにかく code point 単位で引っかかるようにしろと.そもそもすでに arbitrary pattern (ドット) の時点で要求のハードルがたかいたかーい.っていうか多分これ Boost.Regex 単独では UTF-8UTF-16 に対する TR18 の実装は絶望的なのでは?効率云々度外視して良いなら, Boost.Regex の上に適当にぺぺぺぺぺぺぺぺぺぺぺぺぺぺぺぺっと実装を重ねればできるとは思うけれどどどどど……ぬーん.
#内部で UTF-32 に変えてしまうのが一番楽といえば楽うううぅぅぅ.それが許されるのかどうかは知らないけれど.