I18N
http://diary.imou.to/~AoiMoe/2007.03/early.html#2007.03.05_s01_p03 double array にしろ succinct data structure にしろ, trie を collation に対応させるためには, trie への追加,及び look up の際に, key である文字列を全て事前に (collation …
しかしバージョン上がるたびに6000円だか7000円払うのはなぁ.いやまぁ買うんだけれどっていうかさっき注文したところだけれど.あと,この本分厚すぎるの何とかしてくれっぽ.テーブル削って規格の文言だけ抜き出したバージョンきぼんにゅ.あの厚さだとど…
ICU の converter ってここの The converters write to the target all converted output as far as possible, and then write any remaining output to the internal services buffer. When the conversion routines are called again, the internal buffer…
文字コードって,どこまで追求しても結局「自分が今意識している(文字コードが絡む)問題領域でどこまで面倒見て,どこから面倒見るのを諦めるか」になるよーにゃ気がするにゃー. 例えば「UTF-32 で UCS の code point と文字配列の1要素が1対1対応でちょ…
この前買い込んだ本そっちのけで以下らへんを読み漁って Unicode 周りのおべんきょ. http://webstore.ansi.org/ansidocstore/product.asp?sku=INCITS%2FISO%2FIEC+10646%2D1%2D2000 http://www.amazon.co.jp/exec/obidos/ASIN/0321185781 http://www.amazon…
ICUおもすれー( ^ω^) <微妙に脱線ちぅ
utf8_codecvt_facet_wchar_tってUTF-8N専用なのな.BOMありのヤツ読もうとしてはまったとゆー.BOMの読み飛ばしぐらいやってくれても良さげなのににゃー.