I18N

collation に対応した trie

http://diary.imou.to/~AoiMoe/2007.03/early.html#2007.03.05_s01_p03 double array にしろ succinct data structure にしろ, trie を collation に対応させるためには, trie への追加,及び look up の際に, key である文字列を全て事前に (collation …

Unicode 5.0 & ICU 3.6

しかしバージョン上がるたびに6000円だか7000円払うのはなぁ.いやまぁ買うんだけれどっていうかさっき注文したところだけれど.あと,この本分厚すぎるの何とかしてくれっぽ.テーブル削って規格の文言だけ抜き出したバージョンきぼんにゅ.あの厚さだとど…

ICU の converter は blocking-preserving だよ

ICU の converter ってここの The converters write to the target all converted output as far as possible, and then write any remaining output to the internal services buffer. When the conversion routines are called again, the internal buffer…

à(<-ためしにやってみたら IE でちゃんと表示されてちょっと感動.当たり前なのかも知れないけれど)

文字コードって,どこまで追求しても結局「自分が今意識している(文字コードが絡む)問題領域でどこまで面倒見て,どこから面倒見るのを諦めるか」になるよーにゃ気がするにゃー. 例えば「UTF-32 で UCS の code point と文字配列の1要素が1対1対応でちょ…

うにこーどのおべんきょ

この前買い込んだ本そっちのけで以下らへんを読み漁って Unicode 周りのおべんきょ. http://webstore.ansi.org/ansidocstore/product.asp?sku=INCITS%2FISO%2FIEC+10646%2D1%2D2000 http://www.amazon.co.jp/exec/obidos/ASIN/0321185781 http://www.amazon…

ICU

ICUおもすれー( ^ω^) <微妙に脱線ちぅ

utf8_codecvt_facet_wchar_t

utf8_codecvt_facet_wchar_tってUTF-8N専用なのな.BOMありのヤツ読もうとしてはまったとゆー.BOMの読み飛ばしぐらいやってくれても良さげなのににゃー.