符号化の問題

何か物事を考えるときに,とりあえず抽象的な問題に落とすというのは良くやる.抽象的な表記だとより広く客観的な視野をもって問題に取り組めるし,想定している具体的な問題がめっちゃくちゃアフォな問題だったとしても,そのアフォさ加減が完全に隠蔽されるのでとりあえず他の人があ〜だこ〜だと議論に付き合ってくれるかもしれない.例えば, 「x = y か?」という問題について,x と y についての詳細を脇に置いた議論には誰かが参加してくれる見込みがあるかもしれないが,x = イヌミミ, y = 萌え と問題に具体的な対象が代入された途端,潮のごとく人々の関心が引いてしまうのは目に見えている.
そんな前置きはさておいて,符号化の問題を考えちぅ.今,X, Y, Z という3つの文字があって,これらが各々長さが 2, 3, 4 とする.一方,今 A, B, C, D, E, F, G, H という8つの文字で構成されたある文書がある.各文字の文書中の出現頻度は予め与えられているとする.この文書を先の X, Y, Z で符号化するときに,その符号化後の長さが最小となるような A 〜 H の符号化はどうなるか?という問題.
普通の符号化の問題と異なるのは,符号化に用いる文字が3つというところと符号化に用いる文字自体の長さが異なるところ.