Unicodeは文字集合か符号化方式か

弾さんによる。

Unicode Consortiumは複数の符号化方式を定めていて、そしてここが重要なのだが、単一の文字集合を定めている。ゆえに、Unicodeと一言で言った場合は、文字集合を指すことが多いし、またそうあるべきである。符号化方式を指す場合は、UTF-7,UTF-8,UTF-16,UTF-32という呼び名を使うべきである。