どんな風に変換されてるか、図にしました。QR‐コードの「漢字モード」は Shift JIS を経由するので右のように若干崩れた形だけど、要するに JIS X 0208 の一つ一つの区を隙間なく詰めていった感じの符号化方式だ。JIS X 0208 は「94 区 94 点」の枠組みだけど、この操作は 96 点単位で捉えてよい。
二バイト文字で下位バイトに 256 通りの値を使い切るなら、上位バイトが三種類の値を消費する間にちょうど八区収まる事になる。これを第九区以降も繰り返すと、上位バイトが五ビットを使い切って 32 種類目の値(十進 31、すなわち 0x1F)を表す時、X 0208 の第 86 区の途中で限界に達する。(図中の「上位バイト 01」の「6 区」と同じ状況。)X 0208 の文字は第 84 区で弾切れだから、これで残らず符号化できる。