22:10:06
icon

とりあえず、日本語のテキストをGB2312しか通らない中国製のLCDパネルでなんとなく(簡体字を使ったとしてもそれっぽく)表示する、という目的をなんとかしたいところ。サブ画面でちょっとしたメッセージを表示するのに便利そうなんだもん。

単にツイ廃向け液晶モニタを買う金が無い、ともいうけどw

22:04:03
icon

でもUnicode 2.0のUnihan-1.txt、壊れてるよね。2.1のUnihan-2.txt unicode.org/Public/2.1-Update/ の方が良さそう。

22:01:04
icon

android.googlesource.com/platf を使ってUCS→GB2312変換テーブルは作っちゃいるけど、これを unicode.org/Public/2.0-Update/ にあるkTraditionalVariantを使ってで繁体字→簡体字変換を入れるという方法で対処できるのかな。

Tools/unicode/python-mappings/GB2312.TXT - platform/external/python/cpython3 - Git at Google
21:52:42
icon

逆にGB2312は簡体字なのでkTraditionalVariantが多い…

kTraditionalVariantの示す先(繁体字)へのアクセスがあった時に、に対し、その(簡体字の)コードを渡すことで、繁体字をとりあえず簡体字として表示させるということが可能になる…で、いいのかな。

21:46:51
icon

基本的には、日本語は繁体字のようなものということになるので…kTraditionalVariantよりもkSimplifiedVariantの修飾が付いてることの方が多そうに見えるな。

21:43:36
icon

日本語でもkTraditionalVaiantが付く場合があって、U+4E07(万)に対するkTraditionalVariantがU+842C(萬)。
当然(?)、U+842CのkSimplifiedVariantはU+4E07。

21:33:17
icon

uaa@framboise:~$ grep kSimplifiedVariant Unihan.txt |wc
2675 8032 88334
uaa@framboise:~$ grep kTraditionalVariant Unihan.txt |wc
2594 7868 88808
uaa@framboise:~$

「何か」(多分繁体字)に対する簡体字
「何か」(多分簡体字)に対する繁体字
の関係が一対一でないってことなのかなあ

21:02:23
icon

jis2gb、コードをよくよく見るとライセンスの記載が無い…
これは流石にテーブルを使わせて頂こうにも、できないや。

Unihan1.txt読んでガンガレ、ということになるか。

07:16:11
icon

jis2gb、これですよこれ…こういうの探してました(jis2gb2312じゃ見つけられなかった訳か)。 kanji.zinbun.kyoto-u.ac.jp/~ya