とりあえず、日本語のテキストをGB2312しか通らない中国製のLCDパネルでなんとなく(簡体字を使ったとしてもそれっぽく)表示する、という目的をなんとかしたいところ。サブ画面でちょっとしたメッセージを表示するのに便利そうなんだもん。
単にツイ廃向け液晶モニタを買う金が無い、ともいうけどw
OpenBSD(uaa@), Ham(JG1UAA), Ingress(Lv14, RES), Japanese(Sagamihara-city, Kanagawa)
Another side: https://social.tchncs.de/@uaa
npub1rarr265r9f9j6ewp960hcm7cvz9zskc7l2ykwul57e7xa60r8css7uf890
Messages from this Mastodon account can read via mostr.pub with npub1j3un8843rpuk4rvwnd7plaknf2lce58yl6qmpkqrwt3tr5k60vfqxmlq0w
とりあえず、日本語のテキストをGB2312しか通らない中国製のLCDパネルでなんとなく(簡体字を使ったとしてもそれっぽく)表示する、という目的をなんとかしたいところ。サブ画面でちょっとしたメッセージを表示するのに便利そうなんだもん。
単にツイ廃向け液晶モニタを買う金が無い、ともいうけどw
でもUnicode 2.0のUnihan-1.txt、壊れてるよね。2.1のUnihan-2.txt https://www.unicode.org/Public/2.1-Update/Unihan-2.txt の方が良さそう。
https://android.googlesource.com/platform/external/python/cpython3/+/refs/heads/main/Tools/unicode/python-mappings/GB2312.TXT を使ってUCS→GB2312変換テーブルは作っちゃいるけど、これを https://www.unicode.org/Public/2.0-Update/Unihan-1.txt にあるkTraditionalVariantを使ってで繁体字→簡体字変換を入れるという方法で対処できるのかな。
逆にGB2312は簡体字なのでkTraditionalVariantが多い…
kTraditionalVariantの示す先(繁体字)へのアクセスがあった時に、に対し、その(簡体字の)コードを渡すことで、繁体字をとりあえず簡体字として表示させるということが可能になる…で、いいのかな。
基本的には、日本語は繁体字のようなものということになるので…kTraditionalVariantよりもkSimplifiedVariantの修飾が付いてることの方が多そうに見えるな。
日本語でもkTraditionalVaiantが付く場合があって、U+4E07(万)に対するkTraditionalVariantがU+842C(萬)。
当然(?)、U+842CのkSimplifiedVariantはU+4E07。
uaa@framboise:~$ grep kSimplifiedVariant Unihan.txt |wc
2675 8032 88334
uaa@framboise:~$ grep kTraditionalVariant Unihan.txt |wc
2594 7868 88808
uaa@framboise:~$
「何か」(多分繁体字)に対する簡体字
「何か」(多分簡体字)に対する繁体字
の関係が一対一でないってことなのかなあ
jis2gb、コードをよくよく見るとライセンスの記載が無い…
これは流石にテーブルを使わせて頂こうにも、できないや。
Unihan1.txt読んでガンガレ、ということになるか。
jis2gb、これですよこれ…こういうの探してました(jis2gb2312じゃ見つけられなかった訳か)。 http://kanji.zinbun.kyoto-u.ac.jp/~yasuoka/program.html