とりあえず、UCS-2→EUC-JP変換時にどうにもならなかった文字については無条件に「〓」にしてしまっても良い気がする。基本的に半角文字は変換可能だし、対応しないものは基本的に全角文字…と理解してる。EUC-JP→UCS-2に変換できなかったものについては、「�」(U+FFFD)で良いかな?
OpenBSD(uaa@), Ham(JG1UAA), Ingress(Lv14, RES), Japanese(Sagamihara-city, Kanagawa)
Another side: https://social.tchncs.de/@uaa
npub1rarr265r9f9j6ewp960hcm7cvz9zskc7l2ykwul57e7xa60r8css7uf890
Messages from this Mastodon account can read via mostr.pub with npub1j3un8843rpuk4rvwnd7plaknf2lce58yl6qmpkqrwt3tr5k60vfqxmlq0w
とりあえず、UCS-2→EUC-JP変換時にどうにもならなかった文字については無条件に「〓」にしてしまっても良い気がする。基本的に半角文字は変換可能だし、対応しないものは基本的に全角文字…と理解してる。EUC-JP→UCS-2に変換できなかったものについては、「�」(U+FFFD)で良いかな?
ん?もしかして下駄記号の伏せ字って「情報を伏せる」ではなくて「活字を(ひっくり返して)伏せる」という意味だったりする?
〓「ゲタを履かせる」 (2022/3/28) https://www.yoshimurainsatu.co.jp/blog/?p=4590
下駄記号、伏せ字として使うケースもあるっていうけど実際にそういう使われ方をしている現場にはお目にかかったことが無いな。
「○ー○ー○ー○」(ウーバーイーツなりセーラームーンなりお好きな物を入れてね!)はよく見かけても、これを「〓ー〓ー〓ー〓」としているのは見たことが無いな。
さっき見た文字起こしのページには「〓(なんか言ってたこと)〓」みたいに括る使い方もあるって書いてあったし…奥深いな、下駄記号。
Wikipediaの下駄記号の項 https://ja.wikipedia.org/wiki/%E4%B8%8B%E9%A7%84%E8%A8%98%E5%8F%B7 「文字列ソートにおいては下駄記号を西郷にするように」ってJIS X 4061( https://kikakurui.com/x4/X4061-1996-01.html )の規定があるって話が書かれているけどこれってどの程度実装されてるんだろう。
そもそも〓(ゲタ)とは何を表すものなのか、「〓 意味」で検索していたら妙なのが引っかかってしまって困惑する事態になっていたという訳。本来の意味としては https://8089.co.jp/basic/word/%E3%80%93%EF%BC%88%E3%82%B2%E3%82%BF%EF%BC%89 のテープ起こし・文字起こし用語集に記された項目が信用できるのだろう。専門業者の手による用語集だし。
もうこんな辞書だと何が何やら分からない。
旗旒信号 https://kotobank.jp/word/-480446 (精選版 日本国語大辞典)
旗〓信号https://kotobank.jp/word/-1159914 (改訂新版 世界大百科事典)
どちらも旗旒信号の解説なのに、世界大百科事典の(本文は問題ないが)見出しの旒の字が〓になってしまっている。実は「旗〓信号」という…〓の文字にもしっかり意味があるものだと解釈してしまった。
このアカウントは、notestockで公開設定になっていません。
(まあMSXの場合はPCGになってるから、パターンテーブル書き換えちゃえば好きなグリフを定義できてしまうのだけども)
あー、確かに8bit機のBASICってグラフィック文字持ってたわ。その文字を入力するGRAPHキーとかあったくらいだし。MSXなんかだとこんな感じの http://ngs.no.coocan.jp/doc/wiki.cgi/TechHan?page=Appendix+A%2E9+%A5%AD%A5%E3%A5%E9%A5%AF%A5%BF%A5%B3%A1%BC%A5%C9%C9%BD が定義されてるけど、他機種なんかだとひらがなの代わりに派手なやつがあってこれはこれで羨ましかった記憶が。https://note.com/kazushinakamura/n/n38bac119d449
Unicode 13 sextants U+1FB00--U+1FB3B · Issue #607 · microsoft/cascadia-code · GitHub
https://github.com/microsoft/cascadia-code/issues/607
Unicode いろいろやってんな……
うーむ、w16(sj3の内部形式、EUC-JPではあるけど一部改変してる感じはある)←→UCS-16のテーブル、0x00~0x1f辺りのコントロールコードとかって考慮する必要あるのかなあ。mbstowcs_utf8()(仮称)に何を突っ込んでくるのか、というのを知らないとおかしなことになるのかも。んなこと考えずにとりあえず組んで、おかしければ調べる…でも良いのかもだけど。
久々にsj3側の作業に戻るのでsjgetchar.cを見ているところなんだけど…UTF-8拡張を行うのに追加した部分、例えばwcstombs()に対するwcstombs_utf8()みたいなものをどこに置くかというのはちょっと悩みどころ。とはいえ、wcstombs_utf8()/mbstowcs_utf8()の二つの関数になるはずなので、いちいち別ファイルに分けるのもどうなん?という気がする。
uaa@framboise:~$ echo -n "TEXTCOLLBYfGiJUETHQ4hAcKSMd5zYpgqf1YRDhkmxHkhPWptrkoyz28wnI9V0aHeAuaKnak" | sha256
cccc5da79fdfb699b8cdf1d79a8d7814fe46e06bde4f201628423495f6e2d195
uaa@framboise:~$ echo -n "TEXTCOLLBYfGiJUETHQ4hEcKSMd5zYpgqf1YRDhkmxHkhPWptrkoyz28wnI9V0aHeAuaKnak" | sha256
173fb01b24b000789aae6a599193908745b0a031810453a464367c68baa6d333
uaa@framboise:~$
流石にこっちは一致しないか
uaa@framboise:~$ echo -n "TEXTCOLLBYfGiJUETHQ4hAcKSMd5zYpgqf1YRDhkmxHkhPWptrkoyz28wnI9V0aHeAuaKnak" | md5
faad49866e9498fc1719f5289e7a0269
uaa@framboise:~$ echo -n "TEXTCOLLBYfGiJUETHQ4hEcKSMd5zYpgqf1YRDhkmxHkhPWptrkoyz28wnI9V0aHeAuaKnak" | md5
faad49866e9498fc1719f5289e7a0269
uaa@framboise:~$
おおお、同じだあ…
このアカウントは、notestockで公開設定になっていません。
「新宿東口の猫」はなぜ立体的に見えるのか? (田谷 修一郎, VISION Vol. 34, No. 3, 84–87, 2022) https://doi.org/10.24636/vision.34.3_84