C++で書いている以上、うまくまとめられる箇所はまとめられそうな気がするんだけどなあ。
OpenBSD(uaa@), Ham(JG1UAA), Ingress(Lv14, RES), Japanese(Sagamihara-city, Kanagawa)
Another side: https://social.tchncs.de/@uaa
npub1rarr265r9f9j6ewp960hcm7cvz9zskc7l2ykwul57e7xa60r8css7uf890
Messages from this Mastodon account can read via mostr.pub with npub1j3un8843rpuk4rvwnd7plaknf2lce58yl6qmpkqrwt3tr5k60vfqxmlq0w
C++で書いている以上、うまくまとめられる箇所はまとめられそうな気がするんだけどなあ。
kakasi→mecabへの変更はしてはみたんだけど、どうなんかねえ…分からなくなってきた。
これは評価が難しいな…
遊び方、kakasiは「あそびほう」mecabは「あそびかた」
これに対して
遊び/盛り、kakasiは「あそび/さかり」mecabは「あそび/もり」
…kakasiだけ、mecabだけ、という訳にもいかないのかも。
ユーザが好みに応じてkakasi/mecab選べた方が良いのかもな…
https://github.com/ueno/libkkc/blob/master/libkkc/rom-kana-utils.vala#L41 を見るに、Unicodeにある片仮名…ヷヸヹヺは読みとして扱わない(扱えない)で良いかな。
- UTF-8であれど、EUC環境で使うこともある以上UTF-8特有というものに対しては配慮しない
- かな漢字変換である以上<unk>(読みを設定できない物)に関しては対応しない
辺りの軸は定める必要があるかね。