21:59:32
icon

C++で書いている以上、うまくまとめられる箇所はまとめられそうな気がするんだけどなあ。

21:57:56
icon

kakasi→mecabへの変更はしてはみたんだけど、どうなんかねえ…分からなくなってきた。

21:56:03
icon

これは評価が難しいな…
遊び方、kakasiは「あそびほう」mecabは「あそびかた」
これに対して
遊び/盛り、kakasiは「あそび/さかり」mecabは「あそび/もり」
…kakasiだけ、mecabだけ、という訳にもいかないのかも。
ユーザが好みに応じてkakasi/mecab選べた方が良いのかもな…

07:35:06
icon

github.com/ueno/libkkc/blob/ma を見るに、Unicodeにある片仮名…ヷヸヹヺは読みとして扱わない(扱えない)で良いかな。

- UTF-8であれど、EUC環境で使うこともある以上UTF-8特有というものに対しては配慮しない
- かな漢字変換である以上<unk>(読みを設定できない物)に関しては対応しない

辺りの軸は定める必要があるかね。