さてと、一旦kakasi→MeCab化したので、これをkakas/MeCab両対応へ持っていこう。MeCabの読み仮名も結果に癖があって、カタカナで返してくることになっている割には「ぁ」に「ぁ」を返してくる…カタカナになってないじゃん!って感じなんだよね。
OpenBSD(uaa@), Ham(JG1UAA), Ingress(Lv14, RES), Japanese(Sagamihara-city, Kanagawa)
Another side: https://social.tchncs.de/@uaa
npub1rarr265r9f9j6ewp960hcm7cvz9zskc7l2ykwul57e7xa60r8css7uf890
Messages from this Mastodon account can read via mostr.pub with npub1j3un8843rpuk4rvwnd7plaknf2lce58yl6qmpkqrwt3tr5k60vfqxmlq0w
さてと、一旦kakasi→MeCab化したので、これをkakas/MeCab両対応へ持っていこう。MeCabの読み仮名も結果に癖があって、カタカナで返してくることになっている割には「ぁ」に「ぁ」を返してくる…カタカナになってないじゃん!って感じなんだよね。
このアカウントは、notestockで公開設定になっていません。
kakasiでもUTF-8が通るなら、mecab/kakasi両対応というのもちょっと考えないといけないな(とはいえ「蹴っ飛ばす」が「けっ飛ばす」になっちゃう問題への対策を復活させないといけないし…)
uaa@emeraude:~$ echo "かな 漢字 ヘンカン" |kakasi -iutf8 -KH -JH
かな かんじ へんかん
uaa@emeraude:~$
kakasi、ちゃんとUTF-8対応してるじゃん…(多分-iutfみたいに間違ってたオプション指定してたんじゃないのー?>自分)