20:10:06
icon

さてと、一旦kakasi→MeCab化したので、これをkakas/MeCab両対応へ持っていこう。MeCabの読み仮名も結果に癖があって、カタカナで返してくることになっている割には「ぁ」に「ぁ」を返してくる…カタカナになってないじゃん!って感じなんだよね。

18:51:08
icon

そういえばなんかそんなのもありましたね…(まだ滅んでいなかったんだろうか)

18:48:55
2023-09-21 15:12:34 埼玉ギャル(仮)の投稿 sota_n@social.mikutter.hachune.net
icon

このアカウントは、notestockで公開設定になっていません。

07:21:13
icon

kakasiでもUTF-8が通るなら、mecab/kakasi両対応というのもちょっと考えないといけないな(とはいえ「蹴っ飛ばす」が「けっ飛ばす」になっちゃう問題への対策を復活させないといけないし…)

07:06:22
icon

uaa@emeraude:~$ echo "かな 漢字 ヘンカン" |kakasi -iutf8 -KH -JH
かな かんじ へんかん
uaa@emeraude:~$

kakasi、ちゃんとUTF-8対応してるじゃん…(多分-iutfみたいに間違ってたオプション指定してたんじゃないのー?>自分)