Twitterがハッシュタグの同値判定に利用してるUnicodeライブラリが対応してるUnicodeバージョンが、7.0以上8.0未満であるらしいことがわかった。即ち7.0ってことだな。

なでしこの姉だから姉しこって呼ばれてるのは分かるが、姉シコはちょっと字面がまづいだろ…

Unicodeのサイトクソ探しにくくて、GoogleでUnicodeData-3.2.0.txtとか検索した方が早い。

完全に楽しくなってきちゃった。

todo
unicodedata2いれてUCD version 7にしてみる
リガチャは分ける
リガチャに恒等変換を追加
先にリガチャを適用、そのあと単文字を置き換へる
順番にサーチ、置き換えへはランダムにする関数を使ふ

ucdバージョンの違ひでtoLowerすると壊れる可能性があるので、小文字にしないで大文字から直接変換できるよう対応を作っておく

正規表現つかってcase insensitiveな検索と置換をしてもよささう。

for文を入れ子にしつつ、同じ変数をカウンタに使ってたのでバグってたっぽいな…

完全に気合で手でやるしかない作業に泣いて居ます。

一段落してまた問題が降ってきた…つら…

今週の魔法少女くるみ58話、ほぼデレステで草

JavascriptのRegExpのUnicodeプロパティ、Firefoxでは使へないのか…

ガチ勢怖

熱いな…

6時間ほど延々コピペしてた…

GitHubがデフォルトをmaster→mainにした所為でpushができねえ…git更新しなきゃ…

おぢいさんぢゃん。あと誰?