1ビットというか可能性としては全体としてみて4ビットが足りない可能性が高い
DBの構造を今のうちに変えていく必要がある
未知の情報として1欄用意していたが、これを2欄にするか、1欄を暫定的に記号で分割しておいて後で一気に処理するか迷うところ
DBの欄を増やすのは難しいので記号で分離することを想定
1ビットというか可能性としては全体としてみて4ビットが足りない可能性が高い
DBの構造を今のうちに変えていく必要がある
未知の情報として1欄用意していたが、これを2欄にするか、1欄を暫定的に記号で分割しておいて後で一気に処理するか迷うところ
DBの欄を増やすのは難しいので記号で分離することを想定
記録が期待より1ビットたりない
現状仕様での想定から外れすぎていてかなり難しい
データが揃ったところで大規模なDB仕様変更が必要になることは確か
#ICカードこれひとつ
交通系電子マネーで、これまで想定していない新事実が発覚しました。
3万件を超えるDB情報を手作業で調整して改良していけるか分かりませんが、次のバージョンまでに改良のための準備処理を加える計画です。
#ICカードこれひとつ
セブン‐イレブン ひたちなか大成町店
同じ番号C7-1541から1/2と2/2が報告されております。
どちらかが間違っているものと思われますので、ご確認いただければ幸いです。
#ICカードこれひとつ
セブン‐イレブン 水戸見和2丁目店
「ふりがな」は正しく登録されていたはずですが、「みとみわちょうにちょうめてん」と誤った報告になっていました。
また、JE10710495816 という交通系SPRWIDが記載されていました。
これは記録されているカード内番号と矛盾はないのですが、しかしセブンイレブンで交通系SPRWIDを確認する術や根拠はあるのでしょうか?
確認の術がない情報であれば、削除対応とさせていただきます。
とりあえず、「レーベンシュタイン距離アルゴリズム」に代えて、速度が速いらしい「O(NP)アルゴリズム」に変えてみました。かなり高速になっています。
検索語が短いほど遅くなる傾向にあるようなので試しに短めの店名「ファミリーマート」「北品川店」で検索するテストを実施
現レーベンシュタイン距離アルゴリズム
3回平均64.624秒
新O(NP)距離アルゴリズム
3回平均5.125秒
どうやら当社比12倍以上の高速化に成功したようです。
従来とアルゴリズムが違うので近似かどうかの成績もだいぶ違うとは思いますが、耐えられるくらいの速度にはなったかと思います。
色々なパターンで確認中ですが、概ね10秒以内には結果が出てくれるようではあります。
まさかアルゴリズムを切り替えて使いたいという方はおられないと思うので、現「レーベンシュタイン距離アルゴリズム」の処理は廃止し、O(NP)アルゴリズムに処理を置き換える方向で対応を進めます