20:45:19 @uaa@social.mikutter.hachune.net
icon

(SSL鍵が怪しいけど) deisui.org/~ueno/junk/guadec-2 に、
Implementation: libkkc
Language model
3-gram language model generated from:
Wikipedia (Japanese): 100,000 sentences
Yahoo! Chiebukuro (Q&A site): 20,000 sentences
って書いてあるな。

20:37:36 @uaa@social.mikutter.hachune.net
icon

N-gram コーパス - 日本語ウェブコーパス 2010 s-yata.jp/corpus/nwc2010/ngram から、形態素/文字N-gramともに「頻度100以上」の物をダウンロードした。data.arpaは3-gramのようなので、そのデータをSRILMに食わせてarpa化なんだろうか。

N-gram コーパス - 日本語ウェブコーパス 2010
20:27:10 @uaa@social.mikutter.hachune.net
icon

Windows環境のPythonでN-gram生成ツール SRILM を使う方法(2022/3/11) qiita.com/phiniki/items/440337
WSL2上でもSRILMのビルドはできた。あとはこれに何をどう食わせるか…なんだよな。

Web site image
Windows環境のPythonでN-gram生成ツール SRILM を使う方法 - Qiita
20:14:55 @uaa@social.mikutter.hachune.net
icon

N-gramデータの前向き後ろ向きって見分ける方法あるのかな

18:35:37 @uaa@social.mikutter.hachune.net
icon

MS-DOSからWindows 95にかけてのゲームの機能や互換性を支えた「DOS/4GW」はいったいどんなツールだったのか(2023/9/1) gigazine.net/news/20230901-dos

うーん、DOSエクステンダの記憶も風化していくのか…DOS/4GWだけでなくPMODE/Wも思い出してあげてください。あとgo32とか。

Web site image
MS-DOSからWindows 95にかけてのゲームの機能や互換性を支えた「DOS/4GW」はいったいどんなツールだったのか
14:57:38 @uaa@social.mikutter.hachune.net
icon

Arc A770のファンが時々荒ぶってますのぅ…(GPUになーんも負荷かけていないのに、ときどきぶううぅおぉぉんと轟音を立てる、Arc Controlでは回転数0のまま)

07:42:08 @uaa@social.mikutter.hachune.net
icon

@hfp 確かにフルインストール推奨みたい。20GBも行かないならまあ全部突っ込むかって感じではありますね(引用先のスクリーンショットでは9GBくらいになっていますが)。 slackware.jp/install/5-selecti

Web site image
パッケージの選択とインストール | 逆襲のSlackware
07:32:52 @uaa@social.mikutter.hachune.net
icon

派生distroは派生元のバージョンアップ後にバージョンが上がるとかあるので結局派生元が一番って結論になる。

06:16:29 @uaa@social.mikutter.hachune.net
icon

PythonでN-gramを作る(Julius)(2022/03/14) qiita.com/phiniki/items/9d4fe4
Juliusで自作N-gramを使う方法 (2022/03/22) qiita.com/phiniki/items/2a5d67

Web site image
PythonでN-gramを作る(Julius) - Qiita
Web site image
Juliusで自作N-gramを使う方法 - Qiita
06:10:56 @uaa@social.mikutter.hachune.net
icon

ARPA標準形式のN-gramのフォーマット・バックオフ係数 nekomimieditor.gjgd.net/%E9%9F (2013/10/03)
ARPA Language models cmusphinx.github.io/wiki/arpaf
統計的言語モデルツールキットpalmkitマニュアル quruli.ivory.ne.jp/document/pa

ARPA標準形式のN-gramのフォーマット・バックオフ係数|音声認識・音声入力Windows用フリーソフト「ネコ耳エディタ」ブログ
????Ū?????ǥ?ġ??륭?å?palmkit?ޥ˥奢??
06:02:49 @uaa@social.mikutter.hachune.net
icon

julius.osdn.jp/juliusbook/ja/m 「mkbingram は,ARPA形式の N-gram 定義ファイルを」
libkkcの辞書ファイルの元って、data.arpaってファイル名なんですが…ARPA形式っていうのがキーワードになりそうですね。

どっかから拾った何か(コーパス?)からARPA形式のN-gram定義ファイルを作る、そういう手順なのでしょうか…?