22:26:01
icon

そういえば14MHz/430MHzしか使わない、移動しない局に関する変更申請はやっと終わりました。あとは局免をもらうための返信用封筒を送らねば…

22:24:21
icon

Pythonはよく分からないんだけど、まあhow-toなweb見ながらいじるしかないだろうなあ…

22:23:49
icon

とりあえず、実績がある(と思う)IRSTLMで作った言語モデルのデータを食わせても動かないんですけど、sortlm.pyはその辺どうお考えなんです?ということは言えそう。(こちらで生成したdata.arpaに非は無いってことを言いたい)

22:22:20
icon

<unk>をOOV(out of vocabulary)なる呼び方をするようだけど、sortlm.pyの作りとしてOOVをあんまり考えてないとかそういうノリなんだろうか。まあ確かに、1-gramの単語に無いものが2-gram, 3-gramに出てきてもらっても困るんすよ、ではあるんだろうけど。

22:14:21
icon

ああ、これ問題無いんだ…元の3-gramコーパスにunkは入ってないし、IRSTLMのモデル生成結果に<s></s><unk>が入る(しかも小文字で)というカラクリか。

22:08:52
icon

…おや、<s></s><unk>が素通しになってるけど…ヘンだなこれ。本当は引っかけないといけないはずなんだけど。wcscasecmp()は何をしているのやら。

21:54:49
icon

あ、読み仮名付け(兼データのクリーニング他)のコード、<unk>未対応だ…

21:46:10
icon

<unk>って、<unknown>の略なのは分かっていたとしても…ちょっと良からぬものを想像しちゃうんですよその三文字の略だと。

21:37:01
icon

IRSTLMで3-gramの日本語ウェブコーパスから[123]-gramの表を作る以上、単語表(1-gram)はちゃんとしてると思っていたんだがなあ…確かに<unk>のエントリがあった以上は切り捨てられたものも何かあるとは思ってたんだ。この切り捨てを無効化して.arpaを作れれば御の字なんだが…そうでなければsortlm.pyで対応するしかない。

21:35:35
icon

もしかしてあれか、sortlm.pyの__read_ngramdのここ
for word in ngram:
agent = marisa.Agent()
agent.set_query(word)
if not self.__vocab_trie.lookup(agent):
continue
ids.append(agent.key_id())
単語表にないものについてはid.append()をngrams分登録できない…それに対し__write_ngramsでは
items = [(struct.pack("=LL", ids[1], unigram_offsets[ids[0]]), ids) for ids in keys]
ids[1]が存在することを前提にしている。故に、IndexErrorが起こる。

21:25:36
icon

(この件に関しては言葉をオブラートに包む必要は一切ないと判断していますので、そのようにします。反論は一切無視で。)

21:24:42
icon

件のプロダクションも滅んでいいと思います。マスコミとグルなら、まとめて消えれば良い。跡形も要らない。

21:23:43
icon

マスコミの何社かが滅んでくれると良いかなーと思ってはいるのですが、なかなかそうはなりませんね…

21:21:53
2023-09-12 21:16:28 宮原太聖(まち)の投稿 TaiseiMiyahara@matitodon.com
icon

このアカウントは、notestockで公開設定になっていません。

21:21:50
2023-09-12 21:15:14 宮原太聖(まち)の投稿 TaiseiMiyahara@matitodon.com
icon

このアカウントは、notestockで公開設定になっていません。

21:21:48
2023-09-12 21:14:38 宮原太聖(まち)の投稿 TaiseiMiyahara@matitodon.com
icon

このアカウントは、notestockで公開設定になっていません。

21:21:45
2023-09-12 21:12:47 宮原太聖(まち)の投稿 TaiseiMiyahara@matitodon.com
icon

このアカウントは、notestockで公開設定になっていません。

21:03:22
icon

素直にRaspberry Pi用DAC(PIFI DACなどという名称で売られているようだ)買った方が良さそうだな…変に悩むくらいなら。お金ちょっと張るけど。

20:53:11
icon

@redbrick Arduinoって基本的に5V I/Oなので下手にARM系の基板に繋げない…

20:34:24
icon

でも同じように見えるI2C CODECなボード、Raspberry Pi用としても売られてるんですが…?
aliexpress.com/item/1005005352

Web site image
4.72US $ 37% OFF|PCM5102 DAC Decoder I2S Player Assembled Board 32Bit 384K Beyond ES9023 PCM1794 Decoder Board Module For Raspberry Pi| | - AliExpress
20:33:15
icon

だからIngressのアプリロゴが変わったのか…?

20:32:53
2023-09-12 18:56:06 えあい:evirified::evirifried::win98_shrimp:の投稿 Eai@stellaria.network
icon

ingressいつの間にかmachinaっていう人のいないところで繁殖する第三勢力が生まれてたんだけど、見事に人のいないところを示してるな

Attach image
20:22:35
icon

IRSTLMの吐き出す.arpaなファイル、なんとなくだけど出現率のlog10をdoubleで出してる気がする…-4.6998e-05とか、-0.000145988とか、なんとなくfloatの域超えてるんじゃないかって。で、sortlm.pyはfloat(strv[0])みたいな形で読み取ってるけどpythonのfloatはCでいうところのdouble相当なのでこの部分での齟齬は無いと思いたい。

Pythonの浮動小数点数float型の範囲(最大値・最小値)(2023/7/12) note.nkmk.me/python-sys-float-

Web site image
Pythonの浮動小数点数float型の範囲(最大値・最小値) | note.nkmk.me
20:16:28
icon

このPCM5102なI2S CODECなボード、Arduino用って書いてあるけど…BCK, DATA, LRCKに入ってる抵抗を取っ払って半田でショートさせたら3.3V I/OなARMのボードに繋がったりしませんかね…? aliexpress.com/item/1005005339

Web site image
5.59US $ 22% OFF|Pcm5102/pcm5102a Dac Decoder I2s Player Board 32bit For Arduino - Integrated Circuits - AliExpress
07:44:28
icon

まあ、宮崎勉のおかげで「オタク=犯罪者予備軍」という空気が醸成され、パソコンオタクなんて言葉が存在して(今も存在してるか?)オタクを見たら叩いて殺せという扱いの時代にMSXとかいじっていた身には、流石に今のように情報機器が無ければ何もできないという時代に対してちょっとフクザツな気分になってるんだよ。もうイイ歳したオッサンだし…

ま、確かに「あれこれ」あったけど、良い時代になったとは思うよ?それが阿呆な方向へ進んで暗黒時代がまたやって来ないよう、目を光らせておかないといけないよね。歴史改変とかも流行ってるようだし。

07:34:44
icon

過去も知らず<strike>最低限の敬意も持たずに</strike>に何イキってんの、という「感情」はあるかも。とはいえ、それは自分より経験値が上の人達が自分達に対して抱くものでもあるんじゃないかとは、思う

07:32:24
2023-09-12 00:02:54 らりお・ザ・何らかの🈗然㊌ソムリエの投稿 lo48576@mastodon.cardina1.red
icon

「アニメ見てるだけなのに自称オタク」とかそういうやつと同じことよ

07:32:17
2023-09-12 00:02:31 らりお・ザ・何らかの🈗然㊌ソムリエの投稿 lo48576@mastodon.cardina1.red
icon

不満に思うのもわからんでもない (それは「選ばれし人間」以外が雑に使うという形での特権性の侵犯に対する抵抗感であるともとれる) けど、どうあれそれは必然の帰結でしょうという感想しかない

07:32:13
2023-09-12 00:01:17 らりお・ザ・何らかの🈗然㊌ソムリエの投稿 lo48576@mastodon.cardina1.red
icon

そりゃそういう「選ばれし人間しか使えない称号」みたいなのを用意しちゃったら自分が特別だと思いたい人々がイキるために雑に濫用されるのは当然では?

07:31:13
icon

個人がモデム使ってパソコン通信するのがやっとの頃、その裏(fjとか)でブイブイ言わせてた人達をインターネット老人というなら理解できるけど…

07:23:43
2023-09-12 00:01:54 はるかみの投稿 reasonset@uchu-teien.com
icon

このアカウントは、notestockで公開設定になっていません。

07:23:41
2023-09-12 00:00:16 はるかみの投稿 reasonset@uchu-teien.com
icon

このアカウントは、notestockで公開設定になっていません。

07:23:23
2023-09-11 23:52:31 はるかみの投稿 reasonset@uchu-teien.com
icon

このアカウントは、notestockで公開設定になっていません。