そういえば14MHz/430MHzしか使わない、移動しない局に関する変更申請はやっと終わりました。あとは局免をもらうための返信用封筒を送らねば…
OpenBSD(uaa@), Ham(JG1UAA), Ingress(Lv14, RES), Japanese(Sagamihara-city, Kanagawa)
Another side: https://social.tchncs.de/@uaa
npub1rarr265r9f9j6ewp960hcm7cvz9zskc7l2ykwul57e7xa60r8css7uf890
Messages from this Mastodon account can read via mostr.pub with npub1j3un8843rpuk4rvwnd7plaknf2lce58yl6qmpkqrwt3tr5k60vfqxmlq0w
そういえば14MHz/430MHzしか使わない、移動しない局に関する変更申請はやっと終わりました。あとは局免をもらうための返信用封筒を送らねば…
Pythonはよく分からないんだけど、まあhow-toなweb見ながらいじるしかないだろうなあ…
とりあえず、実績がある(と思う)IRSTLMで作った言語モデルのデータを食わせても動かないんですけど、sortlm.pyはその辺どうお考えなんです?ということは言えそう。(こちらで生成したdata.arpaに非は無いってことを言いたい)
<unk>をOOV(out of vocabulary)なる呼び方をするようだけど、sortlm.pyの作りとしてOOVをあんまり考えてないとかそういうノリなんだろうか。まあ確かに、1-gramの単語に無いものが2-gram, 3-gramに出てきてもらっても困るんすよ、ではあるんだろうけど。
ああ、これ問題無いんだ…元の3-gramコーパスにunkは入ってないし、IRSTLMのモデル生成結果に<s></s><unk>が入る(しかも小文字で)というカラクリか。
…おや、<s></s><unk>が素通しになってるけど…ヘンだなこれ。本当は引っかけないといけないはずなんだけど。wcscasecmp()は何をしているのやら。
<unk>って、<unknown>の略なのは分かっていたとしても…ちょっと良からぬものを想像しちゃうんですよその三文字の略だと。
IRSTLMで3-gramの日本語ウェブコーパスから[123]-gramの表を作る以上、単語表(1-gram)はちゃんとしてると思っていたんだがなあ…確かに<unk>のエントリがあった以上は切り捨てられたものも何かあるとは思ってたんだ。この切り捨てを無効化して.arpaを作れれば御の字なんだが…そうでなければsortlm.pyで対応するしかない。
もしかしてあれか、sortlm.pyの__read_ngramdのここ
for word in ngram:
agent = marisa.Agent()
agent.set_query(word)
if not self.__vocab_trie.lookup(agent):
continue
ids.append(agent.key_id())
単語表にないものについてはid.append()をngrams分登録できない…それに対し__write_ngramsでは
items = [(struct.pack("=LL", ids[1], unigram_offsets[ids[0]]), ids) for ids in keys]
ids[1]が存在することを前提にしている。故に、IndexErrorが起こる。
(この件に関しては言葉をオブラートに包む必要は一切ないと判断していますので、そのようにします。反論は一切無視で。)
件のプロダクションも滅んでいいと思います。マスコミとグルなら、まとめて消えれば良い。跡形も要らない。
マスコミの何社かが滅んでくれると良いかなーと思ってはいるのですが、なかなかそうはなりませんね…
このアカウントは、notestockで公開設定になっていません。
このアカウントは、notestockで公開設定になっていません。
このアカウントは、notestockで公開設定になっていません。
このアカウントは、notestockで公開設定になっていません。
素直にRaspberry Pi用DAC(PIFI DACなどという名称で売られているようだ)買った方が良さそうだな…変に悩むくらいなら。お金ちょっと張るけど。
@redbrick Arduinoって基本的に5V I/Oなので下手にARM系の基板に繋げない…
でも同じように見えるI2C CODECなボード、Raspberry Pi用としても売られてるんですが…?
https://www.aliexpress.com/item/1005005352684938.html
ingressいつの間にかmachinaっていう人のいないところで繁殖する第三勢力が生まれてたんだけど、見事に人のいないところを示してるな
IRSTLMの吐き出す.arpaなファイル、なんとなくだけど出現率のlog10をdoubleで出してる気がする…-4.6998e-05とか、-0.000145988とか、なんとなくfloatの域超えてるんじゃないかって。で、sortlm.pyはfloat(strv[0])みたいな形で読み取ってるけどpythonのfloatはCでいうところのdouble相当なのでこの部分での齟齬は無いと思いたい。
Pythonの浮動小数点数float型の範囲(最大値・最小値)(2023/7/12) https://note.nkmk.me/python-sys-float-info-max-min/
このPCM5102なI2S CODECなボード、Arduino用って書いてあるけど…BCK, DATA, LRCKに入ってる抵抗を取っ払って半田でショートさせたら3.3V I/OなARMのボードに繋がったりしませんかね…? https://www.aliexpress.com/item/1005005339519212.html
まあ、宮崎勉のおかげで「オタク=犯罪者予備軍」という空気が醸成され、パソコンオタクなんて言葉が存在して(今も存在してるか?)オタクを見たら叩いて殺せという扱いの時代にMSXとかいじっていた身には、流石に今のように情報機器が無ければ何もできないという時代に対してちょっとフクザツな気分になってるんだよ。もうイイ歳したオッサンだし…
ま、確かに「あれこれ」あったけど、良い時代になったとは思うよ?それが阿呆な方向へ進んで暗黒時代がまたやって来ないよう、目を光らせておかないといけないよね。歴史改変とかも流行ってるようだし。
過去も知らず<strike>最低限の敬意も持たずに</strike>に何イキってんの、という「感情」はあるかも。とはいえ、それは自分より経験値が上の人達が自分達に対して抱くものでもあるんじゃないかとは、思う
「アニメ見てるだけなのに自称オタク」とかそういうやつと同じことよ
不満に思うのもわからんでもない (それは「選ばれし人間」以外が雑に使うという形での特権性の侵犯に対する抵抗感であるともとれる) けど、どうあれそれは必然の帰結でしょうという感想しかない
そりゃそういう「選ばれし人間しか使えない称号」みたいなのを用意しちゃったら自分が特別だと思いたい人々がイキるために雑に濫用されるのは当然では?
個人がモデム使ってパソコン通信するのがやっとの頃、その裏(fjとか)でブイブイ言わせてた人達をインターネット老人というなら理解できるけど…
このアカウントは、notestockで公開設定になっていません。
このアカウントは、notestockで公開設定になっていません。
このアカウントは、notestockで公開設定になっていません。