若くないけど斧を今知りました…本当だってば!
OpenBSD, Ham(JG1UAA), Ingress(Lv14, RES), Japanese(Sagamihara-city, Kanagawa)
Another side: https://social.tchncs.de/@uaa
npub1rarr265r9f9j6ewp960hcm7cvz9zskc7l2ykwul57e7xa60r8css7uf890
Messages from this Mastodon account can read via mostr.pub with npub1j3un8843rpuk4rvwnd7plaknf2lce58yl6qmpkqrwt3tr5k60vfqxmlq0w
このアカウントは、notestockで公開設定になっていません。
日本語入力やっていきの会を準備し始めました。一緒にやっていきたい人は声をかけてください。
かな漢字変換に限らないし、キーボード入力に限らないし、開発者に限らないです。
https://github.com/FUJIMI-IM
https://sr.ht/~omasanori/fujimi/
@hadsn (副音声)「まさかデータシートも見ずに質問するなんてことはしてませんよね…?」
@hadsn 「データシートを見たらある程度推測できませんかねー?」的なコメント投げときました。
ほんっと、「さあこれから」ってタイミングで必ず刺されるのは何故なんだろう。
Just in case. #InputMethod #FreeWin #Canna
FreeWnn.tar.zst
https://www.axfc.net/u/4071551
SHA256: 441b81215e423c9429c9c77fb821d880c140e91d490bd75699b16eb5f39296b8
canna.tar.zst
https://www.axfc.net/u/4071553
SHA256: f574b3ba09a87f533152b70ed0036b0845418041645d7bbea1b9c9efdc354710
斧、えっちな広告のおかげでなかなかダウンロードできない(背後で妻子がうろうろしてる…これからダウンロードしようとした瞬間に!!💢💢💢)
【uaaの年末年始】
12/26 飲酒
12/27 飲酒
12/28 飲酒
12/29 飲酒
12/30 飲酒
12/31 飲酒
1/1 飲酒
1/2 飲酒
1/3 飲酒
#私の年末年始予定表 #shindanmaker
https://shindanmaker.com/954489
せいぜい大晦日~三が日くらいに留めたいなあ、飲酒。肝臓壊す訳にもいかないし、酒代も安くない。
企業に対して開示せよ、っていうなら理解するんだけど…コミュニティベースの(回路図も出ている)ハードウェアで開示しろって大上段から言われましても…
データシートを見た上で質問しているかどうかで判断することにします。
「下記項目について開示下さい」って、どういう日本語なんだろう。
「下記について教えてください」なら分かるんだけど…
とはいえ、(curdic->getdic)((struct dictfile *)(struct dictのポインタ), foobar)というのは明らかに「正しいコード」ではない…
かといってStruct.hのstruct globalにあるDICT *Jcurdictをstruct dictfile *Jcurdictにするとか、struct dictfile *JcurdictFとかリネームした上でsj_rename.h側で頑張るっていうのも…頑張れなかったんだよね(自分のスキルでは、というのもある)。
うーん、DictFileとDICTの共通化とかそういうのは難しそうな感じ。消極的だけど、キャストで逃げるしか無いかも。
/home/uaa/z/sj3/kanakan/adddic.c:151:45: error: no member named 'segunit' in
'struct dictfile'
if ((*curdict->putdic)(curdict, curdict->segunit))
あー、第一引数はそれで文句を言わなくなったけど第二引数で怒られるのか。
GlobalのDICT *Jcurdictを、DictFile *Jcurdictに変えたら何が起こるか実験してみるか…
Global *work_baseの中にDICT *Jcurdictが居て、work_base->Jcurdictをcurdictで呼べるようにdefineしてる。
DictFileはDICTのスーパーセットになるってことは、サブセットのポインタの裏でスーパーセット扱うのってぶっちゃけどーよって話になる?
sj3libの、string.c関連のwarning、__sony_news絡みのコードを活かすか殺すかで作業方針が変わると思う。個人的には殺して良い気がするけ(今更NEWS-OSで動かさないといけないという理由は無いはず)。
このアカウントは、notestockで公開設定になっていません。
このアカウントは、notestockで公開設定になっていません。
@omasanori もしかするとマージ済かもしれませんが、-Wimplicit-intのwarning潰し(2)と https://git.sr.ht/~jg1uaa/sj3/commit/c844bc906f9076ff7ade6c4f50081d57d4ec1feb -Wpointer-typeのお手軽に潰せたwarning https://git.sr.ht/~jg1uaa/sj3/commit/d3c7742bb4093bf90819c49c9bfc6033cd4238a2 置いときます。
予想より早くSJ3にパッチが届いたので、GitHubの組織を作った。SJ3 2.1.0に間に合うようにこちらの整備も進める。
うえぇ、終わらないよう…
【休業のお知らせ】
お客様へ
夏休みの宿題が終わらない為、本日休業します。
洋食屋uaa 店主
さて、アドベントカレンダーの仕込みはこれでほぼ終わり。カレンダーの前後の記事のリンクを調整すれば出せるはず。
@nikolat 現時点ではまだ未公開なので403になります
@nikolat http://uaa.org.uk/gomitext/2023/202312.html#02-Dec-2023
予定地です(ああああ自分のプロジェクトを進めるの忘れてた…)
@omasanori アイデアとしては4つ。
- 全てスーパーセット(struct DictFile)を使うようにする
- struct dictfile, struct dictからなる共用体を作りこれを使うようにする
- voidで受けておいて内部で然るべき型に解釈する
- struct dictfileへのキャストで対応する
手を掛けつつも掛けすぎない落とし所がなかなか難しいです。
@omasanori -Wincompatible-pointer-types対策のうち簡単に逃げられる箇所だけ直してみましたが…curdict周りの問題は一旦置いといたままにしています。
struct dict(DICT)の中にstruct dictfile(DictFile)を要求する関数が定義されており、DictFileの中にDICTが含まれているのをどう解決するかが厄介そうだという理由です。
変更箇所が多いのでsj_rename.h辺りでキャストしちゃうのも手なのかもしれませんが、要となる部分のコードですしその場しのぎの修正をするよりかは手間をかけてでも正しい形に持っていく方が今後にとってプラスになるのかなと考えています。
Struct.hにあるstruct dictfile(DictFile)がsj_struct.hにあるstruct dict(DICT)を内包していて、内部では都合よく使い分けてるけどコード的にはちゃんと記述せーよという場合をどう直したもんかね。
現状では受け手がスーパーセット(DictFile)を要求しているのに対し、ミニマルセット(DICT)を渡そうとしてwarningになってる。
コードのスタイルを壊さないように修正するのって結構難しいっすね…
@omasanori https://git.sr.ht/~jg1uaa/sj3/commit/ef5f66dfd5f1da049213dea4a734b561048b5957
とりあえずさっきのとこれでほんのちょっとだけwarningが減るはず…
@omasanori 早っ、ということで今-Wimplicit-intも潰しにかかってます。
(とりあえずwarningだらけなのでこれを潰さないことには先に進めないのでは…?ということで、やることは簡単だけど数が多くて面倒そうなこいつをまずは潰しちゃおうかなと)
ごめん、sourcehut使い慣れてないので聞いちゃうんだけど…この修正ってどうpull-request出すの?(それともmercurialみたいにmail bombでパッチ投げちゃう方が良いんだろうか) https://git.sr.ht/~jg1uaa/sj3/commit/0f3ec73e2da9969cedb49108b894101ff0be5b61
このアカウントは、notestockで公開設定になっていません。
sj3serv/level1.cとsj3lib/level1.cってビミョーに違うっていうのはすごくヤな感じですね…
うーん、あんまり意味のある修正じゃないんだけど、if (x = y())をif ((x = y())にするところから始める?いちいち-Wparentheses付けるのもダルいから…
メシ(米飯)の話をすると、さっき食事したばかりなのになんか食べたくなってしまうな…多分なんかストレスたまってるのかも。
仮想マシンのお守りおしまい…で、何をしようとしたんだっけ?(おい
(…おかしい…sj3いじろうとしてたはずなのに何故仮想マシンのお守りを…)
とりあえず、使ってる仮想マシン全てのNFSマウントをTCP化したので、これで安心して使えるんだろう多分。
Linux上でtapデバイス山ほどこさえて仮想マシン←→実マシンの通信だけでなくネットワークへの参加もやらせているので、UDPだとなんかイケナイものを踏んでしまうのかもしれません(とはいえ、NFSマウントでUDP使うと動かなくなっちゃうのってOpenBSDだけだったり)。
このアカウントは、notestockで公開設定になっていません。
nfsマウントする際に、TCP使わないと安定しないケースってどの程度ある話なんだろう。
clangがUTF-8以外は認めぬわ、というのであれば…EUC-JPで書いたコードを「そんな文字列知らぬ」と警告する問題に対してどう対応すれば良いんだろう。いちいち0xXX, 0xXYとかhexの羅列にせよと言うのだろうか…?(安全ではあるけど可読性は非常に悪くなる)
今はソースコードを上げた先(githubとかsourcehut)で面倒見てくれるのか…手元に環境用意しなくても済むのがありがたい。
…Slackware(i386)とDragonFlyは無いみたいだからそこのチェックが要るかな?
確かに、そろそろCIスクリプトを書いた方がいいかもしれません。
ちなみに、sr.htのビルドサービスにはAlpineやDebian、Fedora、UbuntuなどのLinuxディストリビューションだけでなく、FreeBSD、NetBSD、OpenBSD、9frontまで用意されているのがクール。ただし、コミットに反応して自動起動できるVMは4つまで。
/home/uaa/z/sj3/sj3mkdic/GramTable:120:3: warning: illegal character encoding in string literal [-Winvalid-source-encoding]
{"<B3><A4>", -31},
多分gccなら-finput-charset=eucjpとでも書けば黙ってくれそうな気がするけど、clangで使えるのかな(eucjpなんざ知らぬ、って怒られたけどUTF-8は受け入れてくれてる)
sj3 2.0.94 OpenBSD上でビルドできることを確認したけど…他環境でビルドできるかの確認も要るよね?(どこからやろう)
https://git.sr.ht/~omasanori/sj3
かな漢字変換サーバーに注力するため、クライアント側のコードを一旦削除して2.0.94をリリース。
やっている仕事を直接書かないまでもそれとなく匂わせるように書くというのは難しいもんですな…別に積極的に隠すつもりもないとはいえ(某所ではしっかり書いてしまったし、御存知の方は御存知だと思います)、下手に書いてしまうと厄介が絡んでくるのであんまり書きたくないなーというのあります。MastodonはXよりもまだ安全なのか、あるいは余計に危険なのかは何とも言えないし。
薬という“お土産”を欲しがる患者たち (2016.10.26) https://business.nikkei.com/atcl/opinion/15/221102/102500334/
おみやげ処方…
なんか分かる気がする。libkkcの辞書をcc100から生成して、出現頻度を変えながら動きを見てるんだけど…出現頻度の低いものを拾う→語彙数は増えてる気がする→でもあんまり賢い気がしない(むしろノイズを拾って使いにくい場面もあるような?)、というのがあって。
最終的にはヒトの目を使って辞書を精査していく必要はあるんだと思う…とはいえ、現実的にそこまでできない以上は、多少馬鹿でもある程度使えるものという(レベル低めの)アプローチを取るしかないのも確かで。
このアカウントは、notestockで公開設定になっていません。
「今すぐ」の対応を求めるなら即時対応加算とか認めてほしい…単位時間当たりに処理可能な作業量は上限がある以上、それを越えて殺到されるのは店にとっても客にとっても不幸な結果を招くだけなので。後でも良いなら後で(その代わり約束した時間には来てもらわないとすごく困る、暇そうに見えて裏で色々タスクが走ってます)というのを推し進めないとあっという間に資源は枯渇しますぜ。
レジ回り(金額支払い)くらいはセルフでお願いしたいよなあ。というか、医療資源ってこういう細かい手間にかかる時間も資源として含めてほしいもんだけど。
ヒトが相手をするからこその気づき、そこから未然に防げるものがあるかもという希望があるからヒトに仕事を任せているのだろうけど、ヒトの性能が低い(AI等の方が高性能)と判断された暁には「ヒトなんかイラネ」となるのでしょうなあ。それは薬剤師に限らず医師もそうなるのだと思いますが…あとは政治力の問題もあるのでしょうね(なんてことをX上で呟こうものなら「お医者の先生様」に噛みつかれるでしょうなあ)。
イマドキの人はPepperみたいなのに接客されても違和感ないのでしょうけど、ある程度お年を召した方々は恐らく猛烈に抵抗するでしょうねえ。ガストとかのネコチャンだとどうなんだろう…?
例えば血圧を下げる薬もしくはコレステロールを下げる薬みたいなものを一種類使っていたとして、特に体調で変わったことが無いんなら自販機に任せれば良くないですか?(というかちゃんと接客しないとお仕事無くなりますよね?自販機+Pepper辺りに接客させればいいのだし)という指摘は結構あるんですよね。現時点ではそういうのは認められていないとしても、今後どうなるかは…
このアカウントは、notestockで公開設定になっていません。
このアカウントは、notestockで公開設定になっていません。
このアカウントは、notestockで公開設定になっていません。
このアカウントは、notestockで公開設定になっていません。
確かに施工前施工後‥‥
"現場で工事写真撮るときに何か良いアプリないかなーと思ってたんですけど、たまたま現場に入っていた方が使ってたのを教えてもらいました😊
良い感じです!"
https://twitter.com/ashitahare__/status/1729351431185162617
Wiktionary:著作権切れ辞書の一覧 https://ja.wiktionary.org/wiki/Wiktionary:%E8%91%97%E4%BD%9C%E6%A8%A9%E5%88%87%E3%82%8C%E8%BE%9E%E6%9B%B8%E3%81%AE%E4%B8%80%E8%A6%A7
もしかして、国会図書館デジタルコレクションってログインしないと閲覧できない(しかも画像)…?
「新語」には対応してないけれど、平凡社の『大辭典』(1934年〜1936年)が著作権の保護期間を満了していて広範囲の語彙を含んでいるので自然言語処理のデータセットとして面白いんじゃないかと前々から目をつけている。
そういう重い旗を振らないで済むよう、既存の利用可能なもので「ある程度使えるものを完成させる」というのが重要な気が。そこからコストをかけるなり掛けないなりして、とっても使えるものにしていくかどうかなのかなー、って。
このアカウントは、notestockで公開設定になっていません。
かな漢字変換、辞書調達の問題が指摘されてるけど…mecab-ipadic-NEologd https://github.com/neologd/mecab-ipadic-neologd/blob/master/README.ja.md 辺りをベースにそれぞれのかな漢字変換エンジン向けにコンバートするってのはどうなんだろう。当時開発された頃の語彙よりはだいぶリッチになるのかなーという気はしている。
(形態素解析によるn-gramとかは、どっちかというと語彙の使われ方の情報…いわゆる「賢さ」に相当する部分のパラメータがなんとなく出てくるだけであって、「単語」という素材だけで考えるなら既にあるフリーの辞書をどう活用するかを考えるのが先という気がする)
指摘された項目のうちpkg/DESCR以外はとりあえず直してみた(これは明日やる)。
(こういうのは一旦手を出すと止まらなくなるから嫌なんだよーw)
違うなー…
<sys/select.h>をどこかでインクルードしないといけないけど誰にやらせんのって話か。ついでにLinuxだとどうすんのってことも考えないといけない(ああこれは面倒…)
sj3h/select.h:typedef fd_set SELECT_FD;
こやつかなあ
L_SETって、kanakan/depend.cの
depend.c:128:21: error: use of undeclared identifier 'L_SET'
if (lseek(fd, pos, L_SET) == ERROR) {
の話か…とりあえず#include <unistd.h>して回避したら今度はfd_setなんざ知らぬと言われたが…
demo, dict/tool, sj3dic, sjj3lib, sj3statはwarningだらけでもビルドできて、kanakan, server, sj3がエラー出るのかな。
(FreeBSDのdistfilesにあったsj3-2.0.1.20をちょっとつついてる)
個別のディレクトリでxmkmf; makeでビルドはできたりできなかったり、っぽいね
やっぱ古いコードに手を出すには歴史を知らないとお気軽には…と身構えてしまう。とはいえ身構えたままじゃ先に進めないし…
古いコードを変換する時は whence の値を以下のマクロに置き換えること:
http://www.linux-cmd.com/lseek.html
L_SETなんて初めて見た…(勉強になる)
onewで見かけた、
ouiTrace(prim,fmt,a,b,c,d,e,f,g)
char *fmt;
{ ... }
とか、戻り値の型は?fmt以外の型って?ん???
とかなってしまう訳で。
でもK&R時代のコードのメンテってすごく難しい気がする。型宣言が中途半端なのをコンパイラがよきに計らってくれるのを期待してるような場合、どうやれば…?ってなったんだけど。
そういえばonewがclang-16でビルドできない件で送ったパッチについてはお返事が無いよーな。まあいつものことだけど…
なんか最近K&Rのコード触ってうがーってなったのがあったよな…
このご時世にわざわざ旧仮名遣い・旧漢字でblogやtweet/postしているのを見ると「うわぁ…」ってなりますよね…
ちょっと距離置いた方が安全?とか、そういう。
このアカウントは、notestockで公開設定になっていません。
単に<stddef.h>に定義されたものへ置き換える以上問題は起こらないはずなんだけどなあ。
「その修正ってC++11でも通るの?」という問いがあったので検証中…修正箇所と全然関係ない、Xfuncproto.hがごねるんだけど無視して良いよね?(でもX11関連のヘッダで問題が起こるのもあまり良い状況じゃないような…?)
SJ3の一番大変そうなところ(かな漢字変換、クライアント、サーバー)以外の辞書ツールや公開APIの部分はCMakeでビルドできるようにした。コンパイラの警告はたくさん出る。
以前データウェアのライセンスどうしよっかなーというのはこれについてだったり。面倒だから0BSDでいいかなあ(まだ作業中なので、全部まとまってからライセンスの文言を入れようかな)。
今抱えてるのってこれなんだけど…いわゆる後発医薬品(今のところ内服薬に限定してる)における生物学的同等性試験で出てくるデータ(AUC, Cmax)をひたすらCSVにまとめるだけという、なんか修行みたいなやつ。あと6000件以上(どれくらい増えるかは知らない)残ってる感じなんだけど、年内に終わる気はしないですねー https://github.com/jg1uaa/ge-aucdb/blob/dev/ge-aucdb.csv#L6020
SJ3のコード、5〜6行も空行が連続してる箇所がいくつもあったり、行末にタブ文字がやたら入ってるんだけど、これってもしかしてソースコードからコメントを削除してから公開したのかな。
発注したと思い込んでた…これ(即落札抜きの)オークションだった…あああああ><
開発者コミュニティがきちんと力を持つまでの間は、目立たないようにやるというのは多分どこも一緒のはず。
(ここでは包まずに書くけど)BTRON界隈の喧しさ…コード書く人間が少ない割に「お客様」気取りな人間の多さというのを見てきた以上、日本語入力界隈も多分同じような構図になるんだろうなーって気が早いかもしれないけど懸念してます。そうならないようにどう立ち回るかというのは、考えておく必要があるのかも。
このアカウントは、notestockで公開設定になっていません。
とりあえず読まないことには分からないので古本屋さんで発注してみた(と言って買うだけ買って読まない本がどれだけあるんだよというツッコミはしないでほしいなあ…)
今だと「日本語入力を支える技術」辺りをとっかかりとして読めばいいのかなあ?(とはいえ中古でしか手に入らない?)
https://www.amazon.co.jp/dp/4774149934
PC-9801辺りの時代に、日本語変換システム(といってもごくごく簡単なかな漢字変換の話だと思う)の作り方について書かれた本があったような記憶があるんだけど…どういうタイトルのどんななかみだったんだろう。思い出せなくてもやーっともやーっともやーっとしている。
このアカウントは、notestockで公開設定になっていません。
日航123便とTRONにまつわるヘンな陰謀論だのなんだのとかあの辺の話をうっかり見てしまうと、あーゆうのに絡まれた際に「一行でもコードを書く奴だけが正義、口だけの奴に使わせるオブジェクトは1byteも無ぇ!帰れ!!」と突っぱねるだけの力が欲しくなる。
でも日本語入力とか「日本」が絡むコードって、どうもヘンなのが湧いてきて引っかきまわしてプロジェクトが潰れるってのが相場というのもあるので、それなりの力(権力とか、技術力とか)を持った人に押し付けちゃうしかないのかなと思う部分もなくはない。
みんなでゆるっとお手伝い、それで成立するんなら遠慮なく飛び込めるんだけど…
とはいえ今抱えてる件がなかなか進まないのでそっちまで手が回らないのが実情なんだけど…問題を放ったままにしている、というのはどうにも落ち着かない。
日本語入力システムのメンテ、気にはなるけどどこに乗っかれば良いんだろうというのはいつも気になってる。マンパワーが分散するのもアレだし、立ち消えになっちゃうのもあるから…
PR投げる際にissue立てないとマズかったかなー(いきなりPRぶん投げちゃいました…タイトルも投稿後に書き換えるとかgdgdしてます、てへ♪)
https://github.com/joncampbell123/dosbox-x/pull/4632
SunSITEの血を引いてるってことは相当の老舗だし、信用できるところ(ここで見つからないようなら諦めるしかない)という理解で良いんだよね?
OSDNのミラー一覧 を見るに、Aalborg Universityのリンクからdotsrc.orgへ飛ぶようだ。かつてのsunsite.dkだったらしい。
https://osdn.net/docs/Mirrors
https://dotsrc.org/news/fundanemt_aalborg-university-donated-usenet-server/
jaistの場合、osdn.jp/じゃなくsourceforge.jp/じゃないか…? https://ftp.jaist.ac.jp/pub/sourceforge.jp/
mixfont-mplus-ipaだけはサルベージしとくか…IPAフォントの古いの、はもう入手不能だし(OpenBSDのdistfilesから拾う手もあるだろうけど)。 https://ja.osdn.net/projects/mix-mplus-ipa/
フリー版のsj3はNEWS版の物から一部の機能が削除されてると言われているけど、何が削除されていたんだっけ…? http://www.tk2.nmt.ne.jp/~artrec/ar-sj3.shtml
Sunもcs00なるかな漢字変換サーバがあるのか(でもソースとか出てこないんだろうな) https://docs.oracle.com/cd/E19455-01/806-2795/6jc051q62/index.html