22:43:23 @uaa@social.mikutter.hachune.net
icon

オクトラⅡ、画質最高で時々ハングする問題が解決したかどうか試さないといかんのかな…

22:42:33 @uaa@social.mikutter.hachune.net
icon

Arcのドライバ、8/23リリースの31.0.101.4669に更新したけどdistribued.net clientの(cl-std=1.1非対応)問題は解決してないっすね。バイナリパッチをdnetc.exeに当てろってことで良いんですかね…

22:40:32 @uaa@social.mikutter.hachune.net
icon

とりあえず自分のコーディングスタイルを見直すきっかけにはなった。一応style(9)準拠にしてるのでそれを継続ってことで。

22:39:32 @uaa@social.mikutter.hachune.net
icon

;でインデント、面白いアイデアだとは思うけど…

for (i = 0; i < 200; i++)
do_something();

みたいなケースへの対応は難しいんじゃないかなあ。

まあコーディングスタイルを新しく作ってるようなもんだから、たとえfor()だのifだのに続く処理が一行しか無くても必ず{}で括れというスタイルを強制した上で;でインデントしろよなー、ということなんだろうけど。

22:36:53 @uaa@social.mikutter.hachune.net
2023-08-31 22:10:47 くりむ 失われた週末の投稿 klim0824@mstdn.nere9.help
icon

乗るしかない、このビッグウェーブに

[Xユーザーのふもさん: 「え、まだタブやスペースでインデントしてるの?時代遅れじゃない? 今どきはセミコロンだよ。 t.co/YMEFTwyXI2」 / X]( twitter.com/fumokmm/status/169 )

21:55:40 @uaa@social.mikutter.hachune.net
icon

tiger lake(11th Gen)以降のCeleron/PentiumはAVX2対応持ってるので、一生懸命SSE対応したところで意味無いんだよね実は。

21:46:11 @uaa@social.mikutter.hachune.net
icon

LPCNet、本家はxiphのなんだけど…FreeDV2020向けのdrowe67版をここしばらく触っていて、本家からかなり乖離しちゃってるから少しメンテしないといけないのかもね(SSE周りとか)というのがあらすじ。

21:44:46 @uaa@social.mikutter.hachune.net
icon

8x4(sparse_sgemv_accum8x4)対応は取り込めないかなーと思ってみてみたけど、これはかなり影響範囲が大きそうなのでやめた方が良いのかも github.com/xiph/LPCNet/commit/

なので、結局は
- vec_sse.hは廃止
- vec_avx.hをそこそこ新しくする
- SSEの時もvec_avx.hを使うようにお願いする
という対応が今できる最善ってことになるか。vec.hの挿げ替えもちょっと危ないかな。

21:24:14 @uaa@social.mikutter.hachune.net
icon

パンを食った枚数をいちいち覚えちゃいないのと同様、投げたPRなんていちいち覚えちゃいないよ。

21:23:35 @uaa@social.mikutter.hachune.net
icon

…ってこんなこと書いてると「ロクにテストもせず何やってんの」と言われそうだなあ。あん時何やってたんだっけ自分というのを振り返ってるだけなんだが…

21:22:14 @uaa@social.mikutter.hachune.net
icon

あと、これも検証。defined(__AVX__)であればvec_avx.hを通すことでAVX化は可能、defined(__SSE__)が無い場合はvec_avx.hも通さないしSSE化もしない(それ以前にビルドエラーで止まる)。

なので、defined(__SSE__)でなんかする、でSSE対応してたという過去の話についてもまあ(やってることが怪しいとはいえ)多少の意味はあったということか。

20:59:11 @uaa@social.mikutter.hachune.net
icon

一応供養のために動作テストをしてみたけども…

- vec_sse.hの結果はベクタ命令使わない場合と同じ(vec_avx.hの結果は少し異なる)
- 当然だけどvec_avx.h使えばSSE/AVX同じ結果になる
- vec_sse.hだと16.6sec, vec_avx.hでSSE化すると8.8sec(AVXと遜色ない結果になる)

やっぱ廃止で正解かな?出力結果は間違いじゃなかったみたいだけど。

20:28:05 @uaa@social.mikutter.hachune.net
icon

自分で言うのもなんだけど、vec_sse.hなんてクソ(を放り込んだのは自分)を放り込む前に、何故vec_avx.hがSSE対応してるかを見抜けなかったのかと当時の自分に説教したい…という訳で、きちんと尻を拭おうと思います。ごめんなさい。 github.com/drowe67/LPCNet/pull

Web site image
deprectate vec_sse.h by jg1uaa · Pull Request #60 · drowe67/LPCNet
07:20:35 @uaa@social.mikutter.hachune.net
icon

ほぅ…

07:20:24 @uaa@social.mikutter.hachune.net
2023-08-31 01:53:05 #weepjp :kao_oyoyo:の投稿 weepjp@fedibird.com
icon

このアカウントは、notestockで公開設定になっていません。