2019年11月17日 - @omasanori@mstdn.maud.ioの投稿

00:00:37 Masanori Ogino 𓀁 @omasanori@mstdn.maud.io

3つ目の文字を入れるならおそらくデーヴァナーガリーかアラビア文字

00:14:54 Masanori Ogino 𓀁 @omasanori@mstdn.maud.io

Google Operating System: Tweak Google Chrome's Translation Feature http://googlesystem.blogspot.com/2010/03/tweak-google-chromes-translation.html

古のGoogle翻訳情報

http://googlesystem.blogspot.com/2010/03/tweak-google-chromes-translation.html

Tweak Google Chrome''s Translation Feature

00:17:38 Masanori Ogino 𓀁 @omasanori@mstdn.maud.io

2019-11-17 00:07:20 Keᷟiͣzᷤoͭuͦ@6ͩ4ͦ0ᷠ0の投稿 keizou@mstdn.guru

このアカウントは、notestockで公開設定になっていません。

00:21:17 Masanori Ogino 𓀁 @omasanori@mstdn.maud.io

別に独自に考案せずとも、既にリポジトリに登録されている内容だけでかなだけならja-Hrkt、漢字かな混じりならja-Jpan（これはわざわざやる必要はない）のようなタグ付けが考えられます。RFC 5646およびISO 15924を参照

00:28:07 Masanori Ogino 𓀁 @omasanori@mstdn.maud.io

ja-Jpanに関しては、アメリカ英語を指すためにen-USではなくen-US-Latnと書いても有益な情報は増えないのに表記揺れが起きるのと同じ話

00:32:30 Masanori Ogino 𓀁 @omasanori@mstdn.maud.io

この例のUSとLatnは逆ですね、ごめんなさい

00:36:18 Masanori Ogino 𓀁 @omasanori@mstdn.maud.io

IETF言語タグの各部分は基本的にISO 639の言語コード、ISO 15924の文字体系コード、ISO 3166-1の国コードなどを参照しているのでそれらを見ると色々面白い

00:39:09 Masanori Ogino 𓀁 @omasanori@mstdn.maud.io

ISO 3166-2:JP - Wikipedia https://ja.wikipedia.org/wiki/ISO_3166-2:JP

皆なんとなく知っている都道府県の番号（実はJIS規格で振られている）もちゃんと国際規格に反映されている

https://ja.wikipedia.org/wiki/ISO_3166-2:JP

ISO 3166-2:JP

00:47:54 Masanori Ogino 𓀁 @omasanori@mstdn.maud.io

@keizou en-Latn-US（私の先程の表記はIETF言語タグの正しい語順ではありませんでした、ごめんなさい）のような表記は "(...) the script subtag SHOULD be omitted when it adds no distinguishing value to the tag or (...)"（RFC 5646, Section 2.2.3, p.13）に該当すると考えています。

また、仮にこのSHOULDとそもそも文字体系のサブタグは必須でないという点を無視するとしても、これまでメタデータにつけられたjaやja-JPを捨てずに処理するならja-Japnやja-Japn-JP相当だということになります。

00:51:53 Masanori Ogino 𓀁 @omasanori@mstdn.maud.io

@keizou なので、ja-Hiraのようなタグは恐らく良いものですが、文字体系コードを必須にすることは必要な作業に見合わないと考えます

00:57:54 Masanori Ogino 𓀁 @omasanori@mstdn.maud.io

@keizou IANAのLanguage Subtag Registryを確認したらjaに対して "Suppress-Script: Jpan" が指定されているので、先程省略した "the script subtag SHOULD be omitted (...) when the primary or extended language subtag's record in the subtag registry includes a 'Suppress-Script' field listing the applicable script subtag." に該当する明示的な非推奨パターンでした。無視に関する私の意見は先程と同じです

01:02:11 Masanori Ogino 𓀁 @omasanori@mstdn.maud.io

@keizou まぁ、メタデータをどう書くかという土台は既にあるので、コンテンツを作る人々に周知され、ツールや環境が整備されるかどうか次第だと思います

01:06:31 Masanori Ogino 𓀁 @omasanori@mstdn.maud.io

@keizou 別にエンコーディングは変わらないのでそこは心配ないと思います

01:06:45 Masanori Ogino 𓀁 @omasanori@mstdn.maud.io

2019-11-17 00:16:40 kb10uyの投稿 kb10uy@mstdn.maud.io

遺言書、書くとしたらとりあえず「固定長に夢を抱くな金輪際」って書くことは決定している

01:06:46 Masanori Ogino 𓀁 @omasanori@mstdn.maud.io

2019-11-17 00:17:39 kb10uyの投稿 kb10uy@mstdn.maud.io

UTF-16 のような存在を生み出してはならない……

01:08:23 Masanori Ogino 𓀁 @omasanori@mstdn.maud.io

UTF-16以前からUnicodeには合成文字の概念があったので、単に16ビット固定長で「1文字」と考えていた人々が仕様を把握していなかった説がある

01:13:15 Masanori Ogino 𓀁 @omasanori@mstdn.maud.io

2019-11-17 00:18:36 らりお・ザ・何らかの🈗然㊌ソムリエの投稿 lo48576@mastodon.cardina1.red

Unicode 、実のところ U+10FFFF までしか使われないのでコードポイントとしては 21 bit で済むし、 UTF-32 は無駄すぎる

01:13:17 Masanori Ogino 𓀁 @omasanori@mstdn.maud.io

2019-11-17 00:19:25 らりお・ザ・何らかの🈗然㊌ソムリエの投稿 lo48576@mastodon.cardina1.red

unicode - Why is there no UTF-24? - Stack Overflow
https://stackoverflow.com/a/10143909

ﾊｲ

https://stackoverflow.com/a/10143909 https://stackoverflow.com/questions/10143836/why-is-there-no-utf-24/10143909#10143909

Why is there no UTF-24?

01:13:19 Masanori Ogino 𓀁 @omasanori@mstdn.maud.io

2019-11-17 00:20:23 kb10uyの投稿 kb10uy@mstdn.maud.io

内部保持形式としては 4byte だとアライメントで問題が発生しないとかでマシそうって言おうとしたらやっぱりそう

01:13:20 Masanori Ogino 𓀁 @omasanori@mstdn.maud.io

2019-11-17 00:20:25 kb10uyの投稿 kb10uy@mstdn.maud.io

か

01:22:04 Masanori Ogino 𓀁 @omasanori@mstdn.maud.io

漢字統合して、予備の漢字用領域も用意しとけばよくね？←……よくなかったね……
2バイトで1文字だ！←結合文字はUnicode 1.0にもあるのでそんなことは割と最初からなかった

01:29:09 Masanori Ogino 𓀁 @omasanori@mstdn.maud.io

Ideographic Rapporteur Group - Wikipedia https://ja.wikipedia.org/wiki/Ideographic_Rapporteur_Group

CJK統合漢字は非漢字圏ではなく（各国内規格を別々に符号化すると自国分が不足すると危惧した）中国が推してたという話はWikipediaの複数ページに書かれているんだけれども、誰でも参照できるところに議事録とか残ってないんだろうか（それが参考文献にないので真偽が謎）

https://ja.wikipedia.org/wiki/Ideographic_Rapporteur_Group

Ideographic Rapporteur Group

01:41:40 Masanori Ogino 𓀁 @omasanori@mstdn.maud.io

2019-11-16 23:44:01 rootYの投稿 rooty2@mstdn.maud.io

このアカウントは、notestockで公開設定になっていません。

01:51:17 Masanori Ogino 𓀁 @omasanori@mstdn.maud.io

2019-11-17 01:47:59 Now at cwebber@social.coop !の投稿 cwebber@octodon.social

このアカウントは、notestockで公開設定になっていません。

15:52:59 Masanori Ogino 𓀁 @omasanori@mstdn.maud.io

2019-11-17 15:52:16 するすすの投稿 su_rususu@mstdn.maud.io

このアカウントは、notestockで公開設定になっていません。

15:53:23 Masanori Ogino 𓀁 @omasanori@mstdn.maud.io

2019-11-17 11:43:31 mzpの投稿 mzp@mstdn.nere9.help

要はアイマス曲(要出典)のみを抜きだすクエリがほしいという話

15:53:25 Masanori Ogino 𓀁 @omasanori@mstdn.maud.io

2019-11-17 11:45:28 rinsukiの投稿 rinsuki@mstdn.rinsuki.net

@mzp 単に「なんたらかんたら - Single」な曲もあるので、スマートプレイリストを作ってそれを条件にクエリをかけるのが一番便利

15:53:28 Masanori Ogino 𓀁 @omasanori@mstdn.maud.io

2019-11-17 11:48:13 rinsukiの投稿 rinsuki@mstdn.rinsuki.net

@mzp 基本的には
- アルバムに「THE IDOLM@STER」が入ってるか
- タイトルに「M@STER VERSION」が入ってるか

で判定して、漏れたのはアーティスト欄をアイドル名で検索…

15:53:31 Masanori Ogino 𓀁 @omasanori@mstdn.maud.io

2019-11-17 11:48:57 mzpの投稿 mzp@mstdn.nere9.help

@rinsuki https://mstdn.nere9.help/@mzp/103150972262249296

https://mstdn.nere9.help/@mzp/103150972262249296

mzp (@mzp@mstdn.nere9.help)

15:53:34 Masanori Ogino 𓀁 @omasanori@mstdn.maud.io

2019-11-17 11:49:31 rinsukiの投稿 rinsuki@mstdn.rinsuki.net

@mzp でもそれだとたまに入らないやつがあるんですよ

15:53:37 Masanori Ogino 𓀁 @omasanori@mstdn.maud.io

2019-11-17 11:50:41 rinsukiの投稿 rinsuki@mstdn.rinsuki.net

@mzp これとか、アーティスト欄にしかアイマス判定able要素がない https://music.apple.com/jp/album/beyond-the-dream-ep/1196631527

https://music.apple.com/jp/album/beyond-the-dream-ep/1196631527

Various Artistsの「Beyond The Dream - EP」をiTunesで

15:56:09 Masanori Ogino 𓀁 @omasanori@mstdn.maud.io

2019-11-17 15:28:13 mzpの投稿 mzp@mstdn.nere9.help

repeat with aTrack in (every file track of playlist 1 whose album contains "CINDERELLA" or album artist contains "CINDERELLA" or artist contains "CINDERELLA")

15:56:11 Masanori Ogino 𓀁 @omasanori@mstdn.maud.io