Re: ルビ財団！ from Taku Yamaguchi on 2024-03-05 (public-i18n-japanese@w3.org from January to March 2024)

From: Taku Yamaguchi <study.yamahige@gmail.com>
Date: Tue, 5 Mar 2024 15:23:16 +0900
To: JLReq TF 日本語 <public-i18n-japanese@w3.org>
Message-ID: <CAKxaSHXjibfi0CWTpRG3uzBUGf5YzQ=WMOUKUkqHJGW=cFpJKA@mail.gmail.com>
みなさま、
山口です。

漢字と読みは積極的に対応付けて欲しいです。漢字←→読みの双方向です。「任意の漢字←→勝手な読み」はできなくても、地名、駅名、大河ドラマの役名などは既にデータ化されてるはずで、後はユーザーインタフェースの問題だと思うのです。

函館から大津へ車で引っ越してるとき、Googleのカーナビに「2Km先、まいはらジャンクションを京都方面です」と言われて焦りました。
「まいはら」Jct.ってどこ?「舞原」か？「米原」Jct.のことか？Googleバカだな…と思ったのですが、Googleが正しくて、JctやICは「まいはら」、自治体や新幹線の駅名は「まいばら」なのでした…

NHKの今年の大河ドラマ「光る君へ」の字幕は、人名の読みがルビ！でふってあります。データ持ってるじゃないですか、だったら、オープニングのクレジットなどにもルビをつけられるはず。


2024年3月5日(火) 13:09 Taro Yamamoto <tyamamot@adobe.com>:

>
>
> 最近のいわゆる「AI」システムは、たしかに漢字と読みとが（一対一にせよ一対多にせよ）ある程度確立されて定着しているものについては、すごく難しいものでもおおかたは正解を出すように思えました。例えば、漱石の『虞美人草』から「洵にご親切に」を「まことにごしんせつに」と正しく変えてくれます。「微茫に」も「かすかに」と正しく変換されます。ただ当て字や文脈に依存した読みの選定では失敗することがあるようです。例えば、「抽出は空に」という語句は、前後の文章をどれだけ付け足して入力するかによって、「抽出」を「ひきだし」と正しく変換する場合もあれば、失敗する場合もあり、「空に」を「からに」と正しく変換する場合も「そらに」としてしまう場合もありました。これは必ずしも前後に長い文を付け足したら精度が高くなるようにも見受けられませんでした。
>
> とはいえルビの自動化は実用になるのではと感じます（主観的にですが）。
>
>
> ただ、タイポグラフィックにはルビには難点も多いので、やはり対象読者、内容や用途などに応じて、ルビを振るのか振らないのか、ルビ以外の方法を使うか使わないのか、適宜判断して決める必要があると思います。
>
>
> また書籍の場合には、当て字などにルビを振る場合に、どうしてその当て字を訂正せずに採用したのか、当て字の読みに複数の可能性がある場合に、それをどのように決定したのか、などについて注釈が必要になる場合もあるでしょう。用途によってルビの自動化が優れて有効な場合もあります。ルビを手作業で振る場合でも自動化ツールはその生産性を確実に高めるはずです。しかし、読みを確定するという判断が必要となる以上、それをただ自動化だけに頼ることのできない領域も残るでしょう。そして、ルビ以外の方法を採用するのが好ましい場合もあるはずです。
>
> 私見まで。
>
> 山本太郎
>
> ------------------------------
> *差出人:* MURATA Makoto <eb2m-mrt@asahi-net.or.jp>
> *送信日時:* 2024年3月5日 11:06
> *宛先:* tajima@sanyosha.co.jp <tajima@sanyosha.co.jp>
> *CC:* JLReq TF 日本語 <public-i18n-japanese@w3.org>
> *件名:* Re: ルビ財団！
>
>
> *EXTERNAL: Use caution when clicking on links or opening attachments.*
>
>
>
>
> 2024年3月5日(火) 午前10:48 tajima@sanyosha.co.jp <tajima@sanyosha.co.jp>:
>
> 村田さま
>
>
> 書籍の制作的な感覚だと「総ルビにするという判断がされるような文書」イコール「100％に近い正しさが求められるもの」なので、どんなテクノロジーを使うにせよその後の目視確認は必要になるかと思います。日本語には人名や地名の特殊読みもありますし、
>
>
>
> 地名の特殊読みが99.9999％対応可能になる日は近いでしょうね。人名はどちらの読みもあり得るが、その人ごとに正しいものが決まっている場合(例えばサトコとトモコ)を除くと99.99%ぐらいには行くでしょう。
>
> 全部自動で処理したものをそのまま出していいとは思えません。学習コンテンツなら学年別にどの文字までルビを振るかという判断もあるでしょう。
>
>
> これはむしろコンピュータに得意なことで、既に実装しているDAISYリーダーがあります。
>
> もちろんSNS等での書き込みを外国の人にもわかりやすくしようよ、的な使われ方ならその限りではないですが。
>
>
>
> 自動読み上げも自動分かち書きも自動ルビ振りも100%にならないからと言って拒否するのは合理的配慮ではないと思います。人口の10％近くは普通の紙の文書は読めないのですから、今の社会で何もしないとそういう人はみんな生活保護になってしまいます。
>
> 村田真
>
>
>
> 2024/03/05 10:36、MURATA Makoto <eb2m-mrt@asahi-net.or.jp>のメール:
>
>
>
>
> これ、「ルビが振られていて必要に応じて表示を切り替えられるといいよね」というのはわかるのですが、実際にルビ付きの文書を作成するには自動で下処理するとしても（InDesign用にはかなり前から自動ルビ振りプラグインはあります）相当な確認と修正の手間がかかりますし、そのコストを考えればあまり一般化するような話とは思えません。「初学者向けのWebコンテンツはこういう形で作ろう」ぐらいがせいぜいじゃないでしょうか。
>
>
>
>
> ChatGpt-4にやらせると相当変わつたものでも正しくルビを振ります。「生」という字のほとんど全ての読みについて正しくルビを振ることを確認しました。ここ一年ぐらいで事態は劇的に変わったので以前の技術をもとに判断してはいけないと思います。もちろん100%にはなりませんが、それは人がやっても同じことです。
>
>
> 村田真
>
>
>
>
>
>
> 2024/03/05 9:48、木田泰夫 <kida@mac.com>のメール:
>
>
> サイトのトップにあるメッセージの下の文には首を縦にブンブン振って同意します。英語の方を読んで理解せざるを得ないのです。
>
> 「例えば最近でも、美術館に行って日本の室町時代や江戸時代の作品を見る時、 横に貼ってある説明文の多くの部分が、伝統的な工法だったり、材料だったり、
> 或いは作品の名前自体が、漢字で書かれていて、私でさえ音読することが出来ず、 そうすると全く頭に入らなくて、理解することも覚えることも出来ません。
> 英語の説明も付いていることが増えたので、そちらを見て、読み方を知る始末です。」
>
> 木田
>
> 2024/03/04 17:28、木田泰夫 <kida@mac.com>のメール:
>
> 
> なるなる。山口さんが教えてくださったものと同じセミナーですね。申し込みます。
>
> 木田
>
> 2024/03/04 17:26、小林龍生 <tlk@kobysh.com>のメール:
>
> 
> 木田さま、
> 小林龍生です。
>
> メンゴ。
> https://www.kokuchpro.com/event/JEPA20240319/

>
> 2024年3月4日(月) 14:18 木田泰夫 <kida@mac.com>:
>
> 小林さん、
>
> 下のリンクをクリックしても意味のあるものが表示されません。もしかして、小林さんのメールボックスのメールを指しているのでは。
>
> 木田
>
> 2024/03/04 10:31、小林龍生 <tlk@kobysh.com>のメール:
>
> https://mail.google.com/mail/u/0/#inbox/FMfcgzGxRxGrmJcLtLdFjWfJBjQlGfDq

>
> 2024年3月4日(月) 10:24 Taro Yamamoto <tyamamot@adobe.com>:
>
>
> あくまで個人的なコメントですが、
> ルビを振るというのは、文書を読みやすくする一つの方法です。
> ですから、その方法が適した文書は多くあるはずで、その方法を選択することは良いことです。
>
>
> 他方で、文書を読みやすくする方法はルビだけではありません。漢字の読みを追記する方法もルビだけに限りません。特に電子的な文書の場合には、新しい方法もあるはずです。（文書が表示される環境や読者の選択に依存してルビをOn/Off可能にもできる可能性もあるでしょう。）
>
>
> ですので、漢字の読みを追記する場合に、文書の内容や用途、対象読者に応じて、どのような方法が最適かを決める必要があるでしょう。ルビを採用する場合でも、伝統的なルビの組み方にするのか、しないのかを含めて、目的に合った方法を決めるのが良いと思います。
>
>
> 電子的にダイナミックに文書が生成される場合には、ルビのOn/Offだけでなく、ルビを含む読みの補助の方法を選択可能にしたり、目の不自由な人が、その人の個別の視覚障碍の種別に最適な読みの補助・表示方法を選択できるようにすることも可能だと思います。
>
> 私見まで。
>
> 山本太郎
>
> ------------------------------
> *差出人:* MURATA Makoto <eb2m-mrt@asahi-net.or.jp>
> *送信日時:* 2024年3月4日 06:37
> *宛先:* Nat McCully <nmccully@adobe.com>
> *CC:* JLReq TF 日本語 <public-i18n-japanese@w3.org>; 木田泰夫 <kida@mac.com>
> *件名:* Re: ルビ財団！
>
>
> *EXTERNAL: Use caution when clicking on links or opening attachments.*
>
>
>
>
> 2024年3月3日(日) 22:57 Nat McCully <nmccully@adobe.com>:
>
>
> 個人的な意見ですけど、そのサイトのグループルビの振り方は世の中のタイポグラフィに損を受けさせていると思います。サンプルはシンプルですけど、ルビの価値は半分落とされてしまっています（どの字がどの読みなのか、あて字なのか、など）
>
>
>
> 伝統的なルビのレイアウトから外れているのは事実です。しかし、ルビの悪いところに対処しようとしているようですので、一概に否定できるものではないと思います。
>
>    1. ルビに色が付いている（ディスレクシア対策）
>    2. ルビの文字幅は親文字の1/2以上になっている（弱視者対策）
>    3. 前後の文字にかかることは認めていないので字間が空く （2 からの帰結）
>    4. ルビのほとんどは自動的に振られている（作成者への負担軽減）
>    5.
>    グループルビの前後にモノルビを使うことが多い（非+営利、可能+性など)。これは4からの帰結だが、接頭語・接尾語の処理を工夫すれば修正可能だろう。
>
> 村田真
>
>
>
>
> —Nat
> ------------------------------
> *From:* MURATA Makoto <eb2m-mrt@asahi-net.or.jp>
> *Sent:* Saturday, March 2, 2024 10:37:21 PM
> *To:* 木田泰夫 <kida@mac.com>
> *Cc:* JLReq TF 日本語 <public-i18n-japanese@w3.org>
> *Subject:* Re: ルビ財団！
>
>
> *EXTERNAL: Use caution when clicking on links or opening attachments.*
>
>
>
> 面白いですね。漢字が読めない場合にはルビがあるほうが良いに決まっているので、必要ならいつでも総ルビで表示できるのが良いと私も思っています。日本DAISYコンソーシアムとしてもコンタクトしてみようかと思います。
>
> 村田 真
>
>
> 2024年3月3日(日) 14:36 木田泰夫 <kida@mac.com>:
>
> こんな財団があるようで
> <Outlook-FacebookOG.png> <https://rubizaidan.jp/>
> TOP - 一般財団法人 ルビ財団 <https://rubizaidan.jp/>
> rubizaidan.jp
>
>
>
>
> --
> Regards,
> Makoto
>
>
>
> --
> Regards,
> Makoto
>
>
>
>
>
Received on Tuesday, 5 March 2024 06:23:47 UTC