Re: Webでのルビの標準化についてのコメント(依頼)

まあ相当なレアケースとは思いますが、この間ひとつの漢字列に対して異なる2つの読みを両側ルビで併記してあるケースにも遭遇しました。通常の側のルビを読み上げ文字列として適用する、で処理としてはいいのでしょうが、相当めんどくさい話ではあります。

> 2020/06/15 9:39、木田泰夫 <kida@mac.com>のメール:
> 
> 「外部から辞書を受け取ることのできる形態素解析器」があれば、いろいろ解決しそうですね。まず全体をスキャンして(それが読みであろう)ルビ付きの単語を辞書にして、形態素解析器に渡したのちに、通常の読み上げを開始する。
> 
> ただ、単語の一部のみに読みがついている場合、その一部だけを単語として登録すると形態素解析が破綻する、という問題がありますね。また、そもそも各々のルビが読みなのかどうかを知る確実な方法がありません。この二点とも、「レイアウトとしてのルビ」だけではなく「セマンティックなルビ」の仕組みの必要性を強く示唆します。
> 
> 木田
> 
>> 2020/06/15 9:12、田嶋 淳 <tajima@sanyosha.co.jp>のメール:
>> 
>> みなさま
>> 
>> 議論を拝見してちょっと思ったことを書いておきます。
>> 
>> 例えば、「源頼朝」に「みなもとのよりとも」とルビが振ってあったとして、本文の漢字を読むとするとおそらく「の」が読まれずに終わります。「源」にも「頼朝」にも付かない繋ぎの文字だからです。なのでそういうケースではルビを読むとするべきなのでしょう。
>> ただ、多くの本では人名なども総ルビにはなっておらず、例えばその章の最初に出てくる場合のみ、あるいはページ内の最初の箇所のみルビを振るというような形になっているケースがよく見られます。この場合人間が読み上げるならルビ付きの最初の箇所と同様の読み方をその後に出てくる漢字のみの同一人名にも適用することが期待できますが、さて機械的な読み上げでそれができるのかと言うとだいぶ疑問はあります。総ルビはどうしてもくどくなりますし、作業の手間が倍増するので初学者向けのもの以外では避けたいところなのでしょうが・・・
>> 
>>> 2020/06/12 18:17、MURATA Makoto <eb2m-mrt@asahi-net.or.jp <mailto:eb2m-mrt@asahi-net.or.jp>>のメール:
>>> 
>>> デジタル教科書に関わっている富士ソフトの山崎さんからの
>>> コメントの一部を転送します。
>>> 
>>> 村田 真
>>> 
>>> ---------- Forwarded message ---------
>>> 
>>> ・何を読み、何は読まないのか(タグの選別)
>>> ・どのように読むのか
>>> → 熟語ルビ、グループルビは、読み上げ対象とされないのか否か
>>> → 熟語ルビがあれば読み上げとしてこれを優先,グループルビについては、読み上げないか、もしくは「ルビ」等と前置きした上で読み上げる副音声的対応 等
>>> ・モノルビが個々の漢字等にふられるケースについて、そのルビは誤読を避ける必要性から読み上げとして優先されるべきであると考えられるが、そのまま単漢字ごとの読みをつなげるのではイントネーションがおかしくなるケースがある
>>> 
>>> 
>> 
>> ***************************************
>> (株)三陽社
>>  メディア開発室
>>  http://www.sanyosha.co.jp/ <http://www.sanyosha.co.jp/>
>>  
>>  田嶋 淳
>>  tajima@sanyosha.co.jp <mailto:tajima@sanyosha.co.jp>
>>  
>>  ※ブログ運営中です。
>>   ご意見をいただければ幸いです。
>>   http://densyodamasii.com/ <http://densyodamasii.com/>
>> ***************************************
>> 

***************************************
(株)三陽社
 メディア開発室
 http://www.sanyosha.co.jp/

 
 田嶋 淳
 tajima@sanyosha.co.jp
 
 ※ブログ運営中です。
  ご意見をいただければ幸いです。
  http://densyodamasii.com/

***************************************

Received on Monday, 15 June 2020 01:28:48 UTC