Re: Webでのルビの標準化についてのコメント(依頼)

みなさん、

この話題についてはいろんなところで意見をきいてきました。
私の中ではほぼ整理が出来ているのですが、一度ちゃんとまとめ
ておくべきですね。

このメールで、私の知ること(というか聞きかじったこと)を
一通り書いておきます。公的な資料として以下のものを
参照してしおきます。

https://www.soumu.go.jp/main_content/000354698.pdf


まず、音声による読み上げは国産EPUBリーダでは数年前は
皆無でした。すこし改善はされたようですが、まだまだという
状態です。国際的なEPUBリーダ、Webブラウザでは当然
のように読み上げてくれます。諸外国の視覚障害者が
運動をして勝ち取った成果のおこぼれに、日本がありついて
いるというところです。

読み上げのときに用いる日本語辞書は、まだまだの
ように見えます。以前調べたときはJIS X 0208の
範囲がやっとでX 0213にしかない漢字は壊滅です。

そもそも平仮名・片仮名は発音を正確に写すものでは
ありません。国際音声字母(International
Phonetic Alphabet' 略してIPAという)」では、
国際的な表記ができます。これを、日本で必要な
範囲に絞りこみ、仮名で書けるところは仮名で書くのが、
JEITA の「日本語テキスト音声合成用記号」
です。これを用いて、EPUB文書中に属性で
書くのがSSMLです。以下に例を示します
([1]から引用)。

<p>
<span ssml:ph="チューゴクギョセンガ/オガサワラ/キンカイニ/シュ>ツボツ>シ>ハジメタノハ/
コンシュンカラデス>. ">中国漁船が小笠原近海に出没し始めたのは今春からです。</span>
<span ssml:ph="クガツ/カラ/キューゾーシ|…">9 月から急増し、・・・</span>
</p>
ただし、SSMLをちゃんと振るのは大変な労力がかかります。
東京書籍は徹底的に工夫してやっていますが、
SSMLを振るための工数は素のEPUBを作るときの倍以上
だそうです。 アクセントとかをきちんとやり始めると大変になり
ます。

ルビを読み上げに使うというのは、SSMLを振る余裕はないし、
読み上げエンジンの出来も不十分という状況から出てきます。
しかし、ルビを読み上げに使って親文字を無視すると、
とうぜん形態素解析がよく失敗し、不自然な読み上げになります。
ルビを読み上げに使うべきではないと強く主張する人を何人か
知っています。

なお、智子を最初のページだけ「さとこ」とルビがあり、
それを読み上げのときに使ったとします。二回目
以降ではルビはないので、「ともこ」と読むかも知れません。
そうすると別の人だと思い込んでしまいます。

ところで、読み上げのときの誤読が本当に問題か?大した
問題ではないという意見をもつ人は多いんです。理由は
こうです。多少は間違っていても推測できる、そんなことより
読み上げが出来ないEPUBリーダとか、
ナビゲーションの貧弱さ(例えば前の段落に
戻ることすら出来ない)のほうがはるかに問題だ
というわけです。

ちょっと余談ですが、日本のEPUB書籍では、最後のcontent
documentが、目次文書では最後じゃなくて先頭に現れる
なんてことがあります。これは読み上げには壊滅的な悪影響
をもたらします。誤読なんかよりはるかに重要なんです。しかし、
日本の出版社がどうしたら対処してくれるのか途方に
くれています。

なお、日本のデイジー教科書では音声が録音されています。
学習中の生徒にとっては、まったく自然な音声を提供したい
という意図でしょう。しかし、声についての好みがあるので、
音声合成のほうが便利という話もあります。

いろいろ書きましたが、 視覚障害者にとって、ルビを利用
した読み上げの改善より大事なことはいっぱいあります。
そして使うと悪くなるということもあります。ルビは読み上げには
使わないと割り切るのがいちばん簡単で、読み上げエンジン
の発展を阻害しないと思います。

村田 真



<https://www.avast.com/sig-email?utm_medium=email&utm_source=link&utm_campaign=sig-email&utm_content=webmail>
ウイルス
フリー。 www.avast.com
<https://www.avast.com/sig-email?utm_medium=email&utm_source=link&utm_campaign=sig-email&utm_content=webmail>
<#m_-6708872132552994532_DAB4FAD8-2DD7-40BB-A1B8-4E2AA1F9FDF2>

2020年6月13日(土) 12:56 木田泰夫 <kida@mac.com>:

> 読み上げの際の悩みはルビに関して大きいようですね。
> A.漢字列に読みが降ってあって、だからその読みで読んで欲しい
> B. アノテーションなのだから、読むのは本文
>
> 漢字列に人間が見て通常の読みが振ってあれば A、平仮名以外が含まれれば B
> と判定できますが、平仮名なのにどう見てもその漢字の読みではない例ってありますよね。「あの男(ひと)」みたいな。これ、どっちを読むべきなのか私知りません。この場合は思わず「ひと」と呼んでいるのかな。しかしこの場合は「ひと」とだけ読んでしまうと、「男」と言う重要な情報が抜けてしまいます。
>
>
> ルビは仕組み的に考えると、本来一続きの文字列である書き言葉に、複数の列を持ち込む技ですから、成り立ちからして読み上げとは相性が悪そう。それでも一次元にしなければならない読み上げ。
>
> あ、お話の朗読会とかありますよね。図書館の司書さんの仕事なのかなあ? その人たちはどうしておられる?
>
> もういっそのこと、明らかに A とは言えない、B の可能性のある場合には「ルビ、なになに、ルビ終わり」と一律に一次元化するとか?
>
> 木田
>
> > 2020/06/13 9:49、Kobayashi Toshi <binn@k.email.ne.jp>のメール:
> >
> > MURATA Makoto 様
> > みなさま
> >
> > 小林敏です
> >
> > コメント,ありがとうございます.
> >
> > 私は,もっぱら読むということ,その観点からの配置を問題として
> > してきたのですが,ご指摘のとおり,音声に変換する際にも,ルビ
> > の種類が影響するということですね.
> >
> > 配置という点でいうと,モノルビと熟語ルビというのは,語のまと
> > まりを意識するか,それとも漢字1字だけということか,というこ
> > とから別にしたかったのですが,音声にする際にも,それが影響す
> > るというのですね.
> >
> > グループルビは,漢字の読みといういう点からは違う意味を持つ例
> > が多いのですが,熟字訓(例:煙草のルビ“たばこ”,五月雨のル
> > ビ“さみだれ”)のように,漢字の読みを示すという例もあり,簡単
> > ではないかように思います.
> >
> > MURATA Makoto さん wrote
> >
> >> デジタル教科書に関わっている富士ソフトの山崎さんからの
> >> コメントの一部を転送します。
> >>
> >> 村田 真
> >>
> >> ---------- Forwarded message ---------
> >>
> >> ・何を読み、何は読まないのか(タグの選別)
> >> ・どのように読むのか
> >> → 熟語ルビ、グループルビは、読み上げ対象とされないのか否か
> >> → 熟語ルビがあれば読み上げとしてこれを優先,グループルビについては、読み上げないか、もしくは「ルビ」等と前置きした上で読み上げる副音声的対応
> 等
> >> ・モノルビが個々の漢字等にふられるケースについて、その
> >>  ルビは誤読を避ける必要性から読み上げとして優先される
> >>  べきであると考えられるが、そのまま単漢字ごとの読みを
> >>  つなげるのではイントネーションがおかしくなるケースが
> >>  ある
> >
> >
>


-- 
Regards,
Makoto

<https://www.avast.com/sig-email?utm_medium=email&utm_source=link&utm_campaign=sig-email&utm_content=webmail>
ウイルス
フリー。 www.avast.com
<https://www.avast.com/sig-email?utm_medium=email&utm_source=link&utm_campaign=sig-email&utm_content=webmail>
<#DAB4FAD8-2DD7-40BB-A1B8-4E2AA1F9FDF2>

Received on Saturday, 13 June 2020 05:24:31 UTC