- From: MURATA Makoto <eb2m-mrt@asahi-net.or.jp>
- Date: Tue, 9 Apr 2024 23:22:31 +0900
- To: 木田泰夫 <kida@mac.com>
- Cc: tajima@sanyosha.co.jp, JLReq TF 日本語 <public-i18n-japanese@w3.org>
- Message-ID: <CALvn5EBhqQsSO_ZgjJQOhXoiw9acyrMijEv_coZzQABUCm+b1w@mail.gmail.com>
いまならLLMに任せてねじ伏せるのが一番ではと思います。そうとう飛んでもないものでも正しく読みますよ。 村田 真 2024年4月9日(火) 22:41 木田泰夫 <kida@mac.com>: > > 従来の手法だとこの手のものは辞書に入れておきます。ただ、一般的な漢文訓読を目標とせず、日本語の中に出てくる単語やフレーズに絞っても、全てを網羅するのは無理でしょうね。 > > とすると、AIなどの手法で > 一般的な漢文訓読を実現してしまうのが早いのかもしれません。漢文は今でこそ(私の生活では)ほとんどお目にかかりませんが、日本語にとって重要な歴史の一つですから、無視するわけにも行かず。 > > > 英語の中にたまに出てくるラテン語をちゃんと読んで、と言うようなもんなんでしょうけれど、ラテン語はスペル通りに読めば大体良いからなあ。日本語って難しい😢…… > > 木田 > > 2024/04/09 16:16、tajima@sanyosha.co.jpのメール: > > みなさま > > > 普通には読めない漢字の読みの例として、明治期以前の文書などで出てくる和文に混じった漢文(漢文訓読体)の戻り読みがあるかなと思っています。わかりやすいところだと地名の「不忍池」の「しのばず」のようなものです(参考: > http://negadaikon.jp/learningguide/howtoread/ > )。これはルビをつけるにしてもグループルビにならざるを得ないはずです。読み上げにはAI等で事前にインデックスを作っておく必要はありそうです。 > > 2024/04/09 14:52、MURATA Makoto <eb2m-mrt@asahi-net.or.jp>のメール: > > > > 2024年4月9日(火) 10:03 木田泰夫 <kida@mac.com>: > >> なるほど、詳細読み、思い出しました。ありがとうございます。 >> >> >> 詳細読みまで行かなくても、例えば「私立」は会話に出てきたら「わたくしりつ」と言うことが多いかと思いますし、また「七月」を言うときに「一月」との混同を避けるために必ずしも正しくはない「なながつ」を使うことがあるなど、会話での工夫ってありますよね。そういう、普通の人の日常にも役にたつ賢い読み上げ。昨今のAI技術を使えば十分可能そうですね。 >> >> > > これは面白いですね。いま、詳細読みは、意味が取れないときの最後の手段として用いられています。一文字ずつ確認していくので、とても時間がかかるので、最後の手段なわけです。最初から、賢い読み上げをすれば時間が大幅に省けるはずですね。 > > 村田 真 > > >> 木田 >> >> 2024/04/09 9:52、MURATA Makoto <eb2m-mrt@asahi-net.or.jp>のメール: >> >> 木田さん、 >> >> >> 詳細読みというのがあります。一文字ずつ読んでいきますし、どの字か正確に解るように読みます。市道だったら、しやくしょのしとか読むはずです。あるいは偏が何で旁が何だとか。詳細読み用の辞書もいくつか公開されているはずです。 >> >> DAISY教科書での詳細読みは見たことがありません。音訓表に拘束されるし、読み仮名以外ルビはみなパーレンにするからでしょう。 >> >> Regards, >> Makoto >> >> >> 2024年4月9日(火) 午前9:34 木田泰夫 <kida@mac.com>: >> >>> 村田さん、 >>> >>> >>> 今日ニュースを読んでいたら、タイトルのような文がありました。同音異義語はたくさんありますが、この例は意味の中心にそのような熟語が二つ並ぶ珍しい例かと。こんな場合って、daisy教科書などではどうされるんですか? >>> >>> 「花見小路は市道だが、一本入った狭い脇道は大半が私道。」 >>> >>> 代替の読みを示すルビの登場ですかね。「私道」に対して「わたくしのみち」みたいな。 >>> >>> 木田 >> >> >> > > -- > Regards, > Makoto > > > > -- Regards, Makoto
Received on Tuesday, 9 April 2024 14:23:18 UTC