Re: [jlreq-d] Warichu and string searching operations (#45)

注番号は一般に文末に付くケースが多いが,語句の注もあり,語句の直後に付くケースもある.で,
 語句a“注番号又はその他の異物”語句bの続き…
と考えた場合,語句aは,一般にそれだけで完結しており,それに続く語句bは,それも完結しており,別々に検索できれば,一般にはいい.ですから,重要度は高くない,と思う.

しかし,検索では,語句を組合せた検索,つまり“福沢諭吉の妻”という検索をしたいとケースはある.“本文注1)の行間”とあった場合,“本文の行間”で検索したいでしょう.具体例は忘れたが,検索を絞りたいために,語句を組合せた検索したいケースはそれなりにあるが,できないので,1つの単語で検索し,すごく数が多くなって,というケースは,何回か経験している.

もう一つのケースですが,これは漢文などにあるケースで,文字1字だけが問題となり,それに注が付くケースがある.複数の字で構成される人名の1字だけについて,この字は,誤記や異体字かもしれないという注記がつくケースです.この場合は,まとまった人名で検索したい.

ただ,最近では近接した距離の長さを指定し,組合せた語句の検索できる方法もある(日本語でこれができるかは,未確認)ので,この方法で“福沢諭吉の妻”は,間に割注があっても検索できる可能性はある.

そして,異物には,注番号,インライングラフィク以外に,約物(例:“編集”の意義,特に書名などで括弧で括った例がある)や,ダーシなどもある.これらは一般に検索では無視されるケースが多い.

-- 
GitHub Notification of comment by KobayashiToshi
Please view or discuss this issue at https://github.com/w3c/jlreq-d/issues/45#issuecomment-1821916780 using your GitHub account


-- 
Sent via github-notify-ml as configured in https://github.com/w3c/github-notify-ml-config

Received on Wednesday, 22 November 2023 00:45:38 UTC