Re: 和欧文間の空き or Segment Break Transformation Rules

木田さま
みなさま

PDFに関しては本来テキストを取り出すのはそう簡単な話でもないというような話は聞いたことがあり、特定のビューアからのコピー&ペーストが果たして正しい抽出結果なのかという疑問はあります。幸いAdobeさんのプロダクトですので、Natさんのご意見を聞きたいところです。

> 2020/05/16 17:14、木田泰夫 <kida@mac.com>のメール:
> 
> ソフトウェアが行末の折り返しを空白文字に置き換える例を身近なところに一つ見つけました。PDFです。
> 
> 敏先生の簡便ルビのドキュメントですが、コピーしてきたらこんな:
> 
> 「注釈としてのルビ 行間にルビと同じ配置 位置に注釈を配置する方法もある(行間 注).この配置処理は,ここでは適用範囲 としない.モノルビでは,そこに付くルビ 文字列の 2 行にわたる分割(以下,分割 という)は認められていない.さらに,グ ループルビでは親文字列の分割も認められ ていない.これに対し,行間注では,分量 が多くなるケースも予想され,親文字列又 は行間注の文字列は,分割可能位置での分 割を認める必要があり,異なる配置処理が 必要になるからである.」
> 
> わかりやすいように赤で示しています。
> 
> このようなケースだと、リアルタイムに入力するケースと異なり、両側の文字を見てという処理でも良さそうですね。
> 
> 木田
> 

***************************************
(株)三陽社
 メディア開発室
 http://www.sanyosha.co.jp/

 
 田嶋 淳
 tajima@sanyosha.co.jp
 
 ※ブログ運営中です。
  ご意見をいただければ幸いです。
  http://densyodamasii.com/

***************************************

Received on Sunday, 17 May 2020 23:58:06 UTC