Re: JLReq の文字クラスと Unicode の文字クラスとの関係

みなさま

出版データのEPUB化に際して文字の正立/横転の挙動で困っている文字の例を出せ、というお達しがあったようなので(Natさんからもっと全然本格的なのが出てくるようなので本当にいるのかとは思いつつも)、一応ざっくりとした例と弊社でのこの問題の処理についての資料を上げておきます。ご参照ください。
--------------------------------------------------------------------------------------------------------------------------------------------------------
EPUBでの文字の正立/横転問題およびその対処方針

・キリル文字、ギリシャ文字がKindleで正立してしまう問題がずっとあった。これはtext-orientationで明示的にタグ指定しての横転も動作しないため、どうにもならなかった(新エンジンでおそらく解決したものと思うが全ての対象文字のテストはまだ)。このため、出版社と相談して「許容してそのまま流す」「単語ごとに外字化」「文字ごとに外字化」のいずれかを選んでいる。そのまま流さないケースでは多大な作業時間が発生するが、出版社は組版の維持を優先することが多いため、そのまま流すことを許容してもらえるケースはかなり少ない。当然アクセシビリティにも悪影響は出ている。

・いわゆる時計数字(ⅠⅡⅢⅣなど)が同様に強制的に正立してしまう問題があり、これは通常のアルファベットに置き換える等の対処をしている。通常それで問題はないが、同じ本の中で正立させて使用している箇所が混在することも当然あるので一括で自動処理はできない。目視で該当箇所の挙動を確認して修正するという話になる。

・InDesign内での文字の向きとUAX#50でのデフォルト値が異なる文字についてはオペレータが覚えてどうにかできる類の問題ではないので、制作時に自動処理で差分を吸収する対処をしている。処理の詳細は添付PDF参照。
--------------------------------------------------------------------------------------------------------------------------------------------------------



> 2021/03/30 21:56、Atsushi Shimono (W3C Team) <atsushi@w3.org>のメール:
> 
> 
> 
> On 2021/03/30 12:42, Koji Ishii wrote:
>>        4. vert の問題 2:どの文字が vert で回転されるべきかきちんと定めてほしい、とのリクエスト
>>    これはそういう意味なんですか? この4が何を求めているのか、ちょっと趣旨が読めていないです...「どの文字が vert で回転されるべきか」はUAX#50が既に定めているので、CSS WGがSC29に改めてリクエストする趣旨がちょっとよく分かっていません。主語が「CSS WG」なので、CSS WGの誰かがきっと書いたんだと思うんですが、何を求めているのか、おわかりになる方がいらっしゃいましたら、解釈を是非お願いします。
>>        。*UAX50 の初期のドラフトは個々の文字に対してその挙動を定めていたが、それが無くなった、と書いてあるように読めますが、最新版でも文字ごとの方向は書いてありますよね。おそらく私の読み方が間違っているのだと思います。どなたか解釈を助けて*
>>    二番目の段落が言っているのは、"in upright typesetting modes" が鍵のようで、初期のUAX#50にSVOという `text-orientation: upright <https://drafts.csswg.org/css-writing-modes-3/#valdef-text-orientation-upright>` 指定時の挙動を、デフォルトの挙動とは別に定めるという案がありました。これはデフォルトの挙動でカバーできるので、確かにabandonedされましたが、この段落と、前の段落、後の段落が私の頭の中で繋がりません。SVOを戻してくれ、と言っているわけでもなさそう。ということで、この段落だけを見れば解釈できますが、趣旨の解釈ができていません。
> 
>  背景の趣旨の議論などを見つけたand/or把握しているという話では全くないのではありますが、、参
> 照しているデータを持ってきてUAX#50のVOとマージして眺めたりとかいろいろしてたところで、で、個
> 人的には"envisages guidelines such as the following:"の直下よりもその次の"Note that"以降、特
> に
>> SHOULD provide appropriate "rotated"glyphs as vert alternattes for characters with SVO=R
> と
>> MAY have vrtr alternates for any characters
> がキモ(&CSS実装で大きく変化するであろう部分)で、オレタチがやる!的な話があったりするのかな、
> という気もしてきました。。。
> 
> 
> note.
>  使った、というか、この際!でいい加減に重い腰上げて書いたスクリプトは↓で(車輪の再生産だと
> は思いますが、、)、Unicodeのフォーマットをパースして配列に入れるのと2つのセットをマージする
> コードが入った(ただし2つ目のデータの領域開始点をチェックしてないバグがあり)クラスで、2つファ
> イルをつけて実行するとマージしたデータをコンソールに出力します。。
> https://github.com/himorin/jlreq-unicode-notes/blob/main/script/ParseData.py
> 
> 



***************************************
(株)三陽社
 メディア開発室
 http://www.sanyosha.co.jp/

 
 田嶋 淳
 tajima@sanyosha.co.jp
 
 ※ブログ運営中です。
  ご意見をいただければ幸いです。
  http://densyodamasii.com/

***************************************

Received on Thursday, 1 April 2021 05:07:26 UTC