fc2ブログ

「テキストエディット」 vs「mi」

半月以上空けてしまいましたが、「pbpasteしてみた」の続きです。

クリップボードの中身を展開しようとして失敗したので、クリップボードを別の方法で見てみました。
今回用いたのはフリーのエディタ「mi」です。
長いことアップデートされていないものの、最新β版である2.1.8b4では正規化表現のUnicodeも表示できるようになっています。



てことで、これと「テキストエディット」を使ったチェックを行ってみます。

まずは双方で、正規化表現された同じテキストを開きます。

080824_CopyPaste(1)

ファイル名は見たとおりとして、表示結果もともに同じであることがわかります。

そのうえで、一方から他方へ、中身を丸ごとコピーしてみます。
まずは「テキストエディット」から「mi」へ。

080824_CopyPaste(2)

結果は一目瞭然。
正規化表現が崩れて、字形が変わってしまいました。

では次に逆。「mi」から「テキストエディット」へ。

080824_CopyPaste(3)

こちらは崩れることなく、字形はそのまま出ています。



ここで、「クリップボードの中身を考察してみる」で提示した「OS Xにおけるクリップボードの中身を推察した図」を出してみます。

080723_クリップボード_OSX

今回の場合は、

  • 「テキストエディット」から「mi」では(c)の状態
  • 「mi」から「テキストエディット」では(b)の状態
のようなことになっていると思われるわけですが、どうでしょうか。

だんだんと本筋から離れてるので、OS Xの話はここまでにしておきたいところではありますが、意外にもそれっぽい結果が得られてしまったな、というオチでお後がよろしいようで。不完全燃焼だけど。



本当はmiの作者さんに「このへんの処理どうしてます?」とか聞けばより確実ではあるような気もするんですが、やっぱり本筋の話ではないし、ご面倒かけるのは本意ではないのでやめときます、はい。

このエントリーを含むはてなブックマーク はてなブックマーク - 「テキストエディット」 vs「mi」

コメント

>>小形さん
実は気づいていませんでした。ありがとうございます。
とりあえずコメントをさせていただきました。

直井さんがコメントしてますね。

 http://d.hatena.ne.jp/NAOI/20080827

ご存知と思いますが、念のため。

>>小形さん
えーと、頂いたコメントを元に補講として別に起こします。

どうしたもんですかねえ、というオチになりそうですが。

この実験って、
「Å」(オングストロ-ム、U+212B)でやるとどうなります?
ご存知のとおり、
NFD/NFKDだとU+0041/U+030A
NFC/NFKCだとU+00C5
となります。

また、U+03D3は4種類の正規化全てで結果が違います。
NFDはU+03D2/U+0301
NFCはU+03D3(変わらない)
NFKCはU+03A5/U+0301
NFKDはU+038E

U+03D4も同じく結果がちがいます。
これらで試すと、もう少し詳しく挙動がつかめるかも。

とても興味深く拝見しました。
この実験結果から、Mac OS Xでは
クリップボードで正規化をおこなうオプションが存在する
ということが言えそうですね。

ところで、まだよく呑み込めないのですが、
Mac OS Xはどんなメリットがあって
クリップボードで正規化をおこなっているんでしょう?

正規化はどうしたって元々の符号の並びを変形しますね。
クリップボードを使う大半のユーザーは、それを望まないでしょう。
それでもあえて正規化を組み込むなら、
それなりのメリットがないといけません。
それがどうもよく分からない……。

非公開コメント

最近の記事

はてブ数順傾向

プロフィール

あさうす

  • Author:あさうす
  • DTP業界を中心に主観だらけの毒を吐いてます。後ろ盾なし、保証なし。あくまでも独断と偏見に満ちているだけで、何かの圧力とかはありません。たぶん。いやないです。信じてください。

    なお、名無しコメント&煽り、勝手にトラックバックやリンクなどはご自由に。spam認定したもの以外は削除しません。ただしFC2の都合でTBは弾かれるかもしれません。

    当blogは、Firefoxを推奨します。

    何かお問い合わせございましたら [assause@gmail.com] までどうぞ。

月別アーカイブ