2008/08/24
「テキストエディット」 vs「mi」
半月以上空けてしまいましたが、「pbpasteしてみた」の続きです。
クリップボードの中身を展開しようとして失敗したので、クリップボードを別の方法で見てみました。
今回用いたのはフリーのエディタ「mi」です。
長いことアップデートされていないものの、最新β版である2.1.8b4では正規化表現のUnicodeも表示できるようになっています。
てことで、これと「テキストエディット」を使ったチェックを行ってみます。
ある意味どうでもいいことや、役立つかどうかもわからないような中身を、日々脳内から適当に垂れ流しまくりつつ、今日をなんとか生き存えることを思案してます。
2008/08/24
クリップボードの中身を展開しようとして失敗したので、クリップボードを別の方法で見てみました。
今回用いたのはフリーのエディタ「mi」です。
長いことアップデートされていないものの、最新β版である2.1.8b4では正規化表現のUnicodeも表示できるようになっています。
てことで、これと「テキストエディット」を使ったチェックを行ってみます。
ファイル名は見たとおりとして、表示結果もともに同じであることがわかります。
そのうえで、一方から他方へ、中身を丸ごとコピーしてみます。
まずは「テキストエディット」から「mi」へ。
結果は一目瞭然。
正規化表現が崩れて、字形が変わってしまいました。
では次に逆。「mi」から「テキストエディット」へ。
こちらは崩れることなく、字形はそのまま出ています。
ここで、「クリップボードの中身を考察してみる」で提示した「OS Xにおけるクリップボードの中身を推察した図」を出してみます。
今回の場合は、
だんだんと本筋から離れてるので、OS Xの話はここまでにしておきたいところではありますが、意外にもそれっぽい結果が得られてしまったな、というオチでお後がよろしいようで。不完全燃焼だけど。
本当はmiの作者さんに「このへんの処理どうしてます?」とか聞けばより確実ではあるような気もするんですが、やっぱり本筋の話ではないし、ご面倒かけるのは本意ではないのでやめときます、はい。
コメント
実は気づいていませんでした。ありがとうございます。
とりあえずコメントをさせていただきました。
2008/08/30 00:16 by あさうす URL 編集
http://d.hatena.ne.jp/NAOI/20080827
ご存知と思いますが、念のため。
2008/08/28 01:39 by おがたかつひろ URL 編集
えーと、頂いたコメントを元に補講として別に起こします。
どうしたもんですかねえ、というオチになりそうですが。
2008/08/27 22:28 by あさうす URL 編集
「Å」(オングストロ-ム、U+212B)でやるとどうなります?
ご存知のとおり、
NFD/NFKDだとU+0041/U+030A
NFC/NFKCだとU+00C5
となります。
また、U+03D3は4種類の正規化全てで結果が違います。
NFDはU+03D2/U+0301
NFCはU+03D3(変わらない)
NFKCはU+03A5/U+0301
NFKDはU+038E
U+03D4も同じく結果がちがいます。
これらで試すと、もう少し詳しく挙動がつかめるかも。
2008/08/25 21:08 by おがたかつひろ URL 編集
この実験結果から、Mac OS Xでは
クリップボードで正規化をおこなうオプションが存在する
ということが言えそうですね。
ところで、まだよく呑み込めないのですが、
Mac OS Xはどんなメリットがあって
クリップボードで正規化をおこなっているんでしょう?
正規化はどうしたって元々の符号の並びを変形しますね。
クリップボードを使う大半のユーザーは、それを望まないでしょう。
それでもあえて正規化を組み込むなら、
それなりのメリットがないといけません。
それがどうもよく分からない……。
2008/08/25 20:55 by おがたかつひろ URL 編集