なぜPDFのページが絶えないのか

広告

Twitterであったのだけど

http://www.cao.go.jp/sasshin/review/ 仕分け web ページ.情報公開はすばらしいけど率先して pdf を排除して欲しいなあ.やっぱり普通にリンクたどるより精神的障壁が大きい.

PDFを使う理由は

  1. 紙の代替:レイアウトが崩れない
  2. 改竄を防止できる

だと思う。他にもあるかも知れないけど。

PDFはそもそも論だとPostScriptという技術をベースにしている。ポストスクリプトはプリンタに対してPostScriptという言語で内容を指示するようになっている。PostScriptプリンタは、プリンタがPostScriptのインタプリタになっている。

PDFはそれを発展させたものをベースにしているから、印刷できるものは何でもPDFになるはずである。だから、紙に印刷する代わりにPDFを作ることができる。紙を配布する代わりにPDFを配布するというのは理に適っている。

改竄を防止するということ

公文書をPDFで配布しなくてもHTML程度のレイアウトで特に問題が起きるとは思わない。伝えたい内容を正しく伝えることはできるから。

では何が大事かというと改竄を防止できることではないかと思う。つまり、誰か悪いクラッカーが事業仕分けのページをクラックして、内容を書き換えてしまう恐れがある。そうすると、内閣府が出している情報だから正確だろうと期待して読んでも、実は第三者が書き換えた偽情報かも知れない。

専門家でもわかっていない人が多い

少し話はそれるが、情報セキュリティスペシャリスト試験(SC)という試験がある。いろいろ書いてあるが、新試験制度のスキルレベル4(スキルレベルは1~4が設定されている)に位置づけられる上級の資格である。学生でこのくらいの資格を持っていたら自慢していいと思うよ。

ところがその問題ですらセキュリティのことをわかっていない人が作っている節がある。簡単に言うと、ある商用サイトのカタログ部分をhttpで作って、特にセキュリティを意識するECサイト(決済をする部分)をhttpsにしましたみたいな設定があったような気がする(勘違いならごめんなさい)。これっておかしいんじゃないかと思った。

少し説明すると、httpsのメリットは暗号化されることだと概ね理解されている。だから、クレジットカードの番号をやりとりする際にはhttps通信が必要だとされる。試験問題もこの理解に基づいて作られたのだと思う。商品カタログは別に暗号化しなくてもいいのだからhttpだということを出題者は考えたのではないかと思う。

ところがhttpsには他にも認証とか改竄検出といった重要な役割がある。こちらはどうもあまり広く知られていないようである。大手企業の担当者でも理解していない人がたくさんいる(参考:「なぜ一流企業はhttpsでの閲覧をさせないようにするのか」)。何か事故があったら大変な損害になるのに積極的に対策しようという気はないみたい。この辺はリア充採用というか反知性主義採用がまかり通っているのも原因の1つだと思うけど。きちんと勉強してきた+これからも最新の知識を身につけ続ける意欲のある人を採ればいいのに、変な基準でばかり人を採るから名だたる大企業が揃いも揃ってお粗末な対応しかできていない。

件の問題では、httpでカタログデータを提供することは構わないのだけど、わざわざ証明書まで取ってhttpsサーバを稼働させているのに、カタログはhttpでしか提供していないこと。

改竄防止に話を戻して

政府とか企業が発信している情報が本当に正しい情報であるのか、誰かがこっそり書き換えていないのかを保証することはとても重要である。ただ、今のところだと前述のように大企業ですらこうしたことを理解している担当者がいない。そんな状況で改竄防止をするにはPDFは案外いいアイディアだと思う。

ある中央官庁でインターンをしていたときに、近くの机の人が資料をメールで送ったら戻ってきた。相手のメールボックスが巨大な添付ファイル付きのメールを受け付けないことが原因だった。結局、その人は30分くらいかけてあれこれ工夫して資料を送った。1種で入った忙しい人がこんな下らない雑務で時間を浪費することが日常的にあるのが霞ヶ関の実態である。それはよくないと思ってアイディアを提案してみたが、それはシステム担当が「うん」と言わないから難しいということでダメだった。現場で工夫して解決するしかない。

それと同じで、PDFを作成する側でセキュリティをかけさえすれば、ある程度のセキュリティを確保できるPDFが使われるのはちょうどいい妥協点なのかも知れない。無理解なシステム担当を説得するまで情報公開しませんというわけにもいかない。これがHTMLでも表現できる程度の資料をPDFで配布する理由の1つであろう。

と思っていたのだけど、件の事業仕分けのページのPDFは、Acrobat 3互換のパスワードで編集を禁止しているだけだった。バージョン5以前の暗号は40ビットの弱い暗号で、やろうと思えば数秒でパスワードを解除できる。というわけで、改竄し放題だった。これじゃ意味がないなー。じゃあ何のためにPDFを使っているんだ?

2 件のコメント

  • 本当にそこまで考えて pdf を選んでいるのかはちょっと疑問だったりします.

    word などで資料を作っていた場合 html にするよりは pdf にしてしまった方が楽なので pdf がここまで広まっているのかなあと勝手に考えていました.セキュリティという観点は持っていなかったのでとてもおもしろく読ませていただきました.

    僕は記録を web に置くなら pdf よりも html で置いてほしいと思います.最近はそうでもないようですが pdf だと検索にかかりにくい,引用がしにくい,プラグインや Reader の起動時間を待たなければいけないといった理由が主にあげられます.最後の理由は些細なことですが pdf が web で嫌われる最大の理由だと思います.読んでもらいたい資料,積極的に公開したい資料であるのならば pdf だけではなく html でも公開してほしいなあと考えています.

  • PDFがよく使われるのは、本来内部資料書類向けに作ったものをそのまま(もしくはちょっと手入れして)
    使おうって考えからじゃないですか?後、リーダさえインストールされていれば誰でも
    ほぼ同じ画面で見られますし、印刷できます。
    まぁ、HP作成時の参考本とかに、PDFでやれって書いてあるのかもしれないですし、
    担当者がただ単にワード等で作る方に慣れてて、それをPDF化して公開してるだけなのかもしれません。

  • コメントを残す

    メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

    このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください