TOP | はじめに | ダウンロード | 羽根頭掲示板 | 猿塾 | リンク | サイト内検索

←前回へ
バックナンバー
次回へ→
第7回:解凍って・・・氷はどこ?

さて、相変わらず順番も無くむちゃくちゃに思いついた話題ですが、インターネット基礎講座でもしようと思ったらファイルの種類の話になるし、そうなると避けて通れぬ圧縮と解凍の世界・・・というわけでパソコン初心者一番の悩み、圧縮と解凍の話です。

・・・でも先に別の話(笑)みんなファイルというかパソコンのデータが壊れる時ってどんな時だと思う?誰でも思いつくのがデータの読み書きのうち書きの時だろう、と思うでしょ。実は読みの時も壊れる事あるって知ってた?

これはフロッピー等の磁気メディアと言われるモノでの話ね。CDなんかは光線当ててるだけだから読む事で壊れる事は無いけどね(笑)フロッピーやハードディスク、これらは読込みしてるだけでも壊れる可能性はあるのよ。だって読むときも書くときも磁石で磁力当てて作業してるわけですね。てことは読もうが書こうが磁気は使ってるわけで・・・だから読んでるだけで壊れる事は無いと過信しちゃダメなわけです、はい。

というわけで大事になるのがバックアップというわけだ。そしてバックアップするときの基本が圧縮ファイルにして別の場所にしまっておくというもの。

はて、圧縮ファイルって何?となった人は今回読むべし。疑問にならない人はお帰り下さい(笑)

そもそもファイルの容量を小さくしたいのは世の常。でも必要なサイズってのがあるわけで、おのずと限界がある。でも使わない時ってもっと小さく出来れば良いよね?と思う人がいたわけだ。

これは色々な理由があるんだけども、その1つに初期のパソコン通信等の事情がからんでいる。これを読んでる人は誰でも知ってるけど、電話代やプロバイダ料金等、通信するには色々とお金が必要なわけだ。無論時間も必要で、それらを少しでも少なくしたいのは人情ってもんだ。

そこで考え出されたのが一定のルールにしたがってファイルを小さくしちゃえ!というもの。小さくなればそれだけファイルを送る時にも受ける時にも必要な時間が減るじゃないか!ということでファイルの圧縮つーもんが考え出された。

ここで豆知識なんだけど、普通は圧縮とくれば伸長または展開なんだけど、何故か解凍という言葉が一般的だよね。疑問に思った人いないかな?え、いない?(^^;)こりゃまた失礼しましたっと(笑)

本来は伸長という言葉を使うのが正しいんだけど、何となくフィーリングが合うからかみんなが使ってる。まぁ冷凍保存を戻すかのようなイメージがあるのでしっくりくるというのもあるが。でも実際は別の理由があって、ウィンドウズ等で一般的な圧縮ソフトとしてLHAというものがある。あきんど.lzhという風に.LZHと言う圧縮ファイルを見たことがあると思う。

この圧縮ソフトはウィンドウズ以前のDOSの時代、そうNECの98が全盛の頃には国内で一番メジャーな圧縮ソフトでほとんどの圧縮ファイルがこのLZHで配付されていた。日本人の圧縮ファイルといえばLZHというくらいだった。

そのLZHを圧縮したり伸長するソフトがLHAというソフトだったんだけど、確かこの作者が説明書の中で解凍という言葉を使ったのが理由だと何かで読んだ事がある。俺はこの説を信じてるけど事実かどうか知らないのであまり大きな声で言わないでね(爆笑)

さて、ひとくちに圧縮と言うけども世の中には2種類あって、必ず元に戻せる可逆圧縮というのと絶対元に戻せない不可逆圧縮の2つがある。前者はふとん圧縮袋と同じ(笑)場所を取らないかさばらない。でもまた元の布団に戻せるというもの。

後者は新聞のスクラップと同じ。同じ記事を元の新聞をいくつも残しておくよりも確実にかさばらずに残しておけるけど、元の新聞の形には絶対に戻せないというもの。でも必要なのが記事だけなら問題無いでしょ?ということでこういうのもあります。

ではどうして圧縮と言ってファイル等が小さくなるのか説明しましょう。まずは可逆圧縮の方ね。

コンピュータは0と1だけしかわからないというのは何かで読んだ事あると思います。読んだこと無くてもそうだと思ってね(爆笑)んでファイルの中身は実際は何でも0と1だけになってます。この辺の説明が欲しい時はリクエストぷり〜ず。今後の回でやるかもしれないよ〜ん。

たとえばあるファイルの中身が[0000000101010101]だとするよね?全部で16文字になるこの中身を例えば[00×3・01×5]と、言う風に並べ替えちゃうと区切りの[・]を入れてもたった9文字になってしまった。およそ半分だよね。

こういう風に中身の並びを一定のルールによって置き換えちゃうのが圧縮の仕組みなわけだ。戻すときには00を3つ、01を5つ並べると元に戻るしね。これが普通の圧縮の仕組みで、この仕組みというかルールが色々あって、それぞれのルールごとにLZHとかZIPとかSITとか圧縮形式が存在するってわけ。

んでおまけなのが不可逆圧縮。元に戻せない圧縮なんて存在するの?必要なの?と思うでしょ。これがみんな一般的なので見逃してるけど使ってるんだよ。先にどういうものかと言うと今度も16文字で表現するけども

[000000000000000]

というのがあるとするよね。でも人間のパっと見た目では

[0000000000000000]

これと差は無いよね。だったら見た目一緒なら下のにしちゃえば[0×16]で済んじゃう。たった4文字でOKになる、こりゃラッキーってなわけで画像のJPEGがこれを使ってるわけ。だからJPEGのデジカメ写真なんかは容量小さい分ジツは元の写真と違う部分があるのだ。見た目で同じような感じのものは適当にしちゃう。だからJPEG画像を手直しするときはJPEG形式で保存しちゃうとどんどん変化しちゃうよん、というものだ。

というわけでいつものごとく、いい加減に大ざっぱに説明したけども、これで分かって貰えれば幸いです・・・つーか分かりにくいかも(^^;)

(matel)
←前回へ
バックナンバー
次回へ→

TOP | はじめに | ダウンロード | 羽根頭掲示板 | 猿塾 | リンク | サイト内検索