9Oct
みなさん、こんにちは。
本日は、「アナログ・デジタル」の中の「音・色のデジタル化とデータの圧縮」について書いていきます。
はじめに、「音のデジタル化」に関する内容についてです。
音は、自然に発せられるものは、連続的な特性を持っているので、アナログ情報であると言えます。これをコンピュータで取り扱うためには、デジタル化する必要がありますね。
その際に「標本化(サンプリング)」というものを行います。これは、時間を一定の時間で区切り、その区切り毎で音の振れの値を取り出すということです。
このときの音の振れとは、音の高低や音量の大小など、音の要素全般です。
この「標本化」を行った間隔を「標本化周期」(「サンプリング幅」「サンプリング周期」)といい、この周期が短ければ短いほどアナログ波形に近似します。
その「標本化周期」の1秒間の回数を「標本化周波数」といいます。
音という連続的な情報を、決められた時間ごとの要素を抽出して離散的な情報を得て、デジタル化しているということです。
「標本化定理」とは、もともとのアナログの音声を構成する波形(正弦波)のうち、最も周期の小さいものに着目し、この周期の半分以下の時間間隔で区切ることによって、もとのアナログ波形を再現できるということを指す定理です。
ここで、音にのみ該当するものではありませんが、デジタル化において必要不可欠なものについて説明します。
それは、「量子化」です。
「量子化」は、縦軸(音であれば、一般に電圧)を一定間隔で区切ることで段階値を決め、標本点の値を最も近い段階値に合わせることです。
これによって、デジタル化できるようになるということです。
「量子化ビット数」とは、量子化の段階値を決めるものです。
標本化周期と同様、区切る感覚が短ければ短いほど、アナログ波形に近似させることができます。
こうして、「量子化」できたデータは、「符号化(コード化)」によって、コンピュータが扱うことのできる、2進数で表現されます。
このように、デジタル化して記録する方式の1つに「PCM(パルス符号変調)方式」があります。
さて、次に「色のデジタル化」についてです。
正確には、画像や動画の処理についての内容となります。
そもそも、コンピュータが扱うことのできる色の表現は、「光の三原色」です。スマートフォンやモニターなどは、光で表現していますからね。
この「光の三原色」は、何色を指すかというと、RGBです。Rは赤、Gが緑、Bが青です。
RやGは一般的な場面でも赤・緑を指しますが、Bは今回のように青を指すことと、黒を指すことがあるので、注意してくださいね。
画像の最小単位は「ピクセル(画素)」といいます。今では1000万画素の画像を撮影できるカメラも一般的になっていますね。
多いものだと4000万画素や6000万画素もあるようで…
一方で、モニターでは解像度といいますね。「画素が荒い」とはいいませんが、「解像度が荒い」とはいうこともありますし、モニターではなく、知識のことなどで「解像度が低い(荒い)」という場面もありますね。
「解像度」は、画像の細かさを表す語で、縦横それぞれの画素数の積で求められます。
ここでまた単位の紹介です。
「ppi」とは、画面上に配置された1インチあたりの画素数を表す単位です。
「dpi」とは、1インチあたりのドット数を表す単位です。
「階調」とは、明るさが変化する段階数を示す単位です。
さて、ここで画像系のソフトウェアの二分類です。
ペイント系とドロー系の2種類についての説明です。
「ペイント系ソフトウェア」は、画像を画素として表現します。このような画像形式を「ラスタ形式(ビットマップ形式)」といいます。
「ドロー系ソフトウェア」は、画像を基準点からの座標や角度、太さなどで表現します。このような画像形式を「ベクタ方式(ベクトル方式)」といいます。
それぞれにメリット・デメリットがありますが、その点については深く言及されていませんが、1つだけ情報Ⅰの内容に組み込まれています。
それが「シャギー」です。これは、画像を拡大したときに画素の境目によって、ギザギザとなる部分です。これは、画素をして表現する「ペイント系ソフトウェア」に起こる特性です。
画像については以上です。続いて、動画についてです。
動画は、画像をいくつも重ねることで動いて見えるようにしているのはご存じかと思います。
その1つ1つの静止画を「フレーム」といい、1秒間に画面に表示されるフレームの数を「フレームレート」といい、「fps」という単位を用います。
動画視聴はもちろん、PCでゲーム(特にアクション系)をするという方は、高いフレームレートを求めているのはないでしょうか。
WEBサイトの閲覧や文書作成などでは、60fpsでも120fpsでも実用上問題ないと個人的には思っています。
動画については、画像と音声を組み合わせたものなので、新たな説明部分はほとんどありません。
最後に、データの圧縮についてです。
みなさんは、圧縮形式のファイルといわれると何を思い浮かべますか。
そのファイル形式どの分類に属するかを考えながら読んでください。
そもそも、「圧縮」とは、ファイルサイズを小さくするための処理で、コンピュータにより多くのデータを保存したり、低コストで送受信を行うために行う処理です。
圧縮したデータをもとに戻す処理を「展開・伸張・解凍・復元」といいます。
最近では、「展開」という方が多い気がします。私は「解凍」派です。
「圧縮後のデータ/もとのデータ」で圧縮率を求めることができます。
さて、そんな圧縮方式ですが、大きく2つに分類されます。
「可逆圧縮」と「非可逆圧縮」です。
そのままの意味ですが、
「可逆圧縮」は、圧縮前と{展開・伸張・解凍・復元}後のデータが同一となる圧縮方式です。
「非可逆圧縮」では、圧縮前と{展開・伸張・解凍・復元}後のデータが異なり、一部が欠損した状態となりますが、圧縮効率は高いです。
元通りにならないんだったら使えないじゃんと思った方、半分正解で、半分間違いです。
もちろん、文書ファイルなどは、元通りにならなかったら困りますよね。文字が変わっていたり、抜けていたら困ります。
一方、画像や動画といったものであれば、一部が欠損していても気づかないこともあるのではないでしょうか。例えば、映画で画面が静止している場面があった場合、フレームレート通りの画像を保存するのではなく、最初の1枚を保存し、●秒間表示するという形で保存した方が効率的ですよね。
人間の認知限度を超えるレベルのデータは欠損していても実用上は問題ないということです。もちろんそれだけではありませんし、厳密な言い方ではありませんが、そのようなイメージを持っておけば、十分です。
このようなことから、
一般に文書ファイルで用いる、ZIP形式やRAR形式などは、「可逆圧縮」です。
一方で、音声ファイルのMP3形式、画像ファイルのJPEG形式、動画ファイルのMPEG形式などは、「非可逆圧縮」です。
このように様々な形式が存在するので、その種類を区別するためのものを「拡張子」といいます。
最後にデータを圧縮する方法の一部を紹介して終わりになります。
「ランレングス法」とは、同じデータが連続する時に、そのデータと連続する回数を表す方法です。
「エントロピー符号化」とは、よく現れるパターンを短いコードに置き換えることで圧縮する方法です。
データの圧縮は、同一のデータが多くあればあるほど圧縮率が高くなります。
本日は、ここまでです。「デジタル・アナログ」の内容もここまでとなります。
次回は、「コミュケーション」の用語を列挙します。