【基本情報】情報理論について

【基本情報】情報理論について

情報に関する基本的な考え方についての解説となります。
データ通信の際の基本をしっかり学んでいきましょう!

 

1. データの最小単位とデジタル化

コンピュータはすべての情報を0と1の組み合わせ(電気のON/OFF)で処理します。
これをデジタル表現と呼びます。

 ・ビット (bit):情報の最小単位。1ビットで 0 か1の2通りを表現。

 ・バイト (Byte):8ビットをまとめた単位。2^8 = 256通りの情報を表現可能。

 ・デジタル化:アナログ情報(連続的な変化)を数値(不連続な数値)に変換すること。

符号化 (Encoding):一定の規則(文字コードや圧縮形式など)に従って、データ(文字、音、画像など)をコンピュータが扱えるビット列(符号)に変換すること。逆に、符号を元のデータに戻すことを復号 (Decoding) と呼びます。

 

2.データ圧縮 (Data Compression)

データの意味を保ったまま、サイズを小さくする技術です。

可逆圧縮 (Lossless Compression / 復元可能)

展開(解凍)したときに、完全に元のデータに戻る方式です。

  ・用途:文書(Word/PDF)、プログラム、ZIP形式。

  ・重要性: 一文字でも欠けると困るデータに使用します。

非可逆圧縮 (Lossy Compression / 復元不可)

人間の感覚では気づきにくい細かなデータを切り捨て、圧縮率を優先する方式です。

  • 用途: 画像(JPEG)、音声(MP3)、動画(MPEG)。
  • 重要性: 完全に元には戻りませんが、ファイルサイズを劇的に小さくできます。

ハフマン符号化 (Huffman Coding)

可逆圧縮の代表的なアルゴリズムの一つです。

  • 仕組み:出現頻度の高いデータには短い符号を、出現頻度の低いデータには長い符号を割り当てることで、全体のデータ量を削減します。
  • ハフマン木: 符号を決定するために作る二分木のことです。
  • 特徴:データの偏り(よく使う文字と使わない文字の差)が大きいほど、圧縮効率が高くなります。

 

3. 誤り制御とパリティチェック

通信中にノイズの影響でデータが化けてしまう(0が1になる等)ことを防ぐ仕組みが誤り制御です。

パリティチェック (Parity Check)

データのビット列に「パリティビット」を 1 ビット付加して、誤りを発見する方法です。

  ・偶数パリティ:全体の「1」の個数が偶数になるように調整。

  ・奇数パリティ:全体の「1」の個数が奇数になるように調整。

例(偶数パリティの場合):

・データが 1101001 (1 が 4 個) → パリティは 0

・データが 1101011 (1 が 5 個) → パリティは 1

※ 受信側で「1」の個数を数え、ルール(偶数か奇数か)に反していればエラーと判断します。
※ 注意点:偶数個のビットが同時に反転すると検出できません。

 

今回のまとめ

用語 意味
デジタル表現 コンピュータはすべての情報を0と1の組み合わせ(電気のON/OFF)で処理すること
符号化 一定の規則に従って、データをコンピュータが扱えるビット列(符号)に変換すること
可逆圧縮 展開(解凍)したときに、完全に元のデータに戻る方式
非可逆圧縮 人間の感覚では気づきにくい細かなデータを切り捨て、圧縮率を優先する方式

ハフマン符号化

出現頻度の高いデータには短い符号を、出現頻度の低いデータには長い符号を割り当てることで、全体のデータ量を削減すること
誤り制御 通信中にノイズの影響でデータが化けてしまうことを防ぐ仕組み
パリティチェック データのビット列に「パリティビット」を 1 ビット付加して、誤りを発見する方法