パソマニのツブヤキ

よく聞く文字コードって何?

パソコンというのは2進法と呼ばれる数値を使い多くの情報を処理しています。同じくディスプレイに映し出される文字も同じになります。そして文字には文字コードと呼ばれる固有の数値が割り当てられています。文字と文字コードを繋ぐことでディスプレイに私たちが認識できる文字を表しています。

パソコンはアメリカで生まれましたが当初はアルファベットや数字の扱いに関して色々と議論があったようです。そこで導入されたのがASCIIと呼ばれる文字コードです。ASCIIは7ケタの2進数、128通りの数値をそれぞれアルファベットと数字、さらに記号や改行に関する制御記号を与えました。

ちなみに私たち利用する日本語はアルファベットとは違い1バイトで表現することができないので2バイト分を使って表しています。2バイト文字なんて呼ばれ方もしています。

文字コードには様々な種類がある

実は文字コードはASCIIだけでなく多くの種類があります。OSやアプリによって違った文字コードを使われているケースなどもあります。

よくあるトラブルとして文字化けがあります。これはソフトウェアが文字コードを判断して適切な変換を行うのですが何かのトラブルによって間違えた文字コードで変換していると起きる現象です。パソコンが故障しているわけではないので焦らずに対処をしましょう。

そして日本語の場合ですが一般的にシフトJISがWindows、MacなどのOSで広く採用されるようになりました。他にもEUC-JPといった文字コードもあります。これはUNIXで使われる文字コードなど各ソフトウェアによって日本語にも多くの文字コードがあります。ですからOSの違うパソコンでデータのやり取りをする場合などは文字コードに気を配りデータを作る必要がありました。これを打破したのがUnicodeと呼ばれるものです。

今ではシフトJISに変わる文字コードとして多くのOS、アプリ等でも採用されるようになりました。

トップへ戻る

メニュー