MENU

無料相談

  1. HOME
  2.  > 
  3. サイト職人スタッフブログ
  4.  > 
  5. ウェブサイトにおける文字コード、90%を占める文字コードとは?

サイト職人スタッフブログ

ウェブサイトにおける文字コード、90%を占める文字コードとは?

mojicodeホームページの制作経験のある方なら過去に文字化けを経験し、文字コードが大きく関係していることをご存知かと思います。ホームページの制作経験がなくてもインターネット巡回していれば、文字化けしているサイトはいくつか見つかるかと思います。今回は、ウェブサイトにおける文字コード、90%を占める文字コードについてご紹介します。

文字コードとは何か

UTF-8の説明をする前に文字コードとは一体何なのか、簡単に説明しておきます。文字コードとは、コンピュータ上で取り扱う文字に与えられた番号のことです。コンピュータは、あらゆる情報を数値として取り扱うため、全ての文字情報に対して数字を与えています。そして、コンピュータで取り扱う約束事として文字コードの電子的な表現方法のことをエンコーディングと言います。今までユニコードと呼ばれる世界共通の文字コードが策定されていましたが、コンピュータで取り扱うためには、UTFと呼ばれるエンコーディングが必要となっています。

UTF-8とは?

世界中にあるウェブサイトのうち、90%を占める文字コードが何かご存知でしょうか?おおよそ推測ができているかもしれませんが、オーストラリアのコンサルティング企業Q-Successの調査によれば、世界中に存在するウェブサイトのうち、文字コード「UTF-8」のページが占める割合が、全体の90%を超えたことを公開しています。
世界基準の文字コードと呼ばれるUTF-8ですが、昔の携帯電話の表示には対応していない場合がほとんどです。実際に、UTF-8でウェブサイトを作成し、実機で確認すると文字化けされて表示されている事が分かります。そのため、スマートフォンでも同様に文字化けするかと思われがちですが、スマートフォンならどんな機種でも綺麗に文字が表示されます。ホームページ制作者の間では、ほとんど問題が起きることがないため、文字コードに対する概念を知らない方でも、UTF-8を利用しています。

世界中の色々な文字の集合体を「文字集合」と言い、文字集合で定義づけられた個々の文字をコンピュータ上で表示する値の割り振り方を「符号化方式」と言います。UTF-8は、どちらかというと、「符号化方式」に該当するものです。ASCIIコードと互換性が高いことから世界中のソフトウェアで利用されています。だからこそ、UTF-8は世界的でも有名な文字コードになったということです。

Shift-JISとUTF-8の違い

UTF-8以外の文字コードとして、Shift-JISというものをご存知でしょうか?みなさんが普段利用されているMicrosoft社が開発した文字コードでASCIIコードの文字に日本語の文字を加えた文字コードのことをShift-JISと言います。Shift-JISは、漢字やひらがなやカタカナなどを利用することができます。しかし、Shift-JISとUTF-8には、具体的にどのような違いがあるのでしょうか。Shift-JISは、バイト数が比較的少なく、国内の携帯電話で読めることから大きなメリットがある文字コードです。一方で、使い方によっては文字化けするといった特徴もあります。また、エンコードデータに制御文字を含む場合が多いため、そのようなことを考慮しない環境で利用するとなると誤作動起こし文字化けを起こす原因となります。文字種は、9000程度あると言われています。

それでは、UTF-8にはどんな特徴があるのか具体的にご紹介します。UTF-8は、文字範囲が非常に広いため、どんな国の文字でも文字化けすることがありません。どんなパソコン環境でも、デフォルトで読むことが可能です。先ほども説明しましたが、国内の携帯電話の表示にしっかりと対応しておらず、日本語を利用する場合は3バイト以上利用するため、Shift_JIS、EUC-JPなどと容量を比較すると1.5倍程度になってしまいます。つまり、UTF-8は、非常に便利ではあるものの容量が大きくなってしまう文字コードだということです。

HTML5では、UTF-8 を用いる事を推奨している

HTMLコーディングをするのであれば、結局どれを利用すれば良いのか、迷われる方もいるでしょう。HTML5でホームページを完成させる場合、文書で使う文字のエンコーディングとして、UTF-8 を用いる事が推奨されています。ということは、Shift-JISなどを使ってはいけないのでしょうか?そのことはありません。どちらかというと、非推奨となっており、できれば使ってほしくないという程度です。現状、もしゼロからホームページをHTMLコーディングすることがあれば、UTF-8を利用しておけば特に問題はないでしょう。

最後に

今回は、UTF-8について説明してみましたが、いかがだったでしょうか。すでに、世界的にも標準的な文字コードとなっていますので、わざわざ他の文字コードを使わなくてもUTF-8を利用していれば、特に問題はないでしょう。しかし、古い携帯電話に文字情報を表示させようとすると文字化けして表示できないなどの問題がありますので、その点については、理解しておいた方が良いでしょう。そして、HTML5でもUTF-8が推奨されているため、できるだけ積極的に利用して

PAGETOP