コンピューティングでは、文字はデータ型です。タイポグラフィと同様に、コンピュータ文字は小文字、大文字、数字、または句読点を表すことができますが、活字スペース、タブ、改行、その他の特殊な操作 (呼び出し音、消去など) も表すことができます。 。
コンピューターは 2 進数を扱うため、各文字には数値が与えられ、1 バイト、2 バイト、または可変バイト数でエンコードできます。文字エンコーディング標準にはいくつかありますが、最もよく知られているのは ASCII、ISO 8859、 Unicodeです。したがって、ASCII、ISO 8859、および Unicode 標準では、文字「A」には 65、「B」には 66、「a」には 97、「,」には 44 が割り当てられました。文字「é」は ASCII には存在しません。 、これには 128 文字しか含まれていません。一方、 ISO 8859-1および Unicode では、「é」の番号は 233 です。 「€」文字は ISO 8859-1 には存在しません。一方、Unicode では、「€」には 8364 という数値が与えられました。この最後の数値は、8364 を基数 2 (10000010101100) で表すのに 14 ビットかかるため、単一バイトでエンコードすることはできません。
コンピュータ文字を使用すると、より複雑な書式設定 (フォントの種類、色、文字サイズなど) を必要とせずに、スペースや改行を使用して生のテキストを直接表すことができます。特殊文字は、1990 年代以前は主にコンピュータ ハードウェア(端末やプリンタ) で使用されており、テキスト モードでのみ機能していました。
文字を画面に表示したり、プリンタで印刷するには、文字の正確なデザイン、つまりグリフを指定するデータが必要です。タイポグラフィと同様、同じ文字ファミリーからの一連のグリフはフォントまたはタイプフェイスと呼ばれます。
非常に多くの場合、コンピューターは単語、文章、段落全体を処理します。一連の文字を表すデータ型があり、それが文字列です。
