導入

ロングテールという用語は、2004 年に Chris Anderson がWired の記事で、Amazon や Netflix など、多数の製品を少量ずつ販売する企業の市場の一部を表すために初めて使用しました。統計でも、多くの場合分布に関連して使用されます。

統計理論におけるロングテール

ロングテールは、統計学者に古くから知られている現象 (ジップの法則、パレート分布、レヴィ分布) を表す一般的な表現です。統計学で最も使用される法則である正規法則は、その形状から一般にガウスベルと呼ばれていますが、その狭い尾部のために一部の用途で批判されています。たとえば、金融では、この狭い尾部は極端な変動の過小評価に対応し、レプトクルティック(文字通り尾が細い) と呼ばれる新しいモデルは、この問題を解消しようとしています。この現象は、ロングテール、べき乗則テール、またはパレートテールとしても知られています。これらの分布は通常、反対に示された形式になります。
これらの分布では、高頻度または高振幅の集団の後に低頻度または低振幅の集団が続き、徐々に減少して「尾部」になります。非常に多くの場合、グラフの黄色の部分で表される、頻度が低いイベントまたは振幅が低いイベント (ロングテール) は、合計すると、グラフの最初の部分よりも大きな重みまたは数を表す可能性があります。
このような分布は驚くほど一般的です。たとえば、日常英語ではtheという単語が最も一般的です。 ofやtoなどの他の短い単語も非常に一般的であり、他の一般的な単語よりもはるかに一般的です。たとえば、 「the」という単語は使用されている単語の 12% を占めますが、「 barrack 」という単語は 50,000 件に 1 件未満しか出現しません。しかし、蓄積すると、バラックのような珍しい単語がテキストの約 3 分の 1 を占めます。これらの珍しい単語は、英語の語彙のロングテールです。
保管および流通コストとの関係
企業の売上がロングテール モデルを使用できるかどうかを決定する重要な要素は、保管と流通のコストです。これらのコストが低い場合、需要の少ない製品を販売することで利益が得られます。保管や流通にコストがかかると、最も人気のある製品だけが販売されます。
重要な例はビデオレンタル事業です。従来のレンタル ストアは棚スペースの長さによって制限されており、そのスペースを家賃という形で支払います。商品を最大限に活用するには、すべてのスペースが有効に活用されるように、最もリクエストの多いタイトルのみを表示する必要があります。それとは対照的に、Netflix は集中倉庫を備えているため、保管コストを削減できます。人気のある映画であろうと需要のない映画であろうと、配給コストは同じです。したがって、Netflix は従来のストアよりもはるかに多くのカタログを保有することで利益を得ることができます。したがって、高度な保管または配給ロジスティクスにより、人気のある映画よりも限られた視聴者に対してより多くの映画をレンタルすることが可能になります。
