ヒストグラム

ヒストグラムとは



ヒストグラムとは、データの分布を視覚的に表現するための統計グラフで、通常は縦軸に度数、横軸に階級(区間)を取ります。この図は観察結果を一定の区間に分類し、それぞれの区間に含まれるデータの数を棒(ビン)として表示します。日本では、ヒストグラムは柱状図、度数分布図とも呼ばれ、特に統計学や数学、画像処理において頻繁に使用されます。

このグラフは、特に工業分野においては品質管理のための「QC七つ道具」の一つとして位置づけられています。他のQCツールには、パレート図、散布図、特性要因図などがあります。ヒストグラムは、データの偏りや分布の特性を理解するのに役立ちます。

ヒストグラムの語源



「ヒストグラム」という用語は、古代ギリシャ語の「ἱστός(イストス)」と「γράμμα(グラマ)」が組み合わさった言葉で、「何かを直立にする」と「描く・記録する」という意味を持ちます。この用語は、イギリス統計学者カール・ピアソンが1891年に「historical diagram」を基に創案したとも言われています。

ヒストグラムの定義



日本工業規格のJIS Z 8101-1:2015によると、ヒストグラムは「底辺の長さが級の幅に等しく、その面積が級の度数に比例する近接する長方形からなる度数分布のグラフ表現」と定義されています。場合によっては、階級の幅が不均一なとき、面積を度数に比例させることが推奨されています。一般的には、全ての級の幅を等しく設定し、長方形の高さを級の度数に比例させて表現します。

ヒストグラムの実用



ヒストグラムを作成する層には、階級の幅や数をいかに設定するかが重要です。階級の幅は通常、データ数の平方根を基準に決定したり、その他の経験則に基づいて決められたりします。例えば、階級の数は経験則により設定し、適切な幅を見つけることが求められます。このため、異なるデータセットによって最適な階級の設計が変わることがあります。

また、累積度数図は特定の階級に含まれる観察結果の累積数を記録したもので、ヒストグラムからも独立して利用されます。これを用いることで、データの変化や特定の条件に対する観察の総数を把握できます。

ヒストグラムの種類



ヒストグラムには様々な分布型があり、代表的なものには以下のようなものがあります。
  • - U字型分布: 両サイドが低く中央が高い形状。
  • - 均一分布: すべての区間における度数がほぼ同等。
  • - 山型分布: 中央の区間の度数が最大。
  • - 歪曲分布: 一方に傾いた形状。左(右)歪曲分布に分類されます。

それぞれの分布型はデータの特性を反映し、データ解析時の重要な情報を提供します。

具体例



たとえば、ある記事の閲覧回数を元にヒストグラムを作成する場合、まずはデータを集計し、階級幅及び階級数を決定します。階級幅を100、階級数を8とした時のヒストグラムは、特定の範囲に属するデータ数を視覚化するための有効な手法です。データの分布を理解することで、適切な意思決定に繋がるでしょう。

このように、ヒストグラムはデータを理解するための重要な道具であり、さまざまな分野で活用されています。そのため、基礎的な概念を理解し、実際にヒストグラムを作成する練習を行うことが推奨されます。

もう一度検索

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。