幹葉表示(stem-and-leaf display)
幹葉表示は、定量データを視覚的に表現するインフォグラフィックの一つで、
確率分布を示す手法です。この手法は
ヒストグラムに似ていますが、数値が昇順に整列し、データの相対的な密度や形状を把握しやすくします。
ヒストグラムと異なり、幹葉表示はより詳細な情報を保持しながら分布を視覚化することが可能です。
表示方法
幹葉表示は、二つの列から構成されており、左側に「幹」が、右側に「葉」が示されます。幹は数値の先頭の桁を表し、葉はその数値の下位桁を表します。通常、葉には一番小さな桁(最小の1桁)が含まれ、幹には残りの桁数が含まれます。例えば、以下のような
観測データがあるとします。
```
44 46 47 49 63 64 66 68 68 72 72 75 76 81 84 88 106
```
このデータを昇順に並べ替えた後、次のように幹葉表示を作成します。
```
4 | 4 6 7 9
5 |
6 | 3 4 6 8 8
7 | 2 2 5 6
8 | 1 4 8
9 |
10 | 6
```
この例では、幹は十の位を表し、葉は一の位を示しています。したがって、4の左側の列に4と6・7・9が記載されています。また、同じ数値が複数存在する場合(この例では72)、それも省略すること無く表示します。
四捨五入と負数の利用
幹葉表示は四捨五入を用いることができます。例えば、以下の数値に負数や小数点数が含まれる場合、負数は正数の前に配置され、小数点以下は適宜丸められます。
```
- -23.678758, -12.45, -3.4, 4.43, 5.5, 5.678, 16.87, 24.7, 56.8
```
これに基づく幹葉表示は次のようになります。
```
0 | 4 6 6
1 | 7
2 | 5
3 |
4 |
5 | 7
```
この場合、-2の幹に4の葉がついており、-1の幹には2が対応しています。これにより、データを視覚的に把握することができます。
利用のメリット
幹葉表示は、データ分析や
統計学において非常に有用です。特に、データの分布状況を把握したり、出現頻度の高い値を特定したりする際に効果的です。また、この表示方法は
外れ値を見つけるのにも便利です。幹葉表示は、比較的中程度のデータ点(15〜150程度)において最も適していますが、データ点が非常に少ない場合にはあまり役立ちません。そのため、データ点が少ない場合は
ドットプロットを使用した方が良いでしょう。一方、大量のデータ点を処理する際には、幹葉表示は煩雑になりがちで、このような場合には
箱ひげ図や
ヒストグラムがより適しています。
これらの特性をうまく利用することで、データの分析や視覚化をより効果的に行うことができます。幹葉表示は、定量データの広範な理解を深める重要な手法の一つとして広く利用されています。