シェープファイルとは
シェープファイル(Shapefile)は、
地理情報システム(GIS)において、地理空間データを保存・交換するためのオープンなファイル形式です。1990年代初頭にArcView Ver2で導入されて以来、様々なGIS
ソフトウェアで広く利用されています。
特徴
シェープファイルは、主に以下の特徴を持ちます。
ベクタ形式: ポイント、ライン、ポリゴンといった幾何学的な形状で空間要素を表現します。
属性情報: 各形状要素には、名称や温度などの任意の属性情報を付与できます。
ファイル構成: 複数のファイルで構成され、.shp、.shx、.dbfの3つのファイルが必須です。
相互運用性: 異なるGIS
ソフトウェア間でのデータ交換を容易にします。
ファイル構成
シェープファイルは、複数のファイルが組み合わさって構成されています。
必須ファイル
.shp (シェープ規格): 地形情報の本体となるファイルで、幾何学データ(ポイント、ライン、ポリゴン)が格納されています。
.shx (シェープインデックス規格): 地形データの検索を高速化するためのインデックスファイルです。これにより、.shpファイル内の特定のレコードに効率的にアクセスできます。
.dbf (属性規格): 各シェープに対する属性情報を、dBASE IV形式のテーブルで格納します。
オプションファイル
シェープファイルには、必要に応じて以下のオプションファイルも含まれます。
.prj (投影規格): 座標系や投影情報をWell-known text形式で記述したファイルです。
.sbn/.sbx (空間インデックス): 空間的な検索を高速化するためのインデックスファイルです。
.fbn/.fbx (読み取り専用空間インデックス): 読み取り専用の空間インデックスファイルです。
.ain/.aih (属性インデックス): テーブル内のアクティブフィールドの属性インデックスファイルです。
.ixs/.mxs (ジオコーディングインデックス): ジオコーディングのためのインデックスファイルです。
.atx (DBF属性インデックス): DBFファイルの属性インデックスファイルです。
.shp.xml (XMLメタデータ): ISO 19115などのXMLスキーマ形式で記述された地理空間メタデータファイルです。
.cpg (コードページ): .dbfファイルで使用されている文字コードを指定するファイルです。
各ファイルは、シェープの順序が対応しており、例えば.shpファイルの最初のレコードは、.shxと.dbfの最初のレコードに対応します。
シェープ規格 (.shp)
.shpファイルは、固定長のヘッダーと、可変長のレコードで構成されています。各レコードは、レコードヘッダーとレコード本体から成り立ちます。
ヘッダー
ヘッダーは100バイトの固定長で、ファイルの種類、ファイル長、座標範囲などの情報が含まれています。
レコード
レコードは、レコードヘッダーとレコード本体で構成されます。
レコードヘッダー: レコード番号とレコード長の情報が含まれます。
レコード本体: シェープの種別(ポイント、ライン、ポリゴンなど)に応じたデータが格納されます。2次元座標の順序は(X, Y)または(東西座標, 南北座標)の順で、3次元のZ座標(標高)や4次元のM座標(測定値)も格納できます。
シェープインデックス規格 (.shx)
.shxファイルは、.shpファイル内のレコード位置を記録したインデックスファイルです。各レコードは8バイトの固定長で、レコード位置と内容長で構成されます。
これにより、.shpファイル内の特定のレコードを高速に検索できます。
属性規格 (.dbf)
.dbfファイルは、dBASE形式で各シェープの属性情報を格納します。XBase形式も代替として使用できます。
投影規格 (.prj)
.prjファイルは、シェープファイルの座標系や投影情報を指定します。Well-known text(WKT)形式で記述されることが一般的です。このファイルは、空間データの正確な位置情報を保証する上で重要な役割を果たします。
空間インデックス規格 (.sbn)
.sbnファイルは、空間検索を効率化するためのインデックスファイルです。主にEsriのソフトウェアで使用されています。リバースエンジニアリングにより形式が公開されましたが、他のベンダーでの実装は一般的ではありません。
制限事項
シェープファイルには、以下のような制限事項があります。
空間表現: ポリラインや
ポリゴンの形状は、頂点の連続で表現されるため、滑らかな曲線を表すためには多くの頂点が必要になります。スプライン曲線などの効率的な曲線表現はサポートされていません。
データ容量: .shpと.dbfファイルのサイズには、最大2GBの制限があり、ポイント数にも限りがあります。
.dbf形式: 属性データベース形式は旧式のdBase標準に基づいているため、機能に制限があります。
*
異種形式の混在: 同一ファイル内に異なる形状種別を混在させることは可能ですが、推奨されていません。例えば、ポイント、ライン、
ポリゴンは別々のファイルに格納する必要があります。
まとめ
シェープファイルは、GISにおける重要なデータ形式であり、その構造を理解することでより効果的なデータ管理と分析が可能になります。データの相互運用性を高める上で重要な役割を担っていますが、いくつかの制限事項も理解しておくことが重要です。