wcコマンド(Word Countの略)は、
UNIX系
オペレーティングシステムで利用されるコマンドの一つです。このコマンドは、テキストファイルや標準入力からデータを読み込み、その内容に関する統計情報を生成します。
基本的な機能
wcコマンドの主な機能は、以下の統計情報を出力することです。
行数: テキストファイルに含まれる改行文字の数を数えます。これは、ファイルの行数を示す指標となります。
単語数: ファイル内の単語の数を数えます。空白やタブなどの区切り文字で区切られた文字列を単語として認識します。
バイト数: ファイルのバイト数を数えます。テキストファイルのサイズをバイト単位で把握できます。
文字数: ファイルに含まれる文字数を数えます。特に、
Unicodeの多バイト文字を扱う際に、バイト数と文字数の違いが重要になります。
これらの統計情報は、テキストデータの分析や管理に役立ちます。
wcコマンドの使用例
以下は、wcコマンドの実行例です。
bash
$ wc ideas.txt excerpt.txt
40 149 947 ideas.txt
2294 16638 97724 excerpt.txt
2334 16787 98671 total
この例では、`ideas.txt`と`excerpt.txt`という2つのファイルを指定しています。出力結果は、それぞれのファイルに関する行数、単語数、バイト数を示し、最後に全てのファイルの合計を表示します。
バイト数と文字数の区別
最近のwcコマンドでは、バイト数と文字数を区別して表示できるようになりました。これは、
Unicodeの多バイト文字を扱う場合に重要です。例えば、日本語の文字は複数バイトで表現されるため、バイト数と文字数が異なる場合があります。`-c`オプションでバイト数を、`-m`オプションで文字数を指定できます。
オプション
wcコマンドは、様々なオプションを指定できます。
`-l`: 行数を表示します。
`-c`: バイト数を表示します。
`-m`: 文字数を表示します。
`-L`: 最長行の長さを表示します(GNU拡張)。
`-w`: 単語数を表示します。
これらのオプションを組み合わせることで、必要な統計情報だけを抽出できます。
wcコマンドの歴史
wcコマンドは、元々はGNU textutilsパッケージに含まれていましたが、現在では
GNU Core Utilitiesの一部となっています。
外部リンク
wc(1) wcコマンドのmanページ JM Project
wc(1) man page(SunOS リファレンスマニュアル)
wc(1) man page(HP-UX リファレンス)