Linuxコマンド辞典 iconvコマンド(テキスト処理)

ファイルの文字コードを変換する「iconv」コマンドの概要と使い方を記載しています。

RHEL Fedora CentOS Vine Deblan Ubuntu Plamo

参考サイト:Man page of INSTALL

概要・使用方法

入力ファイルの文字コードを変換して標準出力に出力します。入力ファイルが指定されいない場合は標準入力、出力ファイルを-oオプションで指定しない場合は標準出力を利用します。入力文字コードの指定がない場合は現在のロケール文字エンコード、出力文字コード指定がない場合は現在のロケール文字エンコードを利用します。

書式

$ iconv [オプション] [入力ファイル名]

オプション

-f 文字コード
–from-code 文字コード
変換前の文字コードを指定する
-t 文字コード
–to-code 文字コード
変換して出力したい文字コードを指定する
-l
–list
扱える文字コードを一覧で表示する
-o 出力ファイル名
–output 出力ファイル名
変換後の出力ファイル名を指定する

文字コードを調べる

扱える文字コードを一覧で表示します。

$ iconv --list

実行結果

[sunarin@localhost work]$ iconv --list
以下のリストには、全ての既知の文字集合が含まれています。これらの名前は
コマンドラインパラメータの FROM と TO の全ての組み合わせとして使用出来
るとは限りません。ある文字集合は複数の異なった名前 (別名、alias) で
リストされています。

 437, 500, 500V1, 850, 851, 852, 855, 856, 857, 858, 860, 861, 862, 863, 864,
  865, 866, 866NAV, 869, 874, 904, 1026, 1046, 1047, 8859_1, 8859_2, 8859_3,
  8859_4, 8859_5, 8859_6, 8859_7, 8859_8, 8859_9, 10646-1:1993,
  10646-1:1993/UCS4, ANSI_X3.4-1968, ANSI_X3.4-1986, ANSI_X3.4,
  ANSI_X3.110-1983, ANSI_X3.110, ARABIC, ARABIC7, ARMSCII-8, ASCII, ASMO-708,
  ASMO_449, BALTIC, BIG-5, BIG-FIVE, BIG5-HKSCS, BIG5, BIG5HKSCS, BIGFIVE, BRF,
  BS_4730, CA, CN-BIG5, CN-GB, CN, CP-AR, CP-GR, CP-HU, CP037, CP038, CP273,
  CP274, CP275, CP278, CP280, CP281, CP282, CP284, CP285, CP290, CP297, CP367,

文字コードを変換する

扱える文字コードを一覧で表示します。

$ iconv -f 変換前文字コード -t 変換する文字コード 変換元ファイル > 出力ファイル

実行結果

Windowsで作成したshift-jisコードのUTF-8へ変換する

[suna@engraku work]$ cat shift-jis.txt 
abcdefg

[suna@engraku work]$ iconv -f shift-jis -t utf8 shift-jis.txt >utf8.txt
[suna@engraku work]$ cat utf8.txt 
abcdefg
あいうえお
[suna@engraku work]$