Linuxコマンド辞典 iconvコマンド(テキスト処理)
ファイルの文字コードを変換する「iconv」コマンドの概要と使い方を記載しています。
RHEL Fedora CentOS Vine Deblan Ubuntu Plamo
参考サイト:Man page of INSTALL
概要・使用方法
入力ファイルの文字コードを変換して標準出力に出力します。入力ファイルが指定されいない場合は標準入力、出力ファイルを-oオプションで指定しない場合は標準出力を利用します。入力文字コードの指定がない場合は現在のロケール文字エンコード、出力文字コード指定がない場合は現在のロケール文字エンコードを利用します。
書式
$ iconv [オプション] [入力ファイル名]
オプション
-f 文字コード –from-code 文字コード | 変換前の文字コードを指定する |
-t 文字コード –to-code 文字コード | 変換して出力したい文字コードを指定する |
-l –list | 扱える文字コードを一覧で表示する |
-o 出力ファイル名 –output 出力ファイル名 | 変換後の出力ファイル名を指定する |
文字コードを調べる
扱える文字コードを一覧で表示します。
$ iconv --list
実行結果
[sunarin@localhost work]$ iconv --list
以下のリストには、全ての既知の文字集合が含まれています。これらの名前は
コマンドラインパラメータの FROM と TO の全ての組み合わせとして使用出来
るとは限りません。ある文字集合は複数の異なった名前 (別名、alias) で
リストされています。
437, 500, 500V1, 850, 851, 852, 855, 856, 857, 858, 860, 861, 862, 863, 864,
865, 866, 866NAV, 869, 874, 904, 1026, 1046, 1047, 8859_1, 8859_2, 8859_3,
8859_4, 8859_5, 8859_6, 8859_7, 8859_8, 8859_9, 10646-1:1993,
10646-1:1993/UCS4, ANSI_X3.4-1968, ANSI_X3.4-1986, ANSI_X3.4,
ANSI_X3.110-1983, ANSI_X3.110, ARABIC, ARABIC7, ARMSCII-8, ASCII, ASMO-708,
ASMO_449, BALTIC, BIG-5, BIG-FIVE, BIG5-HKSCS, BIG5, BIG5HKSCS, BIGFIVE, BRF,
BS_4730, CA, CN-BIG5, CN-GB, CN, CP-AR, CP-GR, CP-HU, CP037, CP038, CP273,
CP274, CP275, CP278, CP280, CP281, CP282, CP284, CP285, CP290, CP297, CP367,
文字コードを変換する
扱える文字コードを一覧で表示します。
$ iconv -f 変換前文字コード -t 変換する文字コード 変換元ファイル > 出力ファイル
実行結果
Windowsで作成したshift-jisコードのUTF-8へ変換する
[suna@engraku work]$ cat shift-jis.txt
abcdefg
[suna@engraku work]$ iconv -f shift-jis -t utf8 shift-jis.txt >utf8.txt
[suna@engraku work]$ cat utf8.txt
abcdefg
あいうえお
[suna@engraku work]$