文字コードの変換

文字コードを変換したいときはコマンド iconv を用いる。アイコンブと読む。Shift_JIS のテキストファイル foo.txt を UTF-8 に変換したいときは以下のようにする。bar.txt は文字コード変換後のファイル名。

1|$iconv -f sjis -t utf8 foo.txt > bar.txt

オプション -f にて変換させるファイルの現在の文字コードを指定する。また、-t にて変換させたい文字コードを指定する。ファイルの文字コードは nkf コマンドで確認できる。以下のように打つ。

1|$nkf -g foo.txt

コマンド iconv のオプションには以下のものがある。

OptionDescription
-fインプットファイル (変換したいファイル) の文字コードの指定
-t変換したい文字コードを指定
-lサポートされている文字コードの一覧表示
-c無効な文字を変換しない
-s警告を出させない
--verbose変換の進捗状況を表示

また,nkf を用いても文字コードの変換ができる。テキストファイル foo.txt を UTF-8 に変換したいときは以下のようにする。bar.txt は文字コード変換後のファイル名。

1|$nkf -w foo.txt > bar.txt

コマンド nkf のオプションには以下のものがある。

OptionDescription
-e文字コードを EUC に変換
-s文字コードを Shift_JIS に変換
-w文字コードを UTF-8 に変換
-g文字コードを推測する
このエントリーをはてなブックマークに追加

Site search

ページのトップへ戻る