文字コード

[Linux] ファイルの行数や文字数をカウントする - wc

ファイルの文字数や行数を簡単にカウントできるのがwcコマンドです。 恐らく「Word Count」の略称で、ワールドカップでもトイレでもありませんw 以下のように調査したいファイルのパスを渡すと、ファイルの行数、単語数、バイト数を表示してくれます。 $ wc…

[Linux] 文字コードを変換する

Linux上で文字コードを変換するコマンドといえば、nkfとiconvの2つ。よく忘れるので備忘録がてらオプションと使い方をメモしておきます。 nkf 実行例1 - 出力する文字コードを指定 入力側の文字コードは自動で判定してくれますので、出力側の文字コードをオ…

[Linux] 文字コードを調べる

指定したテキストファイルの文字コードをLinuxではnkfコマンド、またはfileコマンドで確認することができます。 $ nkf --guess foo.txt UTF-8 (LF) $ file foo.txt foo.txt: UTF-8 Unicode text よく忘れるのでメモ。 iconvは変換だけで表示はしてくれないみ…

文字列を文字コードへ変換する - Perl

「Perl大技林」一覧に戻る 「文字」を文字コードへ変換するにはord関数を用いれば良いが、「文字列」の場合はどうすれば良いのだろうか?ord関数の使い方を工夫してやれば良い。 単純に1byteずつ置換してやれば良い。この置換時にord関数を用いることになる。