« Linuxで突然キー入力が受け付けられなくなる問題の対策 | Main | puttyをタブモードで使う »

May 31, 2011

全角カタカナが含まれているファイルを探し出すスクリプト

携帯サイトを作っている際、全ての全角カタカナを半角カタカナに置き換えるために、全角カタカナが含まれているファイルを一気に洗い出したいと思うことがあります。しかしネット上で検索しても自分的にしっくりくる方法がみつかりませんでした。

そこで今回非常に簡単なスクリプトを作ってみました。スクリプトを見ていただければわかりますが、実現方法としてはかなり恥ずかしい部類とは言えます。が、この方法以外思いつかなかったのと、こんなスクリプトでもきっと役に立つ人がいると思い恥を忍んで公開してみます。(注:調べたいファイルの文字コードがUTF-8ならUTF-8で保存するようにしてください)

※もしスマートな解決方法をご存じな方がいらっしゃいましたらコメントいただけたら嬉しいです。

#!/bin/bash

pushd /var/www/html/
grep "ア" *.html > tmp
grep "イ" *.html >> tmp
grep "ウ" *.html >> tmp
grep "エ" *.html >> tmp
grep "オ" *.html >> tmp
grep "カ" *.html >> tmp
grep "キ" *.html >> tmp
grep "ク" *.html >> tmp
grep "ケ" *.html >> tmp
grep "コ" *.html >> tmp
grep "サ" *.html >> tmp
grep "シ" *.html >> tmp
grep "ス" *.html >> tmp
grep "セ" *.html >> tmp
grep "ソ" *.html >> tmp
grep "タ" *.html >> tmp
grep "チ" *.html >> tmp
grep "ツ" *.html >> tmp
grep "テ" *.html >> tmp
grep "ト" *.html >> tmp
grep "ナ" *.html >> tmp
grep "ニ" *.html >> tmp
grep "ヌ" *.html >> tmp
grep "ネ" *.html >> tmp
grep "ノ" *.html >> tmp
grep "ハ" *.html >> tmp
grep "ヒ" *.html >> tmp
grep "フ" *.html >> tmp
grep "ヘ" *.html >> tmp
grep "ホ" *.html >> tmp
grep "マ" *.html >> tmp
grep "ミ" *.html >> tmp
grep "ム" *.html >> tmp
grep "メ" *.html >> tmp
grep "モ" *.html >> tmp
grep "ヤ" *.html >> tmp
grep "ユ" *.html >> tmp
grep "ヨ" *.html >> tmp
grep "ラ" *.html >> tmp
grep "リ" *.html >> tmp
grep "ル" *.html >> tmp
grep "レ" *.html >> tmp
grep "ロ" *.html >> tmp
grep "ワ" *.html >> tmp
grep "ヲ" *.html >> tmp
grep "ン" *.html >> tmp
grep "ー" *.html >> tmp
sort tmp | uniq > tmp2
cat tmp2
rm -f tmp
rm -f tmp2
popd

|

« Linuxで突然キー入力が受け付けられなくなる問題の対策 | Main | puttyをタブモードで使う »

雑記・コラム」カテゴリの記事

Comments

こういうのはいかがでしょうか?

grep -Rn [ァ-ヶ] /var/www/html/

全角全て対象なら

[0-9A-z、-◯ぁ-んァ-ヶ亜-腕弌-熙]

でOKなはずです

Posted by: kota | May 31, 2011 at 04:25 PM

kotaさん、コメントどうもありがとうございました。

以前試したときはその方法うまくいかなかったのですが、今思えばSSHクライアントの文字コード設定の問題かも、と思ってきました。また機会があったら試してみたいと思います。

Posted by: sanonosa | June 05, 2011 at 06:16 PM

Post a comment



(Not displayed with comment.)




TrackBack

TrackBack URL for this entry:
http://app.cocolog-nifty.com/t/trackback/32004/51816807

Listed below are links to weblogs that reference 全角カタカナが含まれているファイルを探し出すスクリプト :

« Linuxで突然キー入力が受け付けられなくなる問題の対策 | Main | puttyをタブモードで使う »