一次任务执行过程
有一個任務,需要我查出日志文件里,訪問了a4.shuqi.com域名的來源
zcat *.gz | awk '$9=="a4.shuqi.com"{print$0}' > aaa cat aaa | awk '{print $16}' > refer.txt cat refer.txt | awk '{a[$1]++} END{for(i in a) print i,a[i]}' | sort -k 2nr > refer_new.txt總共查出36968條符合要求的日志,再排查他們的來源,但是有35745顯示無來源,我去,這怕是有問題,因此我在我來源字段($16)前后進行探測,看看自己是否選錯字段,或者日志文件是否有多種類型,以至于在這個位置不是來源
cat aaa | awk '$16=="\"-\""{print $15}' > error.txt cat aaa | awk '$16=="\"-\""{print $17}' > error.txt cat aaa | awk '$16=="\"-\""{a[$17]++} END{for(i in a)print i,a[i]}' | sort -k 2nr > error.txt$15都是數字,因此無疑問,$17有顯示為http://www.haodewap.com的字段,但是數量不多,23條,其他都是UA信息,再把這23條的詳細日志打出來看
cat aaa | grep "haodewap.com" | wc -l cat aaa | grep "haodewap.com"檢查一遍,原來應該是UA的部分填上了這個網址,應該是訪問者有意為之,無異常,因此才可以確認那35745真的無來源
Apr 15 23:46:13 ppcn-11-186 nginx: 1397576773.634 2014-04-15T23:46:13+08:00 117.135.163.240 a4.shuqi.com - "GET /bc_rank.php?session=guest1357150964887&v=2&uat=10966&cid=4&item=allclick&page=3 HTTP/1.1" 200 14406 "-" "http://haodewap.com/ 1.3" "-" - 0.039?
轉載于:https://www.cnblogs.com/code-style/p/3673744.html
總結
- 上一篇: 悟透JavaScript (强烈推荐)
- 下一篇: 命令拷屏之系统信息