VI-I
要有光,太阳的光是不够的,必须有心灵之光。
something about life and web develop.
Friday, August 15, 2014
预加载 JavaScript
(new Image()).src = url;
不过发现 Chrome 里,Image 请求会添加特殊的 Accept 头,导致后续实际创建 script tag 的时候浏览器会重新发送 Http 请求。
尝试搜索了一下,发现有人创建 object 对象,设置 data 来解决这个问题,不过,如何得知 onload 呢?
有待继续研究。
Tuesday, November 29, 2011
使用nginx记日志
做web服务和应用的时候,很多场景下需要记录日志。
如 访问日志,性能分析日志,打点日志,数据统计日志等。
假设有以下主机设置
<code>
server {
listen 80;
server_name abc.cc;
root /etc/www/abc;
access_log /var/log/www/abc/access.log;
location / {
index index.htm index.htm;
}
}
</code>
默认情况下,access_log 会使用 combined 的配置来记录访问日志
<code>
log_format combined '$remote_addr - $remote_user [$time_local] '
'"$request" $status $body_bytes_sent '
'"$http_referer" "$http_user_agent"';
</code>
通常这样就足够了。
如果是为了更加方便的日志分析,通常我们会使用特殊字符(如 ^A) 来作为日志字段的分隔符,
这样无论是过滤还是排序都会十分方便。甚至可以直接导入 mysql/hive 中,使用强大的 sql 来做查询分析。
为了排版方便,所有特殊字符都使用了展开的写法,请自行替换 ^A 为 ctrl+v,ctrl+a (nginx 日志格式不支持 \1 的写法)。
自定义日志格式:
<code>
server {
listen 80;
server_name abc.cc;
root /etc/www/abc;
# 更多日志可用字段(基本上都是 nginx 的变量),见
# http://wiki.nginx.org/NginxHttpLogModule#log_format
# http://wiki.nginx.org/NginxHttpUpstreamModule#Variables
# http://wiki.nginx.org/NginxHttpCoreModule#Variables
log_format abc "$remote_addr^A$remote_user^A$time_local^A$request_method^A$uri^A$args^A$server_protocol"
"^A$status^A$body_bytes_sent^A$http_referer"
"^A$http_user_agent";
access_log /var/log/www/abc/access.log abc;
location / {
index index.htm index.htm;
}
}
</code>
当把日志使用 ^A 分割以后,后续就可以使用 sort 和 grep 之类工具对特定url做分析了,
比如统计各url请求量倒排取前50个
<code>
awk -F^A '{print $5}' /var/log/www/abc/access.log | sort | uniq -c | sort -nr | head -50
</code>
有时候可能想对记录的字段做一些处理,比如 $arg_q 可能是搜索关键词,记录的时候如果 unescape 一下,
会更方便分析,存储上也会更小,
那么可以使用 NginxHttpSetMiscModule 模块提供的指令( http://wiki.nginx.org/NginxHttpSetMiscModule#set_unescape_uri )实现:
<code>
set_unescape_uri $q $arg_q;
log_format abc "$q";
</code>
有时候,我们需要对字段做 hash 转换,可以使用 HttpMapModule 提供的功能(http://wiki.nginx.org/HttpMapModule)
<code>
# 需要放到 http 里面,不能放到 server 里 :)
# 根据 url 地址计算分类,便于后续统计
# 具体根据需求做变换就好了
# 第一列是匹配规则,后面的是赋值 ~ 开头的匹配规则是正则
map $uri $typ {
default -;
~/login user;
~/my user;
~/static static;
}
log_format abc "$typ^A$uri";
</code>
如果使用 nginx 比较多,可能会尝试使用 if ,建议不要使用,因为nginx的if比较让人混乱。
如果有更多复杂的字段处理需求,可以使用 ngx_lua (http://wiki.nginx.org/HttpLuaModule)。
ngx_lua 里面操作 nginx 变量
<code>
# 实现上面 map 类似的功能
# 用法详见 http://wiki.nginx.org/HttpLuaModule#set_by_lua
# lua 语法见 http://www.lua.org/manual/5.1/manual.html#2.4
set_by_lua $typ "
local uri = ngx.var.uri
local _m = string.match
local v = '-'
if _m(uri, '^/login') then
v = 'user'
elseif _m(uri, '^/my') then
v = 'user'
elseif _m(uri, '^/static') then
v = 'static'
end
return v
";
</code>
某些情况下,可能我们的字段处理需要查询缓存(如redis)、数据库(如mysql)等,
这些都是可以使用 ngx_openresty 高效完成的(http://openresty.org/)。
这些功能就不在这一篇详细描述了,后续篇章会补充这些功能。
再描述一些复杂的日志记录功能吧。
有时候我们希望根据请求,来判断是否需要记录这一条日志。
在web的访问日志中这种需求比较少,但是独立的日志收集服务器一般有这样的需求的。
比如我需要判定,请求参数 arg_id 必须存在且为数字的时候我才记录日志,可以这样实现
<code>
server {
listen 80;
server_name abc.cc;
root /etc/www/abc;
log_format abc "$msec^A$args^A$q^A$ie^A$oe^A$ref"
"^A$http_user_agent";
access_log off;
location / {
# 专门记日志的服务,对非合法请求,直接断开连接 或者根据需求302到自己的站点
# 但是这种302一般不会被用户看到 可以综合考虑做法
# 444 的意义见 http://wiki.nginx.org/HttpRewriteModule#return
return 444;
}
location = /i-log {
internal;
set_unescape_uri $q $arg_q;
set_unescape_uri $ie $arg_ie;
set_unescape_uri $oe $arg_oe;
set_unescape_uri $ref $arg_ref;
# 这个很重要,否则不会记录的
log_subrequest on;
access_log /var/log/www/abc/access.log abc;
# 这个指令需要 HttpEchoModule (http://wiki.nginx.org/HttpEchoModule#echo) 的支持
# 因为这个地址只是为了辅助记录日志,所以不需要返回内容
echo '';
}
location = /1.gif {
default_type image/gif;
access_log off;
access_by_lua "
local q = ngx.var.arg_q
if q then
q = ngx.unescape_uri(q)
if q and #q > 0 then
ngx.location.capture('/i-log?' .. ngx.var.args)
end
end
";
# 这种请求一般不缓存
add_header Expires "Fri, 01 Jan 1980 00:00:00 GMT";
add_header Pragma "no-cache";
add_header Cache-Control "no-cache, max-age=0, must-revalidate";
# 一般独立记录日志的请求,都会返回一张 1x1 的空白gif图
empty_gif;
}
}
</code>
利用这个特性,我们甚至可以合并多个记录为1个http请求,在 ngx_lua 内再将多条记录拆分记录到日志文件
比如上例,我门可以添加一个字段 n 来标识有几条记录,并且给 q 之类的参数编号 q_1 .. q_n 。
<code>
# GET /1.gif?n=2&q_1=a&q_2=b&ie=gbk&oe=utf8&ref=
# 其他代码不变,只修改 1.gif 的 access_by_lua 为以下代码
local n = ngx.var.arg_n
if n then
n = tonumber(n)
if n > 0 then
local logs = {}
local prefix = string.format('/i-log?ie=%s&oe=%s&ref=%s&q=', ngx.var.arg_ie, ngx.var.arg_oe, ngx.var.arg_ref)
while n >= 1 do
-- 这里可以对 q_n 做进一步的校验,看是否需要记录下来
table.insert(logs, {prefix .. (ngx.var['arg_q_' .. n] or '')})
n = n - 1
end
-- 见 http://wiki.nginx.org/HttpLuaModule#ngx.location.capture_multi
ngx.location.capture_multi(logs)
end
end
</code>
如果请求量较大,一把需要添加写buffer,
方式为在每条 access_log 后面添加 buffer=32k 这样的设置(见 http://wiki.nginx.org/NginxHttpLogModule#access_log)
缓存的大小可以设置成 可以忍受丢失的记录数*每条记录的size
至此,各种记录功能都完成啦。
日志服务其他必要的功能,就是日志轮转了。
nginx 日志轮转的原理是
# 启动nginx收日志
# 启用cron任务
## 将日志文件move走 (文件名可以带上时间戳)
## 给 nginx master 进程发送 USR1 信号(nginx就会重新打开新的日志文件)
### 否则,日志会仍然记录到之前的日志文件中,虽然被 move 了
## cron 的频度可以根据日志大小调整,尽可能大些,能以天为单位就不要以半天为单位
具体实现可见 http://jk.aiwaly.com/wp/nginx-cut-log.html
以上操作中涉及较多 nginx 扩展模块,如果不想折腾,可以使用 ngx_openresty (http://openresty.org)
如果是淘宝系的同学,可以旺旺联系 定球 ,我们有现成的 rpm 可以使用:)
使用中有任何问题,欢迎发信到 kindy61 <at gmail> 或者 微博 @定球呀球
Tuesday, November 1, 2011
shell 下进行url编码解码
echo '测试' | perl -MURI::Escape -pe '$_ = uri_escape($_)'
echo '测试' | perl -MURI::Escape -pe '$_ = uri_escape($_)' | perl -MURI::Escape -pe '$_ = uri_unescape($_)'
:)
Thursday, October 27, 2011
nfs 网络共享基础设置
客户端一般临时使用 mount 即可,如果需要长久使用 修改 /etc/fstab 加入到自动设置里面。
假设服务器的ip为 192.168.1.123 修改 /etc/exports ,在后面添加
/home/abc/share 192.168.1.0/16(ro,async) 192.168.0.0/16(ro,async)
然后确认 $ ps aux|grep nfs 是否启动了,一般使用 $ /etc/init.d/nfs status 来确认是否运行
使用 $ /etc/init.d/nfs start 来启动服务,
这样,所有ip段在 192.168.1.x 的用户都可以使用
sudo mount -t nfs 192.168.1.123:/home/abc/share ./abc-share
来映射这个目录
如果想以后每次自动挂上这个目录,在客户端的 /etc/fstab 文件的最后添加
192.168.1.123:/home/abc/share /home/cde/abc-share nfs ro,async 0 0
just enjoy it.
Saturday, May 7, 2011
Saturday, April 2, 2011
vim 的 sort 和系统的 sort
Tuesday, March 8, 2011
ngx_openresty系列之 ngx_lua vs. node.js
Thursday, February 10, 2011
下雪了
发现下雪了,
虽不至若狂,却很是欣喜。
转又发现很多铲雪的声音和身影,
遂想,为何这会带来烦恼的雪,
会让我觉得欣喜呢?
或者是太久低迷的心情,
因为这雪而释放了。
或者是听到广播里太多的话语,
抱怨这没有雪的冬天太不像样,
现在终于下雪了,连我也感受到了这像样的冬天了
——没有雪的冬天是不完整的冬天。
早早的来到公司,
一个人静静的看窗外细碎的雪花飘舞,
无论是发呆还是遐想,
都是很不错的。
忽然想起,
19、20交际的时候,
有帮文人开始积极的探索改革,
期望能够帮助当权政府改善,
然而他们失败了,
看来即使所谓的头头想要改变,
也是困难的,
为什么呢,
可能是牵涉到的利益群体太多,
而这些利益群体又是极其重要和关键的,
比如人家有一切维护和保障权力的资格和能力。
人家反对,
当然很难做出什么实质性的改变了。
所以就导致人们出来抗议,
干脆我们重新洗牌,
总能碰到一手好牌吧。
也许社会就是这样,
就像一场牌局。
当前执政的人,就像我们的牌。
也许初抓到一首烂牌,
但只要运气好,技术好,
慢慢的也会翻势。
只是社会这场是永没有结束的牌局,
可以重新抓,只是永远打不完。
而所有的民众就是打牌的人,
随着打的越久,
也许技巧就越高,
大家只是在每一局里面不断的调整手里的牌,
保持一个良好的状态,
可是,却永远没法赢。
好牌放在手里只是一种感觉,
因为你既不会输,也不会赢。
你要做的也许只是陪着大家打牌。
雪还在下着,
心情却不如刚才那般明亮了。
何苦呢。