一个网站的用户访问数据对于网站运营人员来说是非常重要的,如用户是怎样到我的网站的,用户在网站浏览了什么内容,停留了多长时间等数据,很多网站 都会在网站上用上统计的功能,不少站长使用百度统计,站长统计,使用这些统计功能其实很简单,注册百度统计,然后添加网站,通过下载一个文件放到网站根目 录,进行网站认证,也就是认证这个网站是你的,接着将一段JS代码放在网站模板 footer 前,这样用户访问你的网站的相关数据,就可以在百度统计后台看 到了,站长统计也类似。
另外有一些开源的网站流量统计的框架,如Piwik,Piwik 是基于 PHP+MySQL 的,如果要使用 Piwik,得自己搭建服务器,所以要有支持 PHP+MySQL 环境的服务器,安装很简单的,类似 Joomla!、Wordpress。
如果你觉得 Piwik 还不能满足你的要求的话,你可以开发各种插件,现在很多 cms 也开发了支持 Piwik 的插件,Piwik 有一个优点,就是有非常丰富的 API,现在来看看 API。
Piwik 同样也是支持 REST api,相信了解新浪微博开放平台,twitter 开放平台的朋友对 REST api 是非常熟悉的。
在 Piwik 的后台点击API,会有 API 的快速说明文件,有个使用者验证,会有一个 &token_auth 的字符串,这个 token_auth 和你的账号和密码一样重要,千万不要公开,切记。
找到 “Module Actions”,这里有很多API可以调用的,支持 XML,Json,Tsv 等格式,在这里我使用 Json 格式的,体积小,结构清晰。随便找个,如 getPageTitles,点击 Json 格式的,如下图:
打开之后发现链接如下:
http://piwik.chenwg.com/index.php?module=API&method=Actions.getPageTitles&idSite=4&period=day&date=2012-11-22&format=JSON&token_auth=********************* (token_auth比较重要,我没有列出来,用*号表示了。)
页面显示出一堆json格式的数据,将这些json格式的数据格式化一下,如下:
[ { "label": " 寒星晓月", "nb_visits": 3, "nb_uniq_visitors": 3, "nb_hits": 3, "sum_time_spent": 0, "entry_nb_uniq_visitors": "3", "entry_nb_visits": "3", "entry_nb_actions": "3", "entry_sum_visit_length": "0", "entry_bounce_count": "3", "exit_nb_uniq_visitors": "3", "exit_nb_visits": "3", "avg_time_on_page": 0, "bounce_rate": "100%", "exit_rate": "100%" }, { "label": " 最新hosts文件下载(2012.4.15) | 寒星晓月", "nb_visits": 3, "nb_uniq_visitors": 3, "nb_hits": 3, "sum_time_spent": 52, "entry_nb_uniq_visitors": "3", "entry_nb_visits": "3", "entry_nb_actions": "4", "entry_sum_visit_length": "53", "entry_bounce_count": "2", "exit_nb_uniq_visitors": "3", "exit_nb_visits": "3", "avg_time_on_page": 17, "bounce_rate": "67%", "exit_rate": "100%" }, { "label": " Android欢迎界面淡入淡出效果 | 寒星晓月", "nb_visits": 1, "nb_uniq_visitors": 1, "nb_hits": 2, "sum_time_spent": 16, "entry_nb_uniq_visitors": "1", "entry_nb_visits": "1", "entry_nb_actions": "3", "entry_sum_visit_length": "17", "entry_bounce_count": "0", "exit_nb_uniq_visitors": "1", "exit_nb_visits": "1", "avg_time_on_page": 16, "bounce_rate": "0%", "exit_rate": "100%" }, { "label": " extjs 常用基本控件小结 | 寒星晓月", "nb_visits": 1, "nb_uniq_visitors": 1, "nb_hits": 1, "sum_time_spent": 0, "entry_nb_uniq_visitors": "1", "entry_nb_visits": "1", "entry_nb_actions": "1", "entry_sum_visit_length": "0", "entry_bounce_count": "1", "exit_nb_uniq_visitors": "1", "exit_nb_visits": "1", "avg_time_on_page": 0, "bounce_rate": "100%", "exit_rate": "100%" } ]
现在来讲讲链接参数的表示的是什么含义。
http://piwik.chenwg.com/index.php?module=API 这块我就不说了,
1. method表示的是调用哪个函数;
2. idSite就是在piwik后台添加网站时自动添加的,如下图:
我们可以设置idSite=1,也可以设置idSite=1,2,3,4,…… ,这样可以显示id为1,2,3,4等网站的相关信息的,也可以设置idSite=all,这样就显示piwik所监控的所有网站。
3. period的参数可以设置 为’day’,’week’,’month’,’year’,’range’,period与date是一对好基友,他们必须在一起出现的,比如设置 period=day,则date=2012-11-23这样的格式,既YYYY-MM-DD,如果period=range,则date=2012-11-20,2012-11-23,既是一个时间段YYYY-MM-DD,YYYY-MM-DD,如果period=month,则date=2012-11,也就是YYYY-MM这样的格式。
4. format的参数,猜猜就知道了,返回的数据的类型,支持xml,json,csv等格式的,喜欢什么格式就设置什么格式。
本文摘自寒星晓月博文: Piwik API 初探(一)