源码论坛公告:本站是一个交流学习建站资源的社区论坛,旨在交流学习源码脚本等资源技术,欢迎大家投稿发言! 【点击此处将锦尚放在桌面

源码论坛,商业源码下载,尽在锦尚中国商业源码论坛

 找回密码
 会员注册

QQ登录

只需一步,快速开始

查看: 1189|回复: 2
打印 上一主题 下一主题

[交流] 关于网站日志统计分析的两个小细节​

[复制链接]

29

主题

61

帖子

57

金币

初级会员

Rank: 1

积分
193
跳转到指定楼层
1#
发表于 2011-7-26 22:07:26 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
关于网站日志统计分析的两个小细节​
各位站长朋友通常都会给自己的网站安装cnzz、百度统计等站长统计工具,可是,这些站长统计工具不会记录网络蜘蛛的爬取情况。一些站长朋友通常会用日志分析工具对网站日志分析蜘蛛爬取情况。我个人认为,可能大部分站长对网站日志的统计分析过程中,忽略了一些小的细节,下面就列举两条:
  一、网站日志文件应该按访问量多少,来确定是否需要按小时生成。

  我的一个站长朋友,网站是每天生成一个日志文件,前段时间他参加了电商圈比赛,网站排名保持在首页,每天的流量有上千IP,每天的网站日志文件大小大约50M左右,有点杯具的是他的电脑旧了点,一打开网站日志文件不是没反应就是死机。他只好通过网络把日志传给我,让我帮着分析一下,50M的文件虽然不大,问题是他用电信网络,我用网通网络,在传日志的时候经常杯具。50M的日志文件,我用的日志分析程序也经常数据溢出、崩溃,无奈只好用文本编辑打开查看,面对密密麻麻的日志文本,统计分析这些数据实在非常非常困难。所以,建议网站访问量比较大的站长朋友,最好按小时生成网站日志,虽然生成文件多了点,但更有利于网站日志的分析。

  二、网站日志记录的信息实际并不完整。

  不知道各位站长朋友,有没有注意到,网站日志里很少出5xx的返回代码。例如,500返回代码表示服务器内部错误,503返回代码表示服务不可用。各位站长朋友都知道,5xx返回代码一般意味着网站服务器出了故障,一般情况下,服务器出了故障是无法生成网站日志的。换个说法,当网站服务器宕机了,或者dns解析不了,所有人都无法访问,蜘蛛也无法访问,在这段时间里,网站日志肯定是无法记录任何信息的。为了更好的监控网站情况,我个人建议大家去注册并使用谷歌站长管理工具,可以有效的记录服务器访问错误信息。
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 分享分享

2

主题

56

帖子

4

金币

初级会员

Rank: 1

积分
70
3#
发表于 2011-7-27 00:11:14 | 只看该作者
为了不扰乱会员对源码的测试,有问题咨询右侧客服不要直接回复,否则视为非法信息屏蔽会员ID!
即便是谷歌的统计也不是很准确的,用谷歌管理员工具和谷歌统计得到的结果是完全不一样的

4

主题

8

帖子

13

金币

初级会员

Rank: 1

积分
43
2#
发表于 2011-7-26 23:06:00 | 只看该作者
为了不扰乱会员对源码的测试,有问题咨询右侧客服不要直接回复,否则视为非法信息屏蔽会员ID!
谢谢分享!























http://www.mbj520.com/ aca面包机   http://www.wydjj.com/ 美的豆浆机
您需要登录后才可以回帖 登录 | 会员注册

本版积分规则

锦尚中国源码论坛

聚合标签|锦尚中国,为中国网站设计添动力 ( 鲁ICP备09033200号 ) |网站地图

GMT+8, 2025-2-24 12:02 , Processed in 0.091807 second(s), 26 queries .

带宽由 锦尚数据 提供 专业的数据中心

© 锦尚中国源码论坛 52jscn Inc. 非法入侵必将受到法律制裁 法律顾问:IT法律网 & 褚福省律师 锦尚爱心 版权申诉 版权与免责声明