0

0

apache访问日志access.log的解析以及如何将其导入mysql_MySQL

php中文网

php中文网

发布时间:2016-06-01 13:29:37

|

1177人浏览过

|

来源于php中文网

原创

apache

bitsCN.com

apache访问日志access.log的解析以及如何将其导入mysql
 

access.log导入mysqlload data local inf

首先,我们对apache访问日志进行一个解读,

 

点点
点点

小红书打造的AI生活搜索助手

下载

220.181.108.92  -  -  [22/Aug/2013:23:59:59 +0800]  "GET /min/f=/media/js/jquery-1.7.2.media/js/global_interaction.js&201308221836 HTTP/1.1"  200  70550  "http://adfdfs.com.cn1071-2130-1.html"   "Mozilla/5.0 (X11; U; Linux x86_64; en-US; rv:1.9) Gecko Minefield/3.0"

 

第一项信息是远程主机的地址,即它表明访问网站的究竟是谁。

 

第二项是空白,用一个“-”占位符替代。实际上绝大多数时候这一项都是如此。这个位置用于记录浏览者的标识,这不只是浏览者的登录名字,而是浏览者的email地址或者其他唯一标识符,通常只是"-";

 

第三项也是空白用一个占位符"-"来替代。这个位置用于记录浏览者进行身份验证时提供的名字。当然,如果网站的某些内容要求用户进行身份验证,那么这项信息是不会空白的。但是,对于大多数网站来说,日志文件的大多数记录中这一项仍旧是空白的。

 

第四项,表示访问者的访问时间记录,无需多解释,时间信息最后的“+800”表示服务器所处时区位于UTC之后的8小时。

 

第五项,是整个日志记录中最有用的信息,它告诉我们服务器收到的是一个什么样的请求

 

第六项,200状态代码

 

第七项,70500,是服务器发送给客户端的总字节数

 

第八项,客户在提出请求时所在的目录或URL。

 

第九项,客户端的详细信息

 

根据需求可以建张表

 

CREATE TABLE IF NOT EXISTS `apache_log` (

  `id` int(11) NOT NULL AUTO_INCREMENT COMMENT 'id号',

  `hostip` char(32) NOT NULL  DEFAULT '0.0.0.0' COMMENT '远程主机的IP地址',

  `marking` char(30)  COMMENT '浏览者的标识',

  `client_name` char(30)  COMMENT '浏览者的名字',

  `addtime` char(64) NOT NULL COMMENT '浏览时间',

  `time_zone` char(8) NOT NULL COMMENT '时区',

  `method` char(8)  NOT NULL COMMENT '方法',

  `resource` char(64)  NOT NULL COMMENT ' 请求的资源',

  `protocol` char(8)  COMMENT '请求使用的协议',

  `status` int(5)  COMMENT '状态代码',

  `bytes` int(5)  COMMENT '发送给客户端的总字节数',

  `refer` char(128)  COMMENT '客户在提出请求时所在的目录或URL',  

  `client_info` char(128)  COMMENT '客户在提出请求时所在的目录或URL',

  PRIMARY KEY (`id`)

) ENGINE=MyISAM DEFAULT CHARSET=utf8 COLLATE=utf8_bin;

 

先用awk处理apache日志,将每一项都用空格分开,那么大家看到下面的好多数字就迷惑了,这到底是个什么东西呢。首先awk '{print 0 ,像apache日志的文本中每行写入一个0,原因是,表结构的第一个字段是自增列,我只要把0导入,0表示默认值,它就可以自动增长了。

cat apache_log| awk '{print 0 " "$1 " "$2 " "$3" "  for (i=4;i> apache_log.txt

 

 

mysql> load data  infile "/root/apache_log.txt" into table apache_log fields terminated by " " lines terminated by '/n';

 

ERROR 13 (HY000): Can't get stat of '/root/apache_log.txt' (Errcode: 13 - Permission denied)

 

mysql> load data local  infile "/root/apache_log.txt" into table apache_log fields terminated by " " lines terminated by '/n';

 

Query OK, 2000 rows affected, 2672 warnings (0.61 sec)

Records: 2000  Deleted: 0  Skipped: 0  Warnings: 2672

 

顺便比较一下load data infile 和load data local infile 区别

 

如果你没有给出local,则服务器按如下方法对其进行定位:

1)如果你的filename为绝对路径,则服务器从根目录开始查找该文件.

2)如果你的filename为相对路径,则服务器从数据库的数据目录中开始查找该文件.

如果你给出了local,则文件将按以下方式进行定位:

1)如果你的filename为绝对路径,则客户机从根目录开始查找该文件.

2)如果你的filename为相对路径,则客户机从当前目录开始查找该文件.

 

mysql> desc apache_log;

+--------------+-----------+------+-----+---------+----------------+

| Field        | Type      | Null | Key | Default | Extra          |

+--------------+-----------+------+-----+---------+----------------+

| id           | int(11)   | NO   | PRI | NULL    | auto_increment |

| hostip       | char(32)  | NO   |     | 0.0.0.0 |                |

| marking      | char(30)  | YES  |     | NULL    |                |

| browser_name | char(30)  | YES  |     | NULL    |                |

| addtime      | char(64)  | NO   |     | NULL    |                |

| time_zone    | char(8)   | NO   |     | NULL    |                |

| method       | char(8)   | NO   |     | NULL    |                |

| resource     | char(64)  | NO   |     | NULL    |                |

| protocol     | char(8)   | YES  |     | NULL    |                |

| status       | int(5)    | YES  |     | NULL    |                |

| bytes        | int(5)    | YES  |     | NULL    |                |

| refer        | char(128) | YES  |     | NULL    |                |

| client_info  | char(128) | YES  |     | NULL    |                |

+--------------+-----------+------+-----+---------+----------------+

13 rows in set (0.00 sec)

 

mysql> select * from apache_log limit 3;

+----+-----------------+---------+--------------+-----------------------+-----------+--------+--------------------------------------------+----------+--------+-------+-------+------------------------------------------------------------------------------------+

| id | hostip          | marking | browser_name | addtime               | time_zone | method | resource                                   | protocol | status | bytes | refer | client_info                                                                        |

+----+-----------------+---------+--------------+-----------------------+-----------+--------+--------------------------------------------+----------+--------+-------+-------+------------------------------------------------------------------------------------+

|  1 | 220.181.108.116 | -       | -            | [21/Aug/2013:23:59:59 | +0800]    | "GET   | /search/prj/tag/2089-2124124-2350-2354-1.html | HTTP/1.1 |    200 |  8181 | "-"   | "Mozilla/5.0(compatible;Baiduspider/2.0;+http://www.baidu.com/search/spider.html)" |

|  2 | 220.181.165.5   | -       | -            | [21/Aug/2013:23:59:59 | +0800]    | "GET   | /event/bushanping/admin_login.php          | HTTP/1.1 |    200 | 32095 | "-"   | "Mozilla/5.0(Windows;U;WindowsNT5.1;zh-CN;rv:1.9.1.1)Gecko/20090715Firefox/3.5.1"  |

|  3 | 220.181.165.136 | -       | -            | [21/Aug/2013:23:59:59 | +0800]    | "GET   | /search/diy/server-status/                 | HTTP/1.1 |    404 | 21795 | "-"   | "Mozilla/5.0(Windows;U;WindowsNT5.1;zh-CN;rv:1.9.1.1)Gecko/20090715Firefox/3.5.1"  |

+----+-----------------+---------+--------------+-----------------------+-----------+--------+--------------------------------------------+----------+--------+-------+-------+------------------------------------------------------------------------------------+

3 rows in set (0.00 sec)

 

导入成功
 

bitsCN.com

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式,涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明,帮助用户高效找到pixiv官方网站,实现便捷、安全的网页端浏览与账号登录体验。

1142

2026.02.13

微博网页版主页入口与登录指南_官方网页端快速访问方法
微博网页版主页入口与登录指南_官方网页端快速访问方法

本专题系统整理微博网页版官方入口及网页端登录方式,涵盖首页直达地址、账号登录流程与常见访问问题说明,帮助用户快速找到微博官网主页,实现便捷、安全的网页端登录与内容浏览体验。

371

2026.02.13

Flutter跨平台开发与状态管理实战
Flutter跨平台开发与状态管理实战

本专题围绕Flutter框架展开,系统讲解跨平台UI构建原理与状态管理方案。内容涵盖Widget生命周期、路由管理、Provider与Bloc状态管理模式、网络请求封装及性能优化技巧。通过实战项目演示,帮助开发者构建流畅、可维护的跨平台移动应用。

245

2026.02.13

TypeScript工程化开发与Vite构建优化实践
TypeScript工程化开发与Vite构建优化实践

本专题面向前端开发者,深入讲解 TypeScript 类型系统与大型项目结构设计方法,并结合 Vite 构建工具优化前端工程化流程。内容包括模块化设计、类型声明管理、代码分割、热更新原理以及构建性能调优。通过完整项目示例,帮助开发者提升代码可维护性与开发效率。

37

2026.02.13

Redis高可用架构与分布式缓存实战
Redis高可用架构与分布式缓存实战

本专题围绕 Redis 在高并发系统中的应用展开,系统讲解主从复制、哨兵机制、Cluster 集群模式及数据分片原理。内容涵盖缓存穿透与雪崩解决方案、分布式锁实现、热点数据优化及持久化策略。通过真实业务场景演示,帮助开发者构建高可用、可扩展的分布式缓存系统。

114

2026.02.13

c语言 数据类型
c语言 数据类型

本专题整合了c语言数据类型相关内容,阅读专题下面的文章了解更多详细内容。

77

2026.02.12

雨课堂网页版登录入口与使用指南_官方在线教学平台访问方法
雨课堂网页版登录入口与使用指南_官方在线教学平台访问方法

本专题系统整理雨课堂网页版官方入口及在线登录方式,涵盖账号登录流程、官方直连入口及平台访问方法说明,帮助师生用户快速进入雨课堂在线教学平台,实现便捷、高效的课程学习与教学管理体验。

17

2026.02.12

豆包AI网页版入口与智能创作指南_官方在线写作与图片生成使用方法
豆包AI网页版入口与智能创作指南_官方在线写作与图片生成使用方法

本专题汇总豆包AI官方网页版入口及在线使用方式,涵盖智能写作工具、图片生成体验入口和官网登录方法,帮助用户快速直达豆包AI平台,高效完成文本创作与AI生图任务,实现便捷智能创作体验。

863

2026.02.12

PostgreSQL性能优化与索引调优实战
PostgreSQL性能优化与索引调优实战

本专题面向后端开发与数据库工程师,深入讲解 PostgreSQL 查询优化原理与索引机制。内容包括执行计划分析、常见索引类型对比、慢查询优化策略、事务隔离级别以及高并发场景下的性能调优技巧。通过实战案例解析,帮助开发者提升数据库响应速度与系统稳定性。

123

2026.02.12

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
C# 教程
C# 教程

共94课时 | 10万人学习

ASP 教程
ASP 教程

共34课时 | 5.2万人学习

SQL 教程
SQL 教程

共61课时 | 4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号