为了管理报告的目的,我必须分析一个巨大的日志文件。
日志文件的格式如下:-
[2014-08-28 08:49:40 GMT][Level:DEBUG] 来自 UGUBUKBBBHJGJ.mt.site (123.131.21.20) 的连接,用户:com.my.solution.name.abc 的用户:12345678
[2014-08-28 08:49:41 GMT][Level:DEBUG] 来自 TYIYIYPOYUUGG.mt.site (123.131.21.20) 的连接,用户:12345678,com.my.solution.name.def
[2014-08-29 05:55:21 GMT][Level:DEBUG] 来自 OJPPMMJOOHJIH.mt.site (123.131.22.33) 的连接,用户:com.my.solution.name.ghi 的用户:12345678
[2014-08-29 05:55:22 GMT][Level:DEBUG] 来自 HGJJKHKHKHKJH.mt.site (123.131.22.33) 的连接,用户:com.my.solution.name.jkl 的用户:12345678
我已经用一些虚拟值替换了日志中的实际值。
如何拆分我的日志文件,使我的一个输入拆分仅包含单个日期的日志,因此一个映射器处理一天的所有日志。