聊天群数据挖掘
经过整理、分析的数据,不再错乱难分、让人头大,而且会有很有趣的、很有用处的发现。普通如QQ群聊天记录,统计的结果也是那么好玩。小5(嗯,他也和小a一样谦虚,不用“五”而用“5”)今天简单排列一下“大旗底下”在2007年4月12日深夜到2007年12月22日深夜的聊天记录,就发现了在讨论“L2书写作”时、有“学术会议在线直播”时是群里最热闹的日子,而排第三的日子则是在讨论热点话题。由此可见,“大旗底下”严肃话题和休闲放松都有,良群啊。通过发言统计,还列出哪位是发言记录最多的话篓子。
如果能加上词分系统,统计词频,说不定还能发现再这三个季度里头,群的十大热门词汇、十大人物是谁呢。不过,这就高要求了,据说为这统计,可敬的小5的可怜的计算机屡遭大难,频频重启。再次,向付出辛勤劳动的小5和他的爱姬致敬!
相关日志:
分类: 未分类

汗。。。先前留言未留上,只要重说一遍:如果用好的分析软件(MS针对英文的多一些),是可以作深入挖掘的。。甚至还可以写个什么东东骗骗人什么的。。