当前位置: 首页 > 文章 > Web使用挖掘中的会话识别算法 内蒙古农业大学学报(自然科学版) 2010,31 (4) 234-236
Position: Home > Articles > IMPROVED METHOD FOR SESSION IDENTIFICATION IN WEB LOG MINING Journal of Inner Mongolia Agricultural University(Natural Science Edition) 2010,31 (4) 234-236

Web使用挖掘中的会话识别算法

作  者:
周方;周根宝
单  位:
内蒙古农业大学计算机与信息工程学院
关键词:
Web挖掘;数据预处理;会话识别;时间阈值
摘  要:
针对Web日志挖掘中的会话识别问题,在最常用的Timeout方法的基础上,提出了一种改进的基于平均时间阈值的识别方法。通过动态计算会话中请求记录间的平均时间间隔,个性化地调整页面的时间阈值,相对于传统的时所有用户页面使用单一的先验阈值,该方法能够更准确地识别出长对话。最后对生成的侯选会话集进行二次识别,使识别出的会话更为合理有效。实验结果表明,会话质量得到了提高。
译  名:
IMPROVED METHOD FOR SESSION IDENTIFICATION IN WEB LOG MINING
作  者:
ZHOU Fang,ZHOU Gen-bao*(College of computer and information engineering,Inner Mongolia agriculture university,Hohhot Inner Mongolia 010018 China)
关键词:
web mining;data preparation;session identification;threshold
摘  要:
Toward session identification in web log mining,an access timeout-based improvement is carried out of session identification in web log mining.By calculating the average intervals dynamically among request records in the session,adjusting a threshold individually.Compared to the traditional method that defines a uniform threshold for all web pages experimentally,the approach presents can identify the long session more accurately.Then generating sets of candidate session is re-identified,which make the session more reasonable and effective.The quality of session identification is proved more efficiency by experiments.

相似文章

计量
文章访问数: 10
HTML全文浏览量: 0
PDF下载量: 0

所属期刊

推荐期刊