简介:为准确把握用户兴趣,提高用户体验,实现内容的精准推广和用户的个性化服务,建立移动社交网络用户兴趣模型。挖掘用户的移动社交网络行为及内容,抽取用户的兴趣特征项,在统计兴趣项词频的基础上借鉴改进词频—逆文档频率(termfrequency—inversedocumentfrequency)算法以计算用户兴趣度权重,得到用户兴趣的向量空间表述模型。试验表明该方案在用户兴趣识别与排序上准确率较好。
简介:日志分析算法是日志能够正确、高效分析的关键,对有效快速获取有用日志信息起到至关重要的作用。本文首先简要介绍了层次聚类算法,并给出日志分析中聚类算法选择的标准。其次在深入研究Chameleon算法的基础上,将其改造用于日志分析中,然后在数据集上进行实验,结果证明Chameleon算法在聚类精度和运行方面具有很好的效果。