欢迎来到专业的尚善文档网平台! 工作总结 工作计划 读后感 发言稿 心得体会 申请书大全 思想汇报 述职报告
当前位置:尚善文档网>作文大全 > 基于云计算的在线4G用户行为研究分析

基于云计算的在线4G用户行为研究分析

时间:2022-03-23 09:03:55 浏览量:

伴随着近几年“产品经理”的火热起来,“用户体验”的设计概念被绝大多数公司企业所接受。为更好的研究与分析4G时代下移动网络用户的行为,本文提出了一套新的用户行为研究与分析方案

【关键词】云计算 大数据 引擎 K-means算法

1 引言

伴随着当今中国社会移动数字通信与多媒体需求的发展,适应移动数据、移动计算及移动多媒体运作需要的第四代移动通信开始兴起,基于传统3G时代下对用户行为的研究与分析已经无法满足现在运营商与公司企业的业务需求。因此,为了应对新型移动网络中用户行为的转变和传输数据量的规模由TB向PB的转变。在此,提出一种4G用户行为研究分析方法。

2 总体设计介绍

2.1 引擎详细介绍

在本文描述内容中,所进行的研究和分析都是基于一种传统云计算設计的用户行为分析引擎实现的,该引擎的优点主要有以下几点:

(1)能够通过云计算完成分布式并发的大规模计算能力。

(2)能够构建网络用户端到端的大数据挖掘分析系统。以此完成对DPI 和目标用户上网行为的深度心理行为分析。满足国内运营商和公司企业对收集海量网络数据、研究与分析用户行为、确立与执行营销策略的三大环节的连锁需求。

如图1所示,系统通过DPI和Web服务器获取数据,在接口层处利用分布式计算与批量处理模式,将海量数据存入Hbase数据库,满足海量数据和非结构化数据的存储功能。将进入数据库的数据用Hive 进行整合层和汇总层的ETL 处理,再使用大数据中的MapReduce计算框架设计分析模型,最后把经过Hive映射后形成的数据库表导入前端展现数据库MySQL。

2.2 用户行为模型

利用上述模型,我们可以在Hadoop平台下为用户行为研究分析分布式分析模型。在此将详细阐述评估、用户偏好、关系挖掘三大模型。

2.2.1 评估模型

该模型主要利用了参数调整,是对模型中所采用算法不同变量和参数和模型设计空间规模的调整与设置;除此之外,不仅有对该模型进行校验,还将针对计算结果与实际数据进行比较。以此实现模型的精确校验指入和对跟模型有效性的评价与校验。

在考虑到移动网络用户会在不同的平台上有相关的访问数据,评估模型还将采取针对性的关联分析,基于用户的日常操作日志,系统可以进行用户与网络多个平台的关联关系确认,依据K-means关联算法,在找出平方误差最小的k个函数值,就可以实现对用户簇的紧凑划分,将这些用户簇固化,就是运营商、公司企业所需要的数据支持。

2.2.2 用户偏好模型

该模型利用了文本挖掘,其主要作用是消除收集数据中的文本内容,通过多种基于用户需求的预处理技术获取文本里面的重要内容,依据K-means算法进行文本内容的精细划分,实现对高可靠性标准文本库的构造。

用户偏好模型将分为三大类:用户访问、用户应用、用户推荐。

用户访问依据网页访问日志,通过分类后,完成对用户访问网页行为的跟踪与分析,它将计算和生成用户的偏好。

用户应用将深度分析用户下载APP应用的详细情况。从类别,使用时长,APP相关性等方面着手,最终完成对用户兴趣和爱好的准确计算。

用户推荐以现有内容推荐技术为依托,结合其他推荐技术,综合考虑网页、APP应用的内容与用户关联性,定义出综合相似度参数,对它进行多维度计算,为用户提供推荐信息。

2.2.3 关系挖掘模型

依据评估模型和用户偏好模型构建出关系挖掘模型,该模型主要是对用户的社会交往关系和兴趣关系进行图谱构建,再结合用户的网络访问日志对用户潜藏信息进行挖掘,来构建用户的“多维关系”。

3 系统测试与结果分析

为了验证对文中所采用的基于云计算的在线4G用户行为研究与分析,我们从网上随机抓取了10000个人在网上订购快餐的消费频率和其他上网记录,在此,本文提取以下两条数据进行分析:

(1)10000人中有8032人在线搜索过“减肥、长胖、瘦肚子”等关键字,5793人购买过与治疗高血压、减肥相关药品。

(2)高频率消费快餐(一周超过3次)共有3034人,其中有2874人日常平均上网时间超过9个小时。在他们的一周整个上网时间(超过26210个小时)内,分配为网游42.75%,电视剧、电影、综艺节目16.26%,淘宝等电子商务平台14.25%,聊天、微博8.34%,其他1.84%。

依据上面统计结果,我们可以明确分析出:消费快餐,会存在长胖、高血压的风险,对于“健康饮食”,“方便”、“健康”字样信息会格外关注;对于高频率食用快餐的人群,还是以喜欢宅在家里的人居多,他们更喜欢浏览“送货上门”,“包邮”字样的商品。以上两点内容通过实验人群的上网浏览记录也得以证实。如图2所示。

在另一方面,本文中所使用的引擎与传统的单机批量入库方式,更具有实时化和压缩时间缩短的优势,对于4G时代井喷式的用户数据,将更加适用运营商和公司、企业的需求。

4 结束语

本文对4G时代下的用户行为提出了一种新的研究与分析方案,能够有效的满足现在运营商、公司企业的需求。如果在数据处理方面,仍觉得本方案的引擎不够快,可以尝试数据挖掘、数据仓库的方法去处理。

参考文献

[1]乔志伟.基于用户行为的3G业务分析与探讨[J].移动通信, 2010(12): 52- 55.

[2]冯铭,王保进.蔡建宇.基于云计算的可重构移动互联网用户行为分析系统的设计[J]. 计算机科学, 2011(08).

[3]王明会.移动互联网技术及应用热点浅析[J].信息通信技术,2010(04).

[4]皇甫大鹏,陈平,王兴建.基于一种改进的K- means 算法的校园网用户行为分析研究[J].广西大学学报,2011(11).

作者单位

重庆邮电大学 重庆市 400065

推荐访问: 在线 计算 分析 用户 研究