(12)发明专利申请
(10)申请公布号 CN 111177534 A(43)申请公布日 2020.05.19
(21)申请号 201911239315.0(22)申请日 2019.12.06
(71)申请人 南京欣网互联信息技术有限公司
地址 210037 江苏省南京市鼓楼区南昌路
40号长江科技园一期大楼7层(72)发明人 付飞龙 石光捷 张良 张晓莉 (74)专利代理机构 南京鑫之航知识产权代理事
务所(特殊普通合伙) 32410
代理人 汪庆朋(51)Int.Cl.
G06F 16/9535(2019.01)
权利要求书1页 说明书4页 附图1页
(54)发明名称
一种基于互联网大数据的用户行为轨迹分析方法
(57)摘要
本发明公开一种基于互联网大数据的用户行为轨迹分析方法,包括客户端、服务器、安全分析模块、企业终端、数据库、用户终端;客户端通过服务器与安全分析模块信号连接,安全分析模块与数据库信号连接,企业终端和用户终端的输出端均与数据库的输入端信号连接;通过客户端实时采集用户行为数据,将用户行为和页面URL的上下文信息相结合,最大限度地重现用户浏览Web页面的真实场景,提取全面的用户行为轨迹,为分析用户行为提供有效的数据保障;通过安全分析模块为用户行为数据提供安全保障,将云计算技术的强大处理能力和大规模数据存储能力、本体及其推理、知识发现方法相结合,实时分析海量用户行为数据,及时获取用户兴趣,实现精准的用户推送。
CN 111177534 ACN 111177534 A
权 利 要 求 书
1/1页
1.一种基于互联网大数据的用户行为轨迹分析方法,其特征在于:包括客户端、服务器、安全分析模块、企业终端、数据库、用户终端;所述客户端通过服务器与安全分析模块信号连接,所述安全分析模块与数据库信号连接,所述企业终端和用户终端的输出端均与数据库的输入端信号连接;首先客户端,用于实时采集用户行为数据,然后通过客户端上传到服务器保存;安全分析模块,用于根据数据库中保存的恶意行为判别策略,对服务器保存的用户行为数据进行分析,若确定为恶意行为,并根据判别策略对应的恶意等级确定打击策略,将所确定的打击策略同分析结果一起反馈给服务器,服务器根据打击策略对相应用户进行管控处理;所述企业终端用于搜集企业提供产品或服务信息,用户终端用于搜集用户访问信息,数据库用于预设并储存用户信息模型,形成统一的用户数据格式;用户终端和企业终端分别将搜集的信息发送给数据库;所述数据库预设用户信息模型,如GN表示用户信息模型,N为用户编号,根据确定的用户姓名、年龄、性别、手机号码、居住地等基本信息可以确定用户的身份及唯一编号,用户基本信息记录在用户信息模型的第一行;从第二行开始,分别记录用户的行为信息:第二行表示用户的搜索信息,第三行表示用户娱乐信息,第四行表示用户餐饮信息,第五行表示用户旅游信息,第六行表示用户购物信息,按固定的顺序从上至下依次排列,每一行从前到后按时间顺序记录最近一个类别的行为,可存储用户最近的30-60个该类别行为,便于后期统计。
2.根据权利要求1所述一种基于互联网大数据的用户行为轨迹分析方法,其特征在于:所述安全分析模块通过数据预处理与聚合模块信号连接;数据预处理与聚合模块,用于实时对用户行为数据采用并行模型进行预处理与聚合,将结果存放到数据库相应表中。
3.根据权利要求1所述一种基于互联网大数据的用户行为轨迹分析方法,其特征在于:所述数据库的输出端与数据分析模块的输入端信号连接,数据分析模块的输出端与数据推送模块的输入端信号连接,数据推送模块的输出端与企业终端信号连接;数据库利用用户终端上传的信息更新用户信息模型后,将更新后的用户信息模型传送至数据分析模块;数据分析模块进行分析以后,得到用户行为偏好信息,用户行为偏好信息经数据推送模块转发给企业终端。
4.根据权利要求1所述一种基于互联网大数据的用户行为轨迹分析方法,其特征在于:所述企业终端的输出端与用户终端的输入端信号连接;企业终端根据用户偏好信息结合企业提供的产品或服务信息进行匹配,经匹配后的产品或服务信息由企业终端发送给用户终端。
5.根据权利要求1所述一种基于互联网大数据的用户行为轨迹分析方法,其特征在于:所述用户终端分别依次与用户基本信息、用户搜索信息、用户娱乐信息、用户餐饮信息、用户旅游信息、用户购物信息等的行为偏好信息。
6.根据权利要求1或3所述一种基于互联网大数据的用户行为轨迹分析方法,其特征在于:所述数据库还与比较模块信号连接;比较模块,将客户端继续采集的用户下一步的用户行为数据与系统推荐模块推荐的下一步URL集进行比较。
7.根据权利要求6所述一种基于互联网大数据的用户行为轨迹分析方法,其特征在于:所述比较模块与评估模块信号连接;评估模块,根据所述比较结果实时评估该用户行为分析方法。
2
CN 111177534 A
说 明 书
一种基于互联网大数据的用户行为轨迹分析方法
1/4页
技术领域
[0001]本发明属于互联网大数据技术领域,具体涉及一种基于互联网大数据的用户行为轨迹分析方法。
背景技术
[0002]上网群体的高速扩张推动了我国网上金融、移动支付、网络视频、在线教育、搜索行业的高速发展;互联网用户的行为会产生大量的信息;现有的数据分析系统不够精准,用户需要自己从海量信息中挖掘出有价值的关键信息,效率较低。发明内容
[0003]针对现有技术上存在的不足,本发明提供一种基于互联网大数据的用户行为轨迹分析方法。为实现上述目的,本发明采用如下技术方案:
一种基于互联网大数据的用户行为轨迹分析方法,包括客户端、服务器、安全分析模块、企业终端、数据库、用户终端;所述客户端通过服务器与安全分析模块信号连接,所述安全分析模块与数据库信号连接,所述企业终端和用户终端的输出端均与数据库的输入端信号连接;首先客户端,用于实时采集用户行为数据,然后通过客户端上传到服务器保存;安全分析模块,用于根据数据库中保存的恶意行为判别策略,对服务器保存的用户行为数据进行分析,若确定为恶意行为,并根据判别策略对应的恶意等级确定打击策略,将所确定的打击策略同分析结果一起反馈给服务器,服务器根据打击策略对相应用户进行管控处理;所述企业终端用于搜集企业提供产品或服务信息,用户终端用于搜集用户访问信息,数据库用于预设并储存用户信息模型,形成统一的用户数据格式;用户终端和企业终端分别将搜集的信息发送给数据库;所述数据库预设用户信息模型,如GN表示用户信息模型,N为用户编号,根据确定的用户姓名、年龄、性别、手机号码、居住地等基本信息可以确定用户的身份及唯一编号,用户基本信息记录在用户信息模型的第一行;从第二行开始,分别记录用户的行为信息:第二行表示用户的搜索信息,第三行表示用户娱乐信息,第四行表示用户餐饮信息,第五行表示用户旅游信息,第六行表示用户购物信息,按固定的顺序从上至下依次排列,每一行从前到后按时间顺序记录最近一个类别的行为,可存储用户最近的30-60个该类别行为,便于后期统计。[0004]进一步的,所述安全分析模块通过数据预处理与聚合模块信号连接;数据预处理与聚合模块,用于实时对用户行为数据采用并行模型进行预处理与聚合,将结果存放到数据库相应表中。
[0005]进一步的,所述数据库的输出端与数据分析模块的输入端信号连接,数据分析模块的输出端与数据推送模块的输入端信号连接,数据推送模块的输出端与企业终端信号连接;数据库利用用户终端上传的信息更新用户信息模型后,将更新后的用户信息模型传送至数据分析模块;数据分析模块进行分析以后,得到用户行为偏好信息,用户行为偏好信息经数据推送模块转发给企业终端。
3
CN 111177534 A[0006]
说 明 书
2/4页
进一步的,所述企业终端的输出端与用户终端的输入端信号连接;企业终端根据
用户偏好信息结合企业提供的产品或服务信息进行匹配,经匹配后的产品或服务信息由企业终端发送给用户终端。[0007]进一步的,所述用户终端分别依次与用户基本信息、用户搜索信息、用户娱乐信息、用户餐饮信息、用户旅游信息、用户购物信息等的行为偏好信息。[0008]进一步的,所述数据库还与比较模块信号连接;比较模块,将客户端继续采集的用户下一步的用户行为数据与系统推荐模块推荐的下一步URL集进行比较。[0009]进一步的,所述比较模块与评估模块信号连接;评估模块,根据所述比较结果实时评估该用户行为分析方法。[0010]采用上述技术方案,本发明的有益效果:
本发明通过客户端实时采集用户行为数据,将用户行为和页面URL的上下文信息相结合,最大限度地重现用户浏览Web页面的真实场景,提取全面的用户行为轨迹,为分析用户行为提供有效的数据保障;并通过安全分析模块为用户行为数据提供安全保障,将云计算技术的强大处理能力和大规模数据存储能力、本体及其推理、知识发现方法相结合,实时分析海量用户行为数据,及时获取用户兴趣,从而实现有效与精准的用户推送。[0011](1)通过用户终端来精确检索用户在搜索、娱乐、餐饮、旅游、购物等常见网络应用上的访问轨迹、个人偏好、支付数据,为描绘更加精准的用户模型数据打好了基础;
(2)通过定义用户信息模型,用户信息模型可存储30-60组用户在索、娱乐、餐饮、旅游、购物方面的信息,统计处理效率很高;
(3)定义搜索、娱乐、餐饮、旅游、购物等常见网络应用的关键信息,便于在庞大的信息中准确筛选有价值的用户偏好信息,也为企业数据匹配打好了基础。附图说明
[0012]图1是本发明中一种基于互联网大数据的用户行为轨迹分析方法的结构示意图;
图2是本发明中一种基于互联网大数据的用户行为轨迹分析方法的分析系统。具体实施方式
[0013]为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施方式,进一步阐述本发明:
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例,基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。[0014]应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。[0015]术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
[0016]在本发明的描述中,还需要说明的是,除非另有明确的规定和限定,术语“设置”、“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接
4
CN 111177534 A
说 明 书
3/4页
相连,可以是两个元件内部的连通,对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。[0017]结合图1、图2所示:一种基于互联网大数据的用户行为轨迹分析方法,包括客户端、服务器、安全分析模块、企业终端、数据库、用户终端;所述客户端通过服务器与安全分析模块信号连接,所述安全分析模块与数据库信号连接,所述企业终端和用户终端的输出端均与数据库的输入端信号连接;首先客户端,用于实时采集用户行为数据,然后通过客户端上传到服务器保存;安全分析模块,用于根据数据库中保存的恶意行为判别策略,对服务器保存的用户行为数据进行分析,若确定为恶意行为,并根据判别策略对应的恶意等级确定打击策略,将所确定的打击策略同分析结果一起反馈给服务器,服务器根据打击策略对相应用户进行管控处理;所述企业终端用于搜集企业提供产品或服务信息,用户终端用于搜集用户访问信息,数据库用于预设并储存用户信息模型,形成统一的用户数据格式;用户终端和企业终端分别将搜集的信息发送给数据库;所述数据库预设用户信息模型,如GN表示用户信息模型,N为用户编号,根据确定的用户姓名、年龄、性别、手机号码、居住地等基本信息可以确定用户的身份及唯一编号,用户基本信息记录在用户信息模型的第一行;从第二行开始,分别记录用户的行为信息:第二行表示用户的搜索信息,第三行表示用户娱乐信息,第四行表示用户餐饮信息,第五行表示用户旅游信息,第六行表示用户购物信息,按固定的顺序从上至下依次排列,每一行从前到后按时间顺序记录最近一个类别的行为,可存储用户最近的30-60个该类别行为,便于后期统计。
[0018]上述用户终端通过将用户行为进行采集和分类,是对用户搜索信息、用户娱乐信息、用户餐饮信息、用户旅游信息、用户购物信息进行统计后,将信息按顺序发送至数据库;用户搜索信息采用访问站点、站点板块、访问时长、消耗流量、访问日期五个关键数据,将关键数据按顺序整理后,作为一个采样数据;用户娱乐信息采用访问站点、站点板块、访问时长、消耗流量、访问日期五个关键数据,将关键数据按顺序整理后,作为一个采样数据;用户餐饮信息采用店铺名称、偏重口味、消费频次、消费方式、消费时间五个关键数据,将关键数据按顺序整理后,作为一个采样数据;用户旅游信息采用访问站点、出行方式、消费频次、消费方式、消费时间五个关键数据,将关键数据按顺序整理后,作为一个采样数据;用户购物信息采用访问店铺、购物类别、消费频次、消费方式、消费时间五个关键数据,将关键数据按顺序整理后,作为一个采样数据;各采样数据发送到数据库中;各关键数据按时间顺序在用户信息模型中进行更新,上一个采样数据右移一位,最新的数据记录在最左端,依次完成用户信息模型更新,一般每周或每两周更新一次。[0019]其中,所述安全分析模块通过数据预处理与聚合模块信号连接;数据预处理与聚合模块,用于实时对用户行为数据采用并行模型进行预处理与聚合,将结果存放到数据库相应表中。
[0020]同时,所述数据库的输出端与数据分析模块的输入端信号连接,数据分析模块的输出端与数据推送模块的输入端信号连接,数据推送模块的输出端与企业终端信号连接;数据库利用用户终端上传的信息更新用户信息模型后,将更新后的用户信息模型传送至数据分析模块;数据分析模块进行分析以后,得到用户行为偏好信息,用户行为偏好信息经数据推送模块转发给企业终端。[0021]进一步优化的,所述企业终端的输出端与用户终端的输入端信号连接;企业终端
5
CN 111177534 A
说 明 书
4/4页
根据用户偏好信息结合企业提供的产品或服务信息进行匹配,经匹配后的产品或服务信息由企业终端发送给用户终端。[0022]此外,所述用户终端分别依次与用户基本信息、用户搜索信息、用户娱乐信息、用户餐饮信息、用户旅游信息、用户购物信息等的行为偏好信息。[0023]同时,所述数据库还与比较模块信号连接;比较模块,将客户端继续采集的用户下一步的用户行为数据与系统推荐模块推荐的下一步URL集进行比较。[0024]进一步优化的,所述比较模块与评估模块信号连接;评估模块,根据所述比较结果实时评估该用户行为分析方法。
[0025]本发明通过客户端实时采集用户行为数据,将用户行为和页面URL的上下文信息相结合,最大限度地重现用户浏览Web页面的真实场景,提取全面的用户行为轨迹,为分析用户行为提供有效的数据保障;并通过安全分析模块为用户行为数据提供安全保障,将云计算技术的强大处理能力和大规模数据存储能力、本体及其推理、知识发现方法相结合,实时分析海量用户行为数据,及时获取用户兴趣,从而实现有效与精准的用户推送。[0026](1)通过用户终端来精确检索用户在搜索、娱乐、餐饮、旅游、购物等常见网络应用上的访问轨迹、个人偏好、支付数据,为描绘更加精准的用户模型数据打好了基础;
(2)通过定义用户信息模型,用户信息模型可存储30-60组用户在索、娱乐、餐饮、旅游、购物方面的信息,统计处理效率很高;
(3)定义搜索、娱乐、餐饮、旅游、购物等常见网络应用的关键信息,便于在庞大的信息中准确筛选有价值的用户偏好信息,也为企业数据匹配打好了基础。[0027]本实施例并非对本发明的形状、材料、结构等作任何形式上的限制,凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均属于本发明技术方案的保护范围。
6
CN 111177534 A
说 明 书 附 图
1/1页
图1
图2
7
因篇幅问题不能全部显示,请点此查看更多更全内容