网站用户的识别 -亚博电竞官方网址

3,696views
no comments

共计 2179 个字符,预计需要花费 6 分钟才能阅读完成。

用户分析是网站分析中一个重要的组成部分,在分析用户之前我们必须首先能够识别每个用户,分辨哪些是”new customer”,哪些是”repeat customer”。这样不但能够更加清晰地了解到底有多少用户访问了你的网站,分辨他们是谁(用户 id、邮箱、性别年龄等);同时也能够帮助你更好地跟踪你的用户,发现它们的行为特征、兴趣爱好及个性化的设置等,以便于更好地把握用户需求,提升用户体验。

通常当你的网站提供了注册服务,而用户注册并登陆过你的网站,那么用户可以更容易地被识别,因为网站一般都会保存注册用户的详细信息;但是你的网站并不需要注册,而用户的行为以浏览为主,这是用户识别就会显得较为困难,下面提供了几种常用的用户识别的方法:

识别用户的几种方法

当用户并未注册登录的情况下,识别用户的唯一途径就只剩下用户浏览行为的点击流数据,通常情况下它们会保存在 web 日志里面,关于 web 日志的详细说明可以参考我之前的文章——。而 web 日志本身存在的缺陷可能导致用户识别的不准确性,关于 web 日志的缺陷可以参考之前的文章——,所以我们在选择用户识别方法的过程中,在条件允许的情况下尽量选择更为准确的方法:

1、基于 ip 的用户识别

ip 地址是最容易获取的信息,任何的 web 日志中均会包含,但其局限性也较为明显:伪 ip、代理、动态 ip、局域网共享同一公网 ip 出口……这些情况都会影响基于 ip 来识别用户的准确性,所以 ip 识别用户的准确性比较低,目前一般不会直接采用 ip 来识别用户。

获取难度:★

准确度:★

 

2、基于 ip agent 的用户识别

同样基于最简单形式的 web 日志,我们可以增加一项——agent,来提高单一 ip 方式识别用户的准确性。agent 也是 web 日志中一般都会包含的信息,通过 ip agent 的方式可以适当提高 ip 代理、公用 ip 这类情况下用户的分辨度,同时通过 agent 还可以识别网络爬虫等特殊“用户”,但同样准确度也欠高。

获取难度:★

准确度:★★

 

3、基于 cookie 的用户识别

当你通过自定义 apache 日志格式或者 javascript 的方法获得用户 cookie 的时候,其实你已经找到了一个更有效的用户识别的手段。cookie 在未被清除的其前提下可以认为是跟某个访问客户端电脑绑定的(一个客户端有可能包含多个 cookie),所以用 cookie 来标识用户其实指的是用户使用的客户端电脑,而并非用户本身。

用 cookie 识别用户的方法当然也存在缺陷:最常见的就是 cookie 被清除而导致用户无法与原先记录实现对应;同时由于客户端电脑会被共用,或者用户会在不同的电脑上访问你的网站,这个时候 cookie 就无法直接对应到该用户了。

获取难度:★☆

准确度:★★☆

 

4、基于用户 id 的用户识别

基于用户 id 的用户识别是最为准确,因为一般情况下用户不同共享他的用户 id,所以我们可以认为数据中的 userid 唯一地指向该用户,几乎不存在偏差。当然要使用用户 id 来识别用户是需要一定的前提条件的:网站必须是提供用户注册登录服务的,并且可以通过一些手段在点击流数据中记录 userid。

获取难度:★★

准确度:★★★

所以对于一个需要用户 id 注册登录的网站来说,用户唯一标识符的选择可以遵从以下顺序:当用户注册登录时以 userid 为准,当用户在未登录状态浏览时以用户的 cookie 为准,当用户未登录且 cookie 无法获取的情况下以 ip agent 为准;这样就能从最大程度上识别唯一用户。

 

这里推荐一个网站日志中 cookie 项的自定义设置方法,以便更好地识别用户。cookie 是从用户端存放的 cookie 文件记录中获取的,这个文件里面一般在包含一个 cookieid 的同时也会记下用户在该网站的 userid(如果你的网站需要注册登陆并且该用户曾经登录过你的网站且 cookie 未被删除),所以在记录日志文件中 cookie 项的时候可以优先去查询 cookie 中是否含有用户 id 类的信息,如果存在则将用户 id 写到日志的 cookie 项,如果不存在则查找是否有 cookieid,如果有则记录,没有则记为”-”,这样日志中的 cookie 就可以直接作为最有效的用户唯一标识符被用作统计。当然这里需要注意该方法只有网站本身才能够实现,因为用户 id 作为用户隐私信息只有该网站才知道其在 cookie 的设置及存放位置,第三方统计工具一般很难获取。

 

获取用户信息的途径

通过以上的方法实现用户身份的唯一标识后,我们可以通过一些途径来采集用户的基础信息、特征信息及行为信息,然后为每位用户建立起详细的 profile:

1) 用户注册时填写的用户注册信息及基本资料;

2) 从网站日志中得到的用户浏览行为数据;

3) 从数据库中获取的用户网站业务应用数据;

4) 基于用户历史数据的推导和预测;

5) 通过直接联系用户或者用户调研的途径获得的用户数据;

6) 有第三方服务机构提供的用户数据。

识别并获取用户信息的价值

通过用户身份识别及用户基本信息的采集,我们可以通过网站分析的各种方法在网站是实现一些有价值的应用:

1> 基于用户特征信息的用户细分;

2> 基于用户的个性化页面设置;

3> 基于用户行为数据的关联推荐;

4> 基于用户兴趣的定向营销;

……

来源:网站 数据分析

技术控是百度新闻与钛媒体合作,专门为技术爱好者打造的栏目

正文完
 
亚博电竞官方网址 copyright notice: our original article, by seo 2013-11-13 publish, total 2179 words.
转载说明:除特殊说明外本站文章皆由cc-4.0协议发布,转载请注明出处。
comment(no comments)
网站地图