注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

沈禄政的博客

关于互联网、移动互联网的记录,以及个人的雪茄爱好

 
 
 

日志

 
 
关于我

人大经济学研究生,7年互联网从业经历。专注于新媒体、移动营销。

网易考拉推荐
 
 

数据挖掘微博技术营销的基础  

2011-11-25 10:00:54|  分类: 默认分类 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

微博自身的运行机制,决定了如果要依靠技术手段实施微博营销,数据挖掘就是一个无法绕开的必然选择。微博中最具营销价值的除了人本身外(针对人的营销不能完全依靠技术,人与人的对话才是最重要的),就是大量的、快速变化的数据。相对于其他的营销平台,为博营销更需要从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息,甚至是微博用户的心理特征。

微博数据挖掘是为了能有效的采集、处理、展示微博大容量信息。其中当然包括用户id、姓名、省份、城市、注册时间、微博发布时间、性别、是否是认证用户、好友数、粉丝数、发表的微博条数、发表的微博等。但这些绝不是全部,甚至可能是微博海量信息内容中价值最低的那部分,所有这些刚性数据,通过微博平台开发的用户接口很容易获取。但是微博中数据挖掘的根本目的并不是为了要获得这些显而易见的刚性数据,而是为了对这些数据进行精炼,从中发现对企业对营销有价值的关联。

首先是数据过滤,微博中存在海量的内容,即便是筛选出可能与企业相关的内容,可能仍然是巨量的数据,一个企业难以消化。同时微博因为内容的随性和简短,也附加了大量的符号和网络语言,这些为分词带来麻烦。如果通过从海量微博内容中筛选与企业相关的信息这种方式,很难做到足够的精确。反过来可以设定与企业自身相关的分词去寻找微博对应的内容,同时辅以特定用户筛选,很容易找到微博中产生的与企业异常相关的内容,并加以跟踪。从企业自身出发,去微博寻找配对内容和用户的方式能有效解决海量内容难以消化的问题。

其次微博中的内容太过随性,便捷的发布、交互方式带来的一大问题就是信息质量泥沙俱下,信息真假难以识别。微博用户发布信息并不单纯,所发的信息也并非都是自身本意。微博的社交关系很容易卷入用户,让用户被动的发布某些正在被传播的信息,以期让自己也成为某个群体内的一份子。不少微博用户转发某个内容并不是赞同或反对,甚至并不是发自内心的愿意去转发,仅仅是为了表达我是一份子、或者我认可发布者、或者重在参和。在这种情况下信息与用户实际上是割离的,只有历史跟踪历史数据才能判断是否是用户的真实意愿,对非原创微博大多要经过这种判断。

再者随着微博向社交网络演进,微博平台内的信息形式会越来越不一致,现在绝大多数是以文本的方式呈现,未来会有大量的普通用户会被分流到一个个具体的应用。虽然应用的底层和数据接口大都是一样的,但每个应用本身的呈现方式和信息、用户在其中的流转方式都不一致,很难实现统一处理。除了数据挖掘算法本身的改进,与微博平台底层更为紧密的捆绑才能在数据获取上有更多的优势(沈禄政/文)。

  评论这张
 
阅读(180)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017