风铃厂家
免费服务热线

Free service

hotline

010-00000000
风铃厂家
热门搜索:
技术资讯
当前位置:首页 > 技术资讯

互联网数据工程师将用户信息变废为宝

发布时间:2020-03-10 10:18:16 阅读: 来源:风铃厂家

A5交易A5任务 SEO诊断淘宝客 站长团购

CFP供图

别小视你线上生活的每个小动作,你在搜索框上输入的关键词、每一次随便的签到、社区里留下的不起眼的评论、在购物网站上的一次次消费这些看起来浩大如恒河微沙的行动记录,在互联网公司眼里却是座宝贵的金矿。在其身后,数据发掘和开发的工程师正日以继夜地运算着你们的信息,将之变废为宝。

裸奔时期

商人、教师、警察,谁的银行信用更好?

一次闲谈中,一名在银行负责信用卡业务的朋友给我讲了这样一个玩笑故事。在信用卡起步阶段,银行从业人员凭经验认为警察信誉是最高的,教师次之,商人最差。但当银行对他们消费和还款数据的积累日渐丰富,分析结果出乎人的意料之外。

最初的结论几近被完全颠覆:警察的信誉最差,教师还款最及时,但消费偏向理性很少透支,而商人信誉居中,却对银行的利润贡献率最高。谁是最优良的信用卡客户的答案呼之欲出。

固然这只是个段子,权当玩笑,如果你是警察可不要见怪。现在只凭职业这个单一的维度做出判断的做法,在银行从业人员看来明显低级而不可信。为了更好对症下药,他们需要得到你更多的信息。有这想法的绝对不止银行。而且他们的胃口越变越大,巴不得掌握你24小时吃喝拉撒睡的所有信息。

在这一点上,互联网公司们完胜。看看中国互联网络信息中心(CNNIC)的《第29次中国互联网络发展状态统计报告》,截至2011年12月底中国网民范围到达 5.13亿,2011年网民平均每周上网时长为18.7个小时。恐怕没有其他行业公司能与客户有这么长时间的密切接触。

说到线上生活,我们绝大部分时间都是坦荡荡的正人君子,上微博实名注册、网购只为自己的糟糠女友埋单,同学录上只晒一家子的密切照可难免也有这样的时刻:给情敌匿名发一堆肮脏下流话,深夜悄悄在网站订购一个充气娃娃、某网站的照片让你辗转反侧固然这样的时刻绝对不会让你的亲朋好友知道,但总有那末一双眼睛在盯着你呢。

事实就是如此。哪怕你在搜索框随意输入一个词组或单字,都会被记录在案,并成为老大哥分析你行动轨迹的优良信息源。纳尼?我还没有登录啊!老大哥笑了:你没登录也是一样的。更遑论你的阅读记录、外出行迹、跳转轨迹、好友关系、购买记录、支付情况1上网,你就没有遮羞布了。

仿佛有点耸人听闻。其实在你成为他们用户的那一天起,不管你是否是仔细看了那个又长又晦涩的隐私政策,你点击下一步以后,他们就心安理地取得使用你这些数据的授权,而保密原则也一并在法律的限定范围以内。在此以后,你不发现你使用互联网已愈来愈方便了吗?乃至方便得有些奇异。

你会发现微博已愈来愈了解你了,它给你推荐的人愈来愈靠近你线下的圈子,电子商务网站也愈来愈懂你了,你没必要再发愁怎样找到心仪的那件商品,乃至你会发现有些推荐商品比你本来想买的更合适你(有可能更贵)。

如果你已经习惯于沉溺在谷歌这个生态系统,那就更节省你的脑细胞。只要在任何一部安卓手机上、Gmail、Chrome浏览器、中文输入法、G+乃至就在 登录你的账号,你的搜索、通讯、社交等等行动都一并被它整合到一起综合分析,借助它那奇异的Google AdSense,Google Analytics的处理分析,加上今年3月1日谷歌关于这些服务隐私政策统一的通告扫清你会抱怨的障碍,谷歌简直对你了如指掌。

你上 Youtube,首页可以根据你在谷歌的搜索记录分析给出更个性化的推荐,或你在Google Music听了一首歌又被你分享或竖了大拇指,当你转到某电商网站,后者会给你推送这整张专辑的促销信息,又或某天你通过圈子里的好友,找到了曾有一面之缘相谈甚欢但又忘了互换联系方式的好友的好友。

神秘配方

你就在一次次不自觉的主动提供信息的同时与老大哥产生互动,在老大哥那边这叫UGC(User Generated Con-tent,也就是用户生成内容的意思)。随着时间的推移,你的UGC越丰富,老大哥对你越发了如指掌。哪怕你觉得毫无意义的一次跳转或签到,他们都想知道。

这就是他们的商业模式,在你看来乃至是垃圾的信息,都是他们珍视的金矿,或是核心资产,通过处理分析,将它们批量打包卖给视你们为潜伏消费者的商家。

所以,数据发掘和分析这门活计,几近是从每个互联网公司自诞生之日起就开始要做的,由于光搜集你在网上任何蛛丝马迹的信息远远不够。一般而言,除非你是日砸千金的VIP,老大哥不可能一对一对你做个性化服务,因此你只能作为被整合到统一特点范畴的整体当中的一个样本,有时候你作为男性的1份子被发掘和分析,而另外一些时候你又作为摇滚乐爱好者当中的一员被他们研究。老大哥根据他们的经验不断炮制和修正他们的算法,从而更精准匹配你的需求。

这里牵涉两个层面的问题。一个是对你贡献的数据的搜集、发掘和分析;另一个则是,有了关于你作为你的整体特点以后,能用这些知识去做甚么而快速地赚到钱呢?之所以说数据并不是万能的,就体现在第二层面的问题上,乌龙就在所难免了。

比如,某个新闻门户根据你的历史点击,记录你在每一个页面上停留时间还有阅读的内容,因而后台的工作人员开始假定了:你看军事的内容比较多,那估计你是20多岁年轻男子;如果你看的八卦内容比较多,那估计你就是20多岁的女孩。基于这些假定,他们本可以针对你做个性化内容的推荐了,比如判断你是个男生,就给你推时政新闻或是啤酒节的消息。但是,可能昨天阅读太多军事新闻只是你一时兴起,兴许今天你转而对某个明星的八卦感兴趣了。因而,你极不耐烦地把鼠标移到右上角点了叉。

因此你会发现,到现在也没有哪一个新闻门户会真的这么做。他们还是会等量齐观地向你展现经过他们分类编辑好的统一的信息页面。究其缘由,不只是你的兴趣是波动不定的,但说到底,还是由于他们对你了解不够透彻。虽然他们知道你昨天刚买了个电脑,但鬼知道你今天要看的就是牛崽裤呢?

所以,后台那些整日揣摩怎样从你行动轨迹上发掘你需求的工程师们,要挖空心思调剂假定、修正算法。数据大牛们只要看看一个互联网公司搜集数据的基础表格都可以大体知道这家公司的数据沉淀及数据运用水平了。这可是老大哥们赚钱的命根,这些数据乃至工程师们最引以为傲的算法,保密程度不亚于可口可乐的配方。

固然了,他们即使有再强大的算法,还要有劳您继续日复一日地去阅读网页、去交友通讯、去签到、去下单买东西啦!他们恨不得网络就是你的全部。

老大哥

英语里有一个专有名词,BIG BROTHER,直译为汉语便是老大哥,典出乔治奥威尔的名著《1984》。

时间到了2000年,当1984成为一个过去的时间符号的时候,英国生产了一档电视文娱节目《BIG BROTHER》,电视台召集一些年轻男女,把他们放到一个四周布满摄像头的公寓里,拍摄他们的生活然后剪辑播放。同时,在电脑技术领域,出现了一款同名软件,功能为系统监视。

无论是电视文娱节目还是系统监视的得名,都来源于《1984》里的一个经典场景:老大哥在看着你!在小说《1984》里,乔治奥威尔为我们描写了一个无处不在的老大哥形象:一个无时无刻无所不在的老大哥监视着所有人的一举一动,无论是吃饭、睡觉、工作或走在街上、躲进洞穴-包括思想活动。

成都到宁夏物流专线公司

成都到芜湖物流

成都到潍坊物流专线