半佛仙人:她其实没有那么喜欢你
1
前几天有人问我,说怀疑自己被监视了,他刚刚和朋友聊了几句玛XX蒂,一打开VX就看到一个玛XX蒂的五元代金券,你说这是巧合?这能忍?肯定是VX在监听他!
虽然这是个段子,但是“APP在监听用户”这个问题已经可以算是互联网都市怪谈之一,传播范围广,而且传的有鼻子有眼,好像事实就是如此。
我倒不能说这种怀疑不合理,毕竟精准推荐确实精准到像是在监视你,但较起真来,这些传说其实挺滑稽。
不是说大厂没有使用用户信息的这个需求,只不过对于大厂来说,窃听这个方法实在太不合算了。
做什么事情都要讲究一个性价比,窃听就属于性价比特别低的那种行为:成本高,不够精准,耗能大,随便就能被用户发现,根本不适合用来收集信息。
对商家来说,收集用户信息最终目的一定是要用,毕竟商家又不是偷窥狂,不可能只是出于对你的关心就每天研究你浏览什么网页。
收集信息要用来赚钱的,这就涉及到一个效率和准确度的问题。
收集信息如果准,“推送广告——转化——赚钱”的流程就能够跑起来;如果信息不准,推送广告就没得转化,也就没有钱赚,反而还会招来用户的厌烦。
如果冒着巨大“偷窥”风险录下来的声音不是用户对谈的信息,而是用户楼下的大喇叭日夜爆喊:“烤鸭烤鸭,正宗烤鸭!正宗烤鸭!”的声音,就会出现推送的误判。
手机一听,“烤鸭”这肯定是高频词啊,一定是用户想吃烤鸭了,赶紧推荐给用户,用户打开手机一刷,气到一口老血吐在屏幕上:“我天天听楼下卖烤鸭已经快烦死了,你还给我推荐?气死了,嘎嘎嘎!“
而且中国是一个方言很多的国家,口音特色较浓的方言已经是识别重灾区,一样的词在不同方言系统中的差别含义更是能逼死识别系统。
比如说系统监听,听到了一句“我充电宝掉了”,激动的推荐充电宝,看似是个完整的判断,但在不同地方,“掉了”是有不同含义的。一种是“不见了,消失了”,一种只是从桌子上掉到地板上,捡起来就行。遇到后面这种状况,你推荐充电宝,用户只会满头问号。
更别提持续在后台监听需要消耗的系统资源,常年开着这么大的一个后台程序,用户的手机必然变得发烫又卡顿,再一检查,是哪个程序悄咪咪的狂跑,当场就能抓出偷窥者,谁敢搞这样的长期监听?
如果真的要靠监听来收集数据,细想也不划算,因为监听了又不能本地做出判断,监听的数据得上传啊,把监听数据上传到服务器,不谈存数据的服务器需要花多少维护费,光这个上传流程就复杂到头秃。
总之,监听是个ROI极低的愚蠢方案,通过监听来偷听用户想要什么,既不精准又耗费资源。用这个方法来推广告,妥妥的赔钱啊。
2
排除了监听的坑,就有人开始怀疑是聊天软件直接监视了自己,一定是运营方在盯着自己的聊天记录,才会给出那么精准的推送信息。
不然为什么在VX上和对方聊过什么,转眼就能在TB上看到类似内容?
你先别激动,你想想,VX和TB都不是一家的,它们监视也监视不到一块去,早在2013年两位互联网巨头就拉黑了彼此,以至于到现在我们在两个平台上都没法直接跳转链接到对家去,如果要让VX和TB共享数据,世界和平也就不远了。
我分享一个数据给大家,在2018年VX超10亿用户的时候,VX官方数据表示,每天VX有450亿次消息发出。
你可以算算,每天你要在VX上面发多少沙雕表情包?说多少“嗯嗯”、“好的”、“么么哒”?让公司去分析这些带有大量冗余信息的聊天记录来给你推广告,是不是有点大海捞针的感觉?
用聊天记录来推送广告,数据处理费时费力费钱,企业怎么可能做这样费力不讨好,被抓到还要原地爆炸的事情?
我们只不过是大数据洪流里面的很小很小一部分,企业使用我们的信息,不是那么精细的。
3
精准推送是一种技术,而不是一种盗窃术,大家都害怕阴谋,但现实中用的多的都是阳谋,以现在的技术能力,完全可以用正规手段达到精准推送的目的。
真实的广告推送逻辑核心在于归类,在于给用户打上不同的标签,比如这批人来自“一线城市”,这批人是“女性”,这批人“喜欢打游戏”。通过不断的数据匹配,形成一个一个群体行为模型,进而给各个账号打上标签。
媒体平台或者数据公司只需要对用户群体进行兴趣意向的分类,针对这些标签进行大范围投放,完全就能达到个性化推荐的目的。
在大数据里我们都不是具象的个体,只是被归类进各式标签里面的群体画像。
每一条广告的投放范围动辄上万,甚至是百万量级,也就意味着会有无数人和你收到了相同的广告。
之前有人问我,她感觉自己被监视,因为系统每天都给她推送“成人自考本科”的广告,她感觉自己如果没有被监视的话,为什么广告方会知道她只有专科学历?
但在我看来这就很滑稽,因为我也每天收到同样的广告,在我眼里那些广告就像“渣渣辉”一样,属于暴力刷屏型的广告,一点也不精准。
有时候你以为是大数据针对你,但是实际上这是一个“孕妇效应”,也就是我们所说的“幸存者偏差”。
每天的一万条广告里可能只有10条是推送给你的,这10条广告里可能只有1条和你今天聊到的内容有关联,但因为我们的注意力只被这一个广告激活,反向联想起自己聊过的内容,就很容易出现“怎么我关心的东西总是会出现在我面前”的错觉。
你觉得看到了和自己刚说的话题有关的广告是因果关系,但很多时候根本没有必然联系,广告方还是在不断海投,只是比以前更容易命中你了而已。
人们总是会觉得自己独一无二,但是地球上有几十亿人,划分人格类型却只有16种,相似的人比你想的多,在数据的海洋里你们只是同一个标签下的一个拥有共同消费习惯的群体。
广告方更在乎用户对什么更感兴趣,更在乎自己投出一个广告,能不能控制广告成本,提高转化率,而不是花心思监视你平时发了多少魔性表情包。
媒体平台的目的,是通过大规模的数据分析和人群洞察帮助广告主找到那一批对广告更感兴趣的受众,并不会、也并没有必要针对某一个人的隐私进行挖掘。
被营销都赶不上定制服务,这说起来挺魔幻的,又过于现实。
4
再退一步说,像阿里、腾讯这样的大公司,没必要,也不敢去监听用户。
论技术他们是中国顶尖,论广告效果同样也是行业领先。
它们自己就是行业巨头,饭碗辣么大,为什么要为了一点用户数据去冒险?
大家害怕,只是因为觉得不偷隐私做不到那么精准的推送,但现行的法律规定已经对个人信息作出了相关规定,像阿里、腾讯这些大厂也都获得了ISO/IEC 27001信息安全管理体系和ISO/IEC 29151个人身份信息保护等多项信息安全领域最权威、最严格的国际认证,信息安全和隐私保护能力都与国际接轨。
担心大厂监听你的人生,确实没必要,他们有其他不违规的方法。
但是,这不意味着信息没有泄露,只不过信息泄露的方向并不在大厂这里,精准推送也不是隐私泄露的产物。
隐私泄露的直接产物是各种能爆出你详细信息的诈骗电话,而精准推送并不具备精准到个体详细信息的数据需求。
现在实现精准推送的主流方法,依靠的是程序化广告的力量。
这是一种行业通用、成熟地利用技术手段进行广告交易和管理的广告形态,它的核心是:在正确的时间和场景,通过正确的方式,将正确的商品展示到正确的用户面前。
程序化广告可以通过广告投放者的自有数据源或第三方数据管理平台,将人群特征进行批量分类,生成对应的画像和标签,但这些用户画像根本无法对应到真实世界中的某个用户。
广告主在不同的媒体平台上,通过组合多个人群标签来筛选目标人群,进行广告投放,如“一线城市、30-40岁、男性”,这样的一个标签组合动辄覆盖上百万人,根本不可能知道收到广告的你是张三还是李四。
而对规模足够大的公司来说,媒体平台自行收集的数据就足以完成这个分类的工作,监听、监视聊天记录都属于多余的行为。
5
互联网隐私泄露确实是一个严重的问题,尤其是智能手机刚爆发的那几年,滥用数据的事确实已经多到了影响用户的生活,当时以各种小贷为代表的扒通讯录APP把各种骚扰电话打到飞起。
后来国家连续出台法律法规,规范隐私问题,最早那批胆子大的数据大师大多已经在唱铁窗泪,还能在外面活蹦乱跳的,都很清楚自己什么能做什么不能做。
到这个时节还在搞用户隐私的生意,有一个算一个都是在搞违法犯罪的勾当。
大厂做公司是来赚钱的,既无必要铤而走险,成本上也不划算。
他们有更多方法可以变现,窃听用户、买卖用户隐私信息这种高风险低收益的事,根本没必要去做。
目前隐私保护这个领域已经得到了一定的重视,但是一些隐私黑产依然活跃在互联网的背面。
与其担心聊天软件会不会监控自己的聊天记录,给自己来个实时录音,更应该注意的是一些黑产的小手段。
当你在互联网上使用真名,没有给自己准备一个额外的手机号,在各种投票、调查、抽奖里填入自己的真实信息时,你的信息其实早已经泄露。那些你懒得删的验证码、银行通知、订单短信,都会在某个野鸡软件“申请读取短信验证码”的过程中泄露出去。
与其担心大厂盗窃数据,不如做好自己的信息保护:
很多填表的场合其实没有必要填真实信息。很多快递本来也送不上门,直接写进快递柜更安全。检查一下权限,其实大多APP根本不需要授权短信,双卡双待的时代,比起工作卡和生活卡,生活卡和账号卡的配置更稳妥。
我们解决不了信息泄露,但我们最少可以让信息泄露的内容更少一些。
当然,不被骗的方法除了从不暴露自己,还有一个选择是打死都不掏钱,只要你不肯掏钱,广告推的再多也没有意义。
只要我足够穷,就没有人能够收割我。
【补充文章】
比监听更精准的大数据分析,互联网行业的致富绝技——阿牛读财
昨天下午在办公室,跟同事随便聊天,聊起来一直单身的事情。一直聊到下班。
然后晚上回到家,在家里没事玩手机,某个三字购物平台就给我推荐了充气娃娃的购买链接。
大家都知道,阿牛是个正经人,从来没搜索过这种东西。
所以我非常怀疑,我下午的聊天内容被监听了。
后来我上知乎搜了一下,跟我类似经历的人还不少。
比如有网友偶尔去一趟南宁,吃到当地的赖尿虾,抱怨这个东西不好剥皮。
当天晚上回到宾馆,就收到某度推送的视频攻略:如何完整地剥出赖尿虾肉。
要知道赖尿虾这个名字,他这辈子第一次听说,之前根本不可能在手机上有过搜索。
还有一个网友,只是在家跟妻子聊天的时候,随口问了一句孩子的出生证明放在哪里了。
晚上就被某宝推送了出生证明的保护套。
类似的新闻,网上随便能搜出来好多。让人看着后背发凉。
难道我们的生活,真的已经被监控了吗?
现在跟大家做个调查,你有没有也遇到过类似自己疑似被监听的情况?
你相信手机在一直监听自己吗?相信的可以弹幕打1,不相信打2。
让我看看还有多少人不相信的。
监听这种事情,除非你是这几家互联网公司的高层,否则谁也没办法确定。
就算偶尔遇到过一两次疑似被监听的经历,也有可能是因为概率的关系。
毕竟某宝有8亿用户,假设商品关键词有100万个。
那么随机给8亿用户推送广告,其中总会有800人会收到特定某个关键词的消息推送。
这种解释也有一定道理,但是我不信。
2019年3月,《IT时报》的记者耗时3个多月的时间,通过模拟用户使用场景,对安卓手机、苹果手机、苹果平板电脑上的某团和某某么外卖平台进行多轮测试。
最后的结果是,在谈到产品名称的数小时内,app出现相关推送的概率高达60%~70%。
对于这次测试,这两家平台都回应说:没有偷听,只是个巧合。
但是在3月14日,这两家外卖平台都对IOS端做了一次更新,去掉了自己的麦克风权限。
安卓端的权限依然保留。
2018年,VIVO和OPPO发布了前置升降相机的手机。
也就是手机的前置相机,不用的时候收在里边,用的时候会弹起来。大家应该都见过。
然后有几家媒体都报道说,在使用某某浏览器的时候,浏览到部分网页,这个摄像头就会自己弹起来。
后来这家浏览器回应说,自己只是弹起摄像头,并没有拍照,也没有监控用户隐私。
这就像女朋友跟你说,她跟别的男生出去开房,真的只是玩了一晚上的飞行棋。
其实也有这个可能,对吧?
在这些T0级别的互联网大佬面前,大家的隐私一文不值。
如果小公司监控你的隐私,大家可以抵制它,把它骂死。
但是T0大厂监控你的隐私,就监控你了,你能怎么办呢?你能离开AT生活吗?
经过这件事后,几个手机大厂和互联网大厂坐在一起,对软件和产品做了一些优化。
目前手机摄像头已经不会随便自己弹起来了。
至于其他手机的摄像头会不会自己偷偷打开,谁也说不清楚。
这个故事告诉我们,升降相机挺好的。
至少在你用手机看激情小电影的时候,它不会偷偷记录下你那张流着口水的脸。
当然,如果你能不发出声音的话,就更好了。
可能有人会说,我把手机的摄像头和录音权限都关闭,问题是不是就解决了呢?
这就太天真了。
今年2月,来自浙江大学网络空间安全学院的任奎教授团队、联合加拿大麦吉尔大学、多伦多大学学者团队,一起发布了一份研究成果。
这项研究可以在用户不知情,无需系统授权的情况下,利用手机内置的加速度传感器来采集手机扬声器所发出声音的震动信号,实现对用户语音的窃听。
简单说,就算你直接在硬件层面把话筒拆掉,想要监听你仍然可以实现。
重点是,按照目前的监管制度,这项技术并不违规。
浙江大学在互联网行业名声很大,走出了很多著名校友,大家有兴趣可以自己去查一下。
2017年,浙江大学还跟杭州的一家T0互联网集团成为战略合作伙伴。
作为互联网大佬,如果想要监控大家的隐私,根本就没有任何障碍。
甚至都不用违规。只要你买一部手机,天天带在身边,主动权就落到了对方手里。
你的手机会不会被监听,你是无能为力的,只取决于对方是不是想要监听。
那么,这些互联网大佬想不想监听我们的手机呢?
为了这个问题,阿牛又查了一些资料,还请教过在互联网公司相对高层的一些朋友。
结论让人即开心又心酸。
对于大多数互联网公司,根本不需要监听用户。
他们做决策,实际上依赖的是一个可靠的大数据系统。
这个大数据系统的准确度,要比监听用户获取的数据更准。
比如一开头的两个例子。
某度给用户推送赖尿虾剥肉视频,很可能只是根据地图数据,分析用户到达南宁。
同时分析了用户的年龄、收入和消费习惯,了解到这类人只要去南宁,大多数都会吃赖尿虾,其中又有一大部分会为了剥皮发愁。
另一个例子里边,用户收到某宝推送的出生证明保护皮。
很可能是平台根据他过去购买奶粉和母婴用品的行为,知道他有一个3岁的孩子。
最近幼儿园开学,大概率会用到出生证明。
他们分析用户行为,根本用不着监听这种下三滥的行为。
在这些互联网大佬眼里,我们的每一次出行,每一笔消费,每看一个视频都被记录在案。
通过这些数据,互联网公司不仅可以了解你,甚至可以比你自己更了解你。
你跟女朋友分手之前,他们可能早就通过你女朋友的酒店消费记录,发现你被绿了。
你被老板辞退之前,他们早就通过你上班时间摸鱼打游戏的记录,发现你不适合这份工作。
明明你还在减肥,他们早就知道你坚持不下去,给你发来一张肯德基优惠券。
在恐怖的大数据面前,监听简直就是小孩子过家家,太low了。
前段时间微博上有个热点,可能有人听说过。
如果你不知道自己的消费能力有多强,可以去某宝搜一下“连衣裙”,把列表中第二个和第三个商品算一下平均价,就大概知道自己的消费能力了。
如果弹出来的商品单价都低于128元,那么你就可能被系统定位为低价人群。
监听只能听到你的语言,而且你还不一定说实话。
通过大数据分析,却能够从本质上了解你。
一边是通过监听,发现你跟朋友吹牛一下午,准备买奥迪。
另一边是通过历史消费行为,发现你的购买力只能买雅迪。
换你是某宝,应该怎样推荐呢?哪种信息更有价值,不用我说了吧?
除了某宝,还有某音的视频、某易的云音乐、某信的公众号文章、某团的电影票。
所有这些平台,通过对大数据分析,都有可能比你更了解你自己。
举个最简单的例子,如果不是某易云,我都不知道自己有抑郁症。
在这个互联网上,我们每个人都被精简成一个ID,还有ID背后的一连串数据。
互联网公司会通过这一串数据分析我们过去生活怎样,现在是什么状态,为我们推荐未来的行为。
比如1000万人被同时推荐一部电影,其中100万人选择了购票观看。
那么平台下次推荐的时候,这100万看过相同电影的人,选择行为就会产生更强的统一性。
算法的每一次推荐,不仅是在训练自己,也是在训练用户。
可能过不了多久,我们所有人都会被这套算法,训练成流水线上统一的产品。
至于你究竟是谁,你过去是谁,根本都不重要。
现在再问大家,还是那个问题:你觉得监听你的声音,有价值吗?
阿牛曾经跟一个小姐姐聊天,问了一个很多直男都纠结的问题:
穿短裙出门,会被流氓偷拍。那你为什么还要大冬天的,穿个短裙出门呢?
小姐姐回答说:比起遇到流氓,更惨的是你穿了短裙,却没人回头看。
【完】