“App真的会偷偷录音,然后给我推销东西吗?”

点击“ 技术领导力 ”关注    每天 早上8:30 推送

作者| Mr.K   编辑| Emma

来源| 技术领导力(ID:jishulingdaoli)

01

一位读者留言,怀疑App在对自己录音

一位读者给老K留言,他怀疑自己的APP在对自己录音。 经常出现一个状况是,自己和人谈论一个事物,然后不久后,自己在购物APP或者搜索引擎、浏览器、APP的广告页中就看到了相关的广告,让人非常恐慌,觉得有一双神秘的眼睛在看着自己,非常害怕。

比如刚跟同事讨论中午吃日料,某评网就给自己推荐周围的日料店促销信息。 刚跟女朋友通完电话,说要给她生日惊喜,某宝就给自己推送“一生只送一个人的玫瑰”、“驴牌包包”等礼物。

02

App真的会偷偷录音,然后给我推销东西吗?

商家广告推送的目的是要追求转化率,商人逐利,以最低的成本,追求利益最大化,他看的是性价比。

从技术方案成本收益的角度来看,偷偷录音的效率低、误差率高,但凡有一定商业常识的人都不会这样做。

假如有技术极客想挑战一下呢? 那么他一定会亏得比X多多还要多,入不敷出,用不了多久就关门倒闭,所以你在市面上很少看到录音的解决方案。 安防的例外,跟我们探讨的商业场景要求不同。

首先,如果你要做录音方案,你绕不过的就是APP资源占用,持续的录音,对于一个APP而言是很大的负载,导致的结果就是APP运转效率低下,耗电发热大幅增加,可以顺便煎个5分熟的荷包蛋。

其次,录下来的音频你要怎么保留? 本地保留? 这个音频文件会大到超乎想象,一个APP录音录一天,最后录音文件几个G,而且有的用户,直接看你源文件夹,一旦发现录音,拿到证据,你就等着当被告吧。

再次,你也许会尝试在线传输。 别忘了,用户的流量是要钱的,而且用户定期看手机流量记录的时候,发现就你一个APP耗流量特别大,还不是视频类或者游戏类APP,分分钟就暴露了。

最后,你想尝试本地直接解析,只留存文字,这个倒是可行,但是最大的问题在于,你要小心竞争对手反编译你的安装包,一旦被人看到相关代码和模型,你就保持沉默吧,因为你所说的将会成为呈堂证供,就算请TVB的大律师也帮不了你。

实际上很少有互联网公司会把复杂模型布置在本地,因为太容易被对手直接破译,而如果用云模型的方式做录音解析,流量消耗和网络稳定性也会让准确度大大降低。

从技术上,录音是不太合理的方案,不是说不能做,而是做起来成本高,又容易给自己惹麻烦。

03

虽然App不会偷偷录音,但可以收集关键词

偷偷录音的技术方案成本太高,许多互联网公司采用更加经济的方式: 收集关键词,就可以达到同样的效果。 收集的方式也是多种多样的,下面我们简单列举几种场景:

语音输入的方式 当你打开智能助手,如siri、小杜小杜,小爱同学,你跟它说“放首朋克”,或者“最近的高尔夫球场”,你在不知不觉中,主动提交了关键字,通过收集、分析这些关键字,App就很容易知道,你的消费层次、年龄、性别等信息。 比如,你听古典、询问红酒、高尔夫的知识,不难判断出你是一位上海张江,中产油腻大叔。

输入文字关键字 当你打开App主动输入关键字,例 如是外卖类APP,它会唤醒词库匹配包含的词,只要你说出了类似的词汇,那么可能就会唤醒推送。

例如OTA类APP,这种唤醒词库可能包含奶茶,披萨,烤串,麻辣烫,哈密瓜等等词,只要你说了类似的词,那么可能就会唤醒推送。

再例如购物类APP,唤醒词库可能包含口红,靴子,裙子,水果,笔记本等等词,只要你说了类似的词,那么可能就会唤醒推送。

每个APP的词库,可能都有数千乃至数十万的词,基本覆盖了你可能性的消费场景,比你更懂你是分分钟的事情。

技术其实就是这样,很多很神奇的功能,拆穿了也就那样,就和魔术一样。

简单来说,就是一个唤醒脚本+词库的事情,并没有多了不起的技术。

04

App偷偷收集个人信息,有哪些途径?

第一,输入法 谁能知道你的一切? 当然是输入法了。 别总是怀疑什么APP监控你的聊天记录,你首先要怀疑的是,你的输入法有没有卖你。

只要你打字,你一定躲不过的就是输入法,你输入了什么内容,在什么地方输入,比如搜索引擎、社交软件、地图、短信、跟卖家讨价还价,这对于输入法都是透明的。

而且你经常输入哪些词,代表了什么意思,并不难获得或者分析,上面说的语义分析难是针对纯音频的,纯文本的语意分析可是相对成熟的技术。 另外所有输入法都是越用越好用,越用越懂你,那么,到底是怎么懂你的? 你可以思考下。

第二,推送SDK 什么叫SDK? 你可以理解为是软件包,嵌入APP中执行特定功能的特定模块。

最流行的SDK是推送类SDK,就是你手机收到的各类APP推送消息,是有专门的公司做成SDK嵌入到各大APP里,然后专门负责推送,比自己开发要好用很多,而且专业SDK往往对于各类手机和应用的适配做的很好,所以一般APP都是外采推送SDK的。

你手机上20个APP,可能都是同一家公司提供的推送SDK,那么对这家公司而言,你的手机基本是透明的,而且很显然会知道一台手机到底装了哪些APP,用户到底常用什么APP,甚至用户对于手机的应用轨迹,应用行为。

这些行为就可以被做成标签,然后打包交易,这个市场目前很成熟。 国内推送SDK的巨头,最大的就那3家,对外出售标签数据都挺积极的。

第三,用户行为埋点SDK 几乎所有大厂的App,都会收集用户行为,比如,你浏览了哪些页面,停留了多久,从哪个页面离开,点了哪个按钮等等,通常有实力的大厂会自己开发埋点SDK,没能力开发的也会使用第三方公司提供的SDK。

收集这些信息的本意是用来帮助产品经理做数据分析,以改善App的用户体验,但是数据是否被合理的使用,是否存在泄露的风险,就不得而之了。

当你知道输入法和SDK的时候,你对于世界的认知会发生变化。 当你收到广告的时候,你甚至可以去分析到底是哪个卖了你。 是搜索引擎?还是你在搜索引擎时候用的输入法,还是监控你手机APP活跃度的SDK,还是你的一些语言触发了词库?

很多人其实被卖的时候都不知道自己是怎么被卖的。 猜谁卖你这个事情其实很有意思,只稍微留心,就能抓住那个出卖你的App。

05

写在末尾的话

作为一名资深技术人,老K是认可技术无罪的,同时技术也需要被约束,数据给我们的生活带来便捷,但数据被滥用就会失控。

一个简单的动作,能够帮你降低个人信息泄露的风险,当第一次使用App的时候,都会弹出授权提示框,以下是各类授权涉及个人隐私的范围:

1、通讯录。 访问通讯录就会获取到你手机里面存的所有手机号码。

2、相机。 访问相机就能使用相机进行拍照,拍视频。

3、照片。 访问照片就能读取相册里面的所有照片。

4、GPS。 访问GPS 就能对手机进行定位,知道你的精确位置。

5、麦克风。 访问麦克风就能使用手机录音,另外还有访问短信记录等等。

对于像微信、淘宝这些值得信任的软件,一般不会有什么问题,可以根据需要授予相应的权限,而对于不知名的软件就需要谨慎对待了, 毕竟隐藏安全太重要了。 比如,一个手电筒App,想要你授权通讯录、麦克风、相机,就知道这一定是个恶意收集个人信息的流氓软件,要果断删掉。

人是复杂的,人性是自私的,不希望有一天,我们变成大数据的棋子。

参考:

1.《APP到底有没有对你录音?》 ,半佛仙人

2.《这类app竟然会偷偷录音!》,聚焦科技

作者简介 K ,知名电商公司技术老K级人物。武做过CTO,文出过畅销书,带你一起洞见技术新时代。

如果觉得文章对您有帮助, 请转发朋友圈、点在看 ,让更多人获益,感谢您的支持!

大家在看:

1. 马化腾:普通人追求安全感,高手拥抱不确定

2. 马云:核心团队是剩下来的,不是选出来的

3 . 中台干货!百度/小米/滴滴/京东中台实践

4. 张一鸣:人才不是核心竞争力,机制才是!

5. 阿里王坚:真正的理想主义,都是拿命来填

6. 大数据,倒在2019

7. 媳妇沉迷赌博输了套房,我一怒之下...

-End- 

想看更多独家精彩推文?

关注“技术领导力”公众号

想加入社区,跟100位互联网大咖学习?

添加群助理Emma, 注明“加群”

技术领导力社群

好看就点 在看

我来评几句
登录后评论

已发表评论数()

相关站点

+订阅
热门文章