剑桥分析丑闻爆发:当数据滥用遭到全人类的审判

刚把爬虫脚本的代理池切换到一个新的IP段,后台监控就弹出了CNN的新闻推送。手指悬在回车键上,没按下去。屏幕冷光里,“Cambridge Analytica”、“50 million”、“Facebook”这几个词像钉子一样扎进眼睛。胃里突然一阵发紧,不是饿,是那种干了坏事被当众揭穿的生理性心悸。

我们这行,谁没在酒桌上吹嘘过自己手里握着多少“数据”?爬公开信息,撞库,用cookie拼凑用户画像,美其名曰“精准流量运营”。去年还帮一个金融客户做过类似的事情,用爬来的社交情绪数据给他们的P2P产品做投放优化——本质上,和剑桥分析那套把用户心理弱点数据卖给政治竞选团队,有区别吗?都是把活生生的人,拆解成可预测、可触发的数据点,然后摁下开关。只是他们玩得更大,直接撬动了选举。我们以前总嘲笑那些大公司“又当又立”,搞个用户协议把自己撇得干干净净。现在回头看,我们这些在灰色地带狂欢的“手艺人”,连立牌坊的资格都没有,纯粹是裸奔。

技术细节上,剑桥分析的手法其实很“古典”。一个第三方性格测试应用,通过Facebook开放的API,不仅拿到了参与测试用户的公开信息,还顺藤摸瓜,把他们好友的数据也一并卷走了。这漏洞我们太熟悉了。爬虫领域有个心照不宣的规则:只要API没设频率限制,或者前端渲染的数据没做混淆,那就是“欢迎来取”。我们钻研反反爬虫,用headless browser绕过检测,用分布式IP池规避封禁,把DOM树解析玩出花来,就是为了更快、更全、更隐蔽地把数据扒下来。我们管这叫“技术攻坚”,是本事。但现在,这套“本事”被放在全球媒体的聚光灯下,成了“数字时代的撬锁工具”,成了“对民主的威胁”。那种感觉,就像你苦练十年开锁技术,终于成了行业大拿,结果发现你这门手艺最大的应用场景是入室盗窃。

最让我后背发凉的不是技术,而是“武器化”这个词。信息,或者说经过我们加工、定向投放的“信息流”,原来真的可以像枪炮一样,在认知层面进行精准打击。我们过去所有的优化,点击率、转化率、留存率,那些让我们兴奋的指标飙升,现在都蒙上了一层阴影。你优化的到底是什么?是帮用户更快找到他需要的商品,还是利用他性格里的焦虑、贪婪、恐惧,把他推向一个他原本不会做的决定?流量生意的原罪,这一刻无比清晰。它不是“存在即合理”的灰色,它就是黑色的。

团队里的小年轻还在群里转发段子,调侃扎克伯格要去国会“受审”。我一个字都打不出来。我甚至能预感到接下来会发生什么:全球性的数据隐私监管风暴(GDPR看来是挡不住了),平台方会疯狂收紧API,反爬虫技术会从猫鼠游戏升级为军备竞赛,所有依赖公开数据采集的生意,成本会急剧飙升,甚至直接断流。我们这种小作坊,首当其冲。

关掉爬虫脚本。把那个正在策划中的、打算融合社交平台数据进行“情感化营销”的项目文件夹,拖进了回收站。不是矫情,是怕了。我引以为傲的“黑客精神”,我对流量算法的病态渴求,在更大的审判面前,不堪一击。这根红线,现在必须画下来,而且得用焊枪焊死:绝不触碰用户核心隐私数据,绝不将用户画像用于任何可能操纵其认知的滥用。这不是道德高地,这是求生本能。技术没有善恶,但操盘技术的人,得知道手不能往哪儿伸。今天,这记重锤,算是把我敲醒了。

© 版权声明
THE END
喜欢就支持一下吧
点赞91 分享