AI实战王思聪：写个OCR外挂，让Python帮我答题赚钱-Flovico-AI商业实战教练

手指在机械键盘上敲下最后一行adb shell screencap命令时，窗外天已经彻底黑了。屏幕上的手机投屏画面卡了一下，一张“芝士超人”的题目截图稳稳落在了D盘temp文件夹里。2018年开年这波直播答题疯了，百万奖金池，但后五道题根本是反人类——给你三秒，问“以下哪种鸟类的求偶舞蹈包含‘月亮步’”？你他妈用手速去百度？

我绝不允许。在拼信息检索速度的领域被机器淘汰，是对我过去两年死磕爬虫和Python自动化最大的侮辱。题目就在屏幕上，像素而已。那就让程序自己去看，自己去搜。

核心就三板斧。第一斧，抓屏。ADB工具链配scrcpy把安卓机画面实时投到电脑上，写个监听线程，检测到画面特定区域（就是出题框）像素突变——通常是变白或出现文字轮廓——就触发截屏。这里坑太多了，手机型号不同分辨率得自适应，截屏延迟必须压到200毫秒内，不然下一题都出来了。

第二斧，识字。Tesseract OCR，开源老将。但直接扔进去识别率惨不忍睹。直播字体花里胡哨，背景还有光影流动。预处理是关键：灰度化、二值化、降噪，再用OpenCV做个轮廓检测把题目文字区域抠出来，单独喂给Tesseract，配训练好的中文数据包。这样下来，十四个字以内的题目，识别准确率能拉到95%以上。错的那5%，就是“赢”和“嬴”这种坑，得靠后面的搜索算法去纠偏。

第三斧，也是灵魂，搜。光识别出来没用，三秒倒计时，人工打开浏览器都来不及。我的策略是暴力多线程。主线程拿到识别出的题目文本，先做一轮简单的NLP分词，剔除“以下”、“哪个”这些无意义停用词，提取核心关键词组合。比如“鸟类求偶舞蹈包含月亮步”，拆成三个搜索子任务：“鸟类求偶舞蹈”、“月亮步鸟类”、“求偶舞蹈月亮步”。每个子任务扔进一个线程，同时用requests库并发请求百度搜索的API——对，那时候简单，没现在这么严的频率限制。

搜回来的HTML页面，用lxml和BeautifulSoup暴力解析，直接抓取前十条结果的摘要文本。然后，写一个简单的词频统计算法：把三个选项文本也分词，比如A“帝企鹅”、B“信天翁”、C“园丁鸟”，去和所有搜索结果摘要做交叉比对。哪个选项名词在搜索结果里出现的频率最高、关联度最强（比如“园丁鸟”和“求偶舞蹈”、“月亮步”同时出现的段落多），哪个就是答案。逻辑简单粗暴，但有效。从截屏到答案高亮显示在辅助屏幕上，整个过程被我优化到了2.8秒左右，刚好卡在倒计时结束前。

跑通那一刻，我靠在椅背上，感觉脊椎骨都在发麻。不是累，是那种极致的、冰冷的掌控感。看着程序自动刷题，自动答题，账户里的奖金和复活卡噌噌往上涨，朋友圈晒出“12连胜”截图时，下面一水的“求外挂”、“大神带带我”。那种感觉，比赚了点小钱更让人上瘾。你用常识和手速，我用ADB、OCR和多线程。这根本是两种维度的竞争。

技术，在规则缝隙明确的场景里，就是绝对的统治力。哪怕这统治力只能持续几个月，甚至几周，直到平台更新反制措施。但那一刻，你就是黑客帝国里的尼奥，看见的都是流动的绿色代码，而别人还在血肉苦弱地拼手速。这种快感，是会上瘾的毒药。我知道这路子野，不长久，但2018年的我，要的就是这种病态的、碾压式的效率证明。证明我这几年啃下的Python、爬虫、正则表达式，不是白费的。证明在信息差变现这个最原始的互联网战场上，我的枪，比别人快零点几秒。

零点几秒，就是赢和输的区别。就是野蛮生长时期，唯一的生存凭证。

文章版权归作者所有，未经允许请勿转载。

THE END

AI实践