笔趣阁

笔趣牛>三合大神之打工皇帝 > 第9章 技术天才的困境(第1页)

第9章 技术天才的困境(第1页)

网吧里的空气黏稠得像化不开的糖浆。

王雨跟着张伟穿过两排机位,脚下踩着黏腻的地板,发出轻微的“吧嗒”声。左边传来激烈的键盘敲击声,一个少年正对着屏幕吼叫:“上啊!傻逼队友!”右边飘来泡面的味道——红烧牛肉面,混合着烟灰缸里堆积的烟蒂散发出的焦油味。

“就在那儿。”张伟压低声音,指了指最里面的角落。

王雨看过去。

角落里只有一台机位,但摆着两台显示器。屏幕的蓝光映出一张苍白的脸——二十五六岁,头发油腻得结成绺,贴在额头上。眼镜片很厚,镜框歪斜地架在鼻梁上。他穿着件洗得发白的灰色t恤,领口处有污渍。

电脑旁放着半个馒头,已经干硬发黄,表面有细小的裂纹。还有一瓶矿泉水,只剩三分之一,瓶身蒙着水汽。

陈默的手指在键盘上飞舞。

王雨走近,看到左边屏幕上密密麻麻的代码。那是python语言,正在调试一个爬虫程序。右边屏幕上开着命令行窗口,黑色的背景上滚动着绿色的字符流。

“默哥。”张伟凑过去,声音放得很轻,“我又来了。”

陈默没抬头。

他的手指继续敲击,敲了三行代码,然后停下来,盯着屏幕看了几秒,又删掉其中一行,重新敲入。屏幕上的光标闪烁,像心跳。

王雨拉过旁边一把空椅子,椅子腿在地板上刮出刺耳的声音。

陈默的肩膀微微绷紧。

王雨坐下,没有看陈默,而是看向屏幕。他前世虽然没成为顶尖程序员,但在华强北混迹多年,修手机、刷系统、写简单脚本,这些基础的东西都懂。更何况,他见过太多后来成熟的技术方案。

“这个正则表达式写得太复杂了。”王雨开口,声音平静。

陈默的手指停在键盘上。

“第87行。”王雨继续说,“你用了三个嵌套的条件判断,匹配电商网站的商品标题。但淘宝和京东的标题结构不一样,你这样写,京东的商品会漏掉一半。”

陈默转过头。

他的眼睛在镜片后面,瞳孔有些涣散,是长期盯着屏幕的结果。但此刻,那涣散中闪过一丝锐利的光。

“你怎么知道我在抓电商数据?”陈默的声音沙哑,像很久没说话。

“右边窗口的日志。”王雨指了指,“‘正在解析jd。。。。失败,正则不匹配’。你写了三行错误处理,但没解决根本问题。”

陈默盯着王雨看了五秒钟。

然后他转回屏幕,把光标移到第87行。手指在键盘上敲击,删掉了那三行嵌套的条件判断,重新写了一段更简洁的正则表达式。

运行。

命令行窗口里,绿色的字符开始滚动:“正在解析jd。。。。成功,获取商品数据124条。”

陈默的肩膀松弛下来。

“你懂代码?”他问,还是没有看王雨。

“懂一点。”王雨说,“你这个爬虫,还有别的问题。”

“什么问题?”

“没有设置延迟。”王雨指着代码中的一段,“你用了多线程,十个线程同时请求。如果是小网站,早就把你ip封了。就算是淘宝京东,频率太高也会触发反爬机制。”

陈默沉默。

“还有,”王雨继续说,“你抓下来的数据直接存到本地txt文件,没有去重,没有清洗。等数据量大了,光是打开文件都要卡死。”

“那该怎么弄?”陈默终于完全转过身来,正对着王雨。

他的脸在屏幕蓝光的映照下,显得更加苍白。眼窝深陷,颧骨突出,是长期营养不良的痕迹。但那双眼睛——那双眼睛里有某种纯粹的东西,像燃烧的火焰,被厚厚的镜片和疲惫的面容掩盖着。

“用数据库。”王雨说,“sqlite就行,轻量级。抓下来的数据先清洗,去重,再存进去。查询的时候用索引,速度快。”

“我不会数据库。”陈默说得很直接。

“我可以教你。”王雨说,“但前提是,你得跟我干。”

陈默的眉毛皱起来。

“跟你干?干什么?”

“我叫王雨。”王雨伸出手,“在华强北有个小工作室,做手机维修,现在想拓展业务。需要懂技术的人。”

陈默没有握手。

他看了看王雨的手,又看了看王雨的脸,然后转回屏幕,继续敲代码。

“没兴趣。”他说。

张伟在旁边急了:“默哥,雨哥是认真的!他……”

王雨抬手制止了张伟。

他从口袋里掏出钱包,打开。里面有两沓钞票,一沓厚一沓薄。他抽出那沓薄的,数了数——三千块钱。

他把钱放在陈默的键盘旁边。

钞票是红色的,在屏幕蓝光的映照下,呈现出诡异的紫色。

已完结热门小说推荐

最新标签