第1745章 一句话点醒了贾瀞雯(2/2)

我们马上记住本站网址,www.kcbook.pro,若被浏/览/器/转/码,可退出转/码继续阅读,感谢支持.

团队有点……泄气。”

她停顿了一下,继续说:“我也……压力有点大。

钱花得比预期快,效果却出不来。

我有时候想,是不是我能力不够,是不是换个懂技术的人来管会更好。”

电话那头安静了一会儿。

“瀞雯,”陈浩的声音清醒了一些,“你听我说。

首先,你做得很好。

从零到有,你们已经做出了能工作的搜索引擎,这本身就是突破。”

他的声音很温和:“速度慢,准确率低,这太正常了。

知道谷歌的第一版准确率多少吗?也差不多这个水平。

所有新技术都是从粗糙开始的。”

“可是……”贾瀞雯想说些什么。

“没有可是。”陈浩打断她,“你现在需要做的不是自责,是调整策略。”

贾瀞雯坐直身体:“怎么调整?”

“分阶段解决。”陈浩说,“速度和准确率是两个问题,不能同时解决。

我建议,先不管准确率,全力扩大收录量。”

“什么意思?”

“你们现在收录了多少网页?”陈浩问。

“一万左右。”

“太少了。”陈浩说,“一万个网页的搜索引擎,就像只有一百本书的图书馆,再好的检索系统也没用。

用户搜什么,你都可能没有。

所以第一要务,把收录量做上去。

十万,一百万,越多越好。”

贾瀞雯思考着:“可是收录量大了,速度不是更慢吗?”

“那是下一个阶段要解决的问题。”陈浩解释,“你先让用户能搜到东西,哪怕准确率只有百分之三十,但如果网页基数大,用户总能找到一些有用的。

有了这个基础,我们再优化算法,提高准确率。”

他顿了顿:“瀞雯,做产品不能追求完美。

尤其是创业阶段,先做出能用的东西,让用户先用上,再慢慢改进。

如果总想一步到位,可能永远走不出实验室。”

这句话点醒了贾瀞雯。

她想起陈浩之前说的——第一版可以粗糙,但要快。

“我懂了。”她说,“先解决有没有,再解决好不好的问题。”

“对。”陈浩笑了,“明天就这样跟团队说。

集中力量扩大爬虫规模,优化抓取效率,把收录量做上去。

至于速度和准确率,暂时放一放。”

电话打了半个多小时。

挂断时,贾瀞雯觉得心里踏实了很多。

她打开灯,拿出笔记本,开始写新的工作计划。

第二天开会,她把陈浩的策略传达给团队。

“陈总说,我们现阶段的目标是收录量。”贾瀞雯在白板上写下“十万网页”四个字,“三周时间,把收录量从一万做到十万。”

李明眼睛一亮:“这个思路对!现在我们总是纠结算法优化,但数据量太小,优化了也看不出效果。

先把数据堆上去,再谈怎么用好这些数据。”

张涛也点头:“爬虫部分其实可以改进。

我们现在是单线程抓取,太慢。

可以改多线程,同时抓多个页面。

还可以优化去重算法,减少重复抓取。”

“索引结构也要调整。”王磊说,“数据量大了,现在的结构肯定撑不住。

得设计新的存储方案。”

团队重新有了方向。

当天下午,他们就开始分工:李明负责优化爬虫,张涛改进索引结构,王磊和其他两人处理数据存储和服务器扩展。

【跪求礼物,免费的为爱发电也行!】