这支刚刚成立不到半个月的全新团队,没有任何对外的业务,连公司内部的其他高管都不知道他们具体在研究什么。
“李总,底层的分布式存储架构已经搭建完毕了。”
研发主管递上一份报告,“根据您的要求,我们已经开始将微博、爱奇艺、B站这三大平台的用户行为数据,进行脱敏后的大规模抓取和存储。”
“不过……李总。”
主管有些不解地问道,“咱们目前只是在做单向的数据存储,并没有做实时的响应和调用接口。这些海量的点击、停留时长、点赞、甚至是滑动屏幕的速率数据,如果不去实时处理,存下来有什么用呢?”
在2010年,绝大多数互联网公司的逻辑,还是“人找信息”:用户去搜索自己想看的东西,平台再给出结果。
花天价挖来这么多大牛,每天光是维护服务器的存储成本就是个天文数字,却不做实时响应,这在技术人员看来完全是资源的极大浪费。
李锋看着屏幕上那些跳动的数据流,眼底却闪烁着颠覆时代的狂热。
“不需要实时响应。”
“我要你们做的,是算法大数据的从0到1!”
“不要去管用户现在在搜什么,我要你们利用这些海量的底层数据,去给我喂养出一套大规模的机器学习系统!”
The content is not finished, continue reading on the next page