他二十七岁,中科大和微软亚洲研究院联合培养的博士生。
去年从合肥到了一趟北京,跟着导师的组看完了HintOn组在ILSVRC比赛上用AleX把传统方法打得落花流水的完整论文。
他当时就坐在微软大厦十二层的组会室里,咖啡都顾不上喝,盯着屏幕上那个把所有传统方法甩开将近十个百分点的成绩,心里某个地方“咔哒”一声,被什么彻底撬开了。
那种感觉,他后来想了很久——大概类似于在一片乌压压的普通人里,突然认出了另一个同类。
然后他就扎进去了。
整整八个月,几乎把所有能腾出来的时间全部押进去。
他在自己的研究方向里开了条岔路,拐进了当时连导师都半信半疑的深度学习丛林,靠着微软亚研院借给他的一小块GPU算力,把那套模型一点一点搭起来,调参,再调参,处理过拟合,再处理,换框架,换数据增强方式……
然后跑出了那个让他失眠了整整一夜的数字。
但他没法训练更大的模型。
算力不够。
微软亚研院给他划的那块算力有上限,还要跟组里其他项目排队。
The content is not finished, continue reading on the next page