用最少的资源,做最聪明的架构。
让模型学会自己选择、自己推理、自己纠错。
用MOE让参数按需激活,用极致的工程优化把每一滴算力都拧干。
前世DeepSeek做到了,但它来得太晚,他的公司已经死了。
这辈子,他要自己做这件事。
从头做。
顾屿缓慢地睁开眼睛,视线重新聚焦在屏幕上那条安静攀升的精度曲线上。
任少卿还在旁边等着他的反应,大概以为老板在思考学术问题。
“少卿。”
顾屿的声音恢复了一贯的云淡风轻。
The content is not finished, continue reading on the next page