Wandering
科研方面,这几个月重心也逐渐转向了 AI Infra,目前在做一些单卡推理优化的实现,后续可能会结合 MoE 或 Agent 做一些探索。这个月陆陆续续看完了月球大叔的直播视频,学到了很多东西,希望之后能为开源出点力,给 vLLM、LM Cache 这样的社区贡献一些力量。
很多时候我也会想,一直换方向,是不是自己的问题。从本科时误打误撞做了点Federated Learning,到做 RA 和访问学生时搞 Diffusion、Nerf、3DGS,再到研一上学期折腾无人机、具身机械臂的 VLA 与触觉,还手动设计并落地了一版差动机械臂。当然,这些方向都是我自己选的。我一直很清楚自己喜欢什么——特别喜欢折腾,喜欢从零攒出一台机械臂并把它跑起来,喜欢和各种各样的机器、设备打交道,喜欢听显卡的咆哮声,也喜欢这种对事物运行原理拥有深层认知的感觉。
回头看看,折腾了这么一圈,看起来东一榔头西一棒子,但其实每段经历可能也连成了一条线。做Federated Learning时对分布式系统概念的接触,搞 Diffusion 和 3DGS 时对显卡性能压榨的直觉,乃至亲手设计机械臂时对控制链路和实时性的理解,好像都在无形中帮我摸到了系统底层的一些共通的逻辑。现在做llm推理优化,反倒像是这些碎片的自然收束。如果能把对硬件的亲近感、对算法的理解和对系统的热情拧在一起,或许前面所有的“换方向”都不会是弯路。
总之,坚持做长期和正确的事情,坚持下去会看到结果的。
Enjoy Reading This Article?
Here are some more articles you might like to read next: