要说传奇吧,这哥们大学还只是个线性代数只能拿B-的“废柴”,直到一朝顿悟裸辞自学AI,然后凭一己之力搅动整个大模型格局。 其他家的模型都是瞄准了基准测试,每天想的都是怎么刷题拿高分……(嘶,这话说的,怎么这么像那个刚刚拿下IMO、IOI双料金牌的某O家呢) Claude在他们团队里不止是工具,而是将其视作用户一样的存在,围绕模型设计,让其兼顾平台和用户的思维方式,鼓励开发者不止充当用户身份,也可以积极探索如何更好地训练模型为己所用,这就是他们成功的关键。 Tom表示,其实当时他们做出的第一款产物是Slackbot版的Claude,比ChatGPT还早九个月,不过由于缺乏足够的服务器基础设施,以及不确定它可能会造成的影响,于是一犹豫,错失了发布良机。 后面因为目睹了ChatGPT的成功,他们才匆匆忙忙重新端上了API,随后又推出了Claude AI,不过一直都不温不火,直到Claude 3.5 Sonnet发布,才彻底点燃AI编码的热情。 两家公司的硝烟最近更是不藏了,这不前脚Anthropic刚发布Claude Opus 4.1,后脚OpenAI就推出了GPT-5,还专门强调在编码能力上做了优化,这目标是谁不言而喻。 从读书时等待被投喂的狗到社会上必须与狼群竞争,心态上的转变让他意识到,自己想要从事更宏大、更激动人心的事业。 犹豫再三,他先给自己放了三个月的假,比如练练瑜伽、CrossFit,或者为艺术节造辆手工车,钱都花光后,终于决心六个月自学AI,目标进入当时的AI三巨头DeepMind、Google Brain或MIRI。 学习Coursera上的机器学习课程参加Kaggle项目读线性代数经典教材《Linear Algebra Done Right》以及一本统计学书籍利用YC校友积分购买一块GPU,通过SSH远程完成课程作业和项目。 大佬也是珍惜人才,就帮他一对一制定了个自学课程,然后每个月都要求他汇报一次学习进展,然后过了几个月,就让他顺势进入OpenAI搭建《星际争霸》项目的训练环境。 不过据Tom所说,其实在OpenAI前九个月,他都没做过任何机器学习相关工作,后来没多久就跳槽去了Google Brain,专门设计ML系统的攻击与防御机制。 他是OpenAI经典论文《Language Models are Few-Shot Learners》的主要作者之一,负责训练基础设施,将模型参数规模从原来的15亿扩展到了1700亿,可以确保LLM在无需微调的情况下,通过少量示例,就能完成多种自然语言处理任务,如翻译、问答、推理等任务。 已经在OpenAI内部如鱼得水的他,却因为使命感选择了离开,作为OpenAI里专注于安全和规模化的核心团队成员,他和整个团队一起共同创立了Anthropic,希望可以认真对待AGI风险。 当初刚创立时,Anthropic只有七位联合创始人,一百多个员工,资金也完全不能和OpenAI匹敌,困难重重的情况下终于打赢了这场漂亮的Claude翻身仗。 重视社交:长期接触你所敬佩的人,然后随着时间推移,你会逐渐与之相似。寻找引路人:找到可以一起学习的导师或同伴,会让成长更为顺畅。展现自己的价值:主动联系你想一起工作的人,详细说明你的计划与优势,让别人看到你的价值。动手尝试:通过实际做事并从失败中学习,比理论准备更有效。勇于承担风险:大胆一点,去挑战那些困难的事情,如果成功了,你会为自己感到自豪。


