Transformer for Vision (ViT)

Contributions of ViT include aligning language with vision, thus enabling the era of VLM and VLA.

The Second Half of AI

AI 的上半场是基础模型算法的狂欢,Transformer 的爆火引发 LLM 模型算法的演进,但是不过几年的发展似乎已经看到瓶颈了。与之相对的,近年来 LLM 应用端开始走进我们的视野,LLM 逐渐从实验室走向商业企业,其中比较引人注目的应用是 AI Agent,即让 AI 自己进行规划、行动,帮助我们完成目标。但是 AI Agent 有自己的缺陷:它的能力实在是太弱了。本篇文章来自于 OpenAI 科学家(现在是在腾讯了)姚顺雨的博客对 AI 后续发展的看法。