NVIDIA Minitron: Compact Language Models via Pruning and Knowledge Distillation
Model Context Protocol
这个技术最近好像挺火的,看看怎么个事儿
UniVLA: Learning to Act Anywhere with Task-centric Latent Actions
RoPE
RoPE 虽然是针对 Position Embedding 提出的改进,但已经快成为 LLM 模型的事实标准了
学习 PyQT6 (1)——事件循环 (Event Loop)
Event Loop QT 的核心是 QApplication 类(每个应用程序只需要一个 QApplication 类),它维护了 Event Loop,负责管理用户和应用程序的交互:每一次互动(摁键盘、点鼠标)都会生成一个 event 放在 e...
Swin Transformer
用 CNN 的思路做的 ViT,挺有意思
Agentic 模式
“Agentic 的模式”探讨的是在构建具备自主行为能力的智能体(Agentic systems)时所采用的一系列核心方法。Agentic 指的是具备一定程度自主决策、任务分解与执行能力的系统,这类系统不仅响应指令,更能根据环境与目标主动规划行动。在这篇文章中,我们将深入解析构成 Agentic 系统的关键机制:提示链(Prompt Chaining)帮助系统逐步生成和处理信息;路由(Routing)则允许智能体在多种工具或路径间做出动态选择;并行化(Parallelisation)提高任务执行效率;反思(Reflection)使系统能回顾并改进自身行为;而规划模式(Planning Pattern)则提供系统性的目标达成策略。通过理解这些模式,我们可以更好地设计出智能、高效且具有适应性的 Agentic 系统。
让模型给模型输出评分:LLM as Judge
LLM as Judge 算是 RAG 领域里用于衡量能力的指标,类似于把答案交给第三方裁判来决断
LightRAG 论文
算是知识图谱结合 RAG 方向的一篇经典之作了