Decoder-only Transformers
Decoder-only 架构通常用于生成任务,代表作包括 GPT,GPT-2 等。
什么是生成任务
简单来说,Decoder-only 解决的生成任务是指:给定前
近年来,出现了使用 Diffusion 作为 Language Model 的生成,达到了极快的生成速度。
Decoder-only 架构通常用于生成任务,代表作包括 GPT,GPT-2 等。
简单来说,Decoder-only 解决的生成任务是指:给定前
近年来,出现了使用 Diffusion 作为 Language Model 的生成,达到了极快的生成速度。