Decoder-only Transformers
Decoder-only 架构通常用于
生成任务
,代表作包括 GPT,GPT-2 等。什么是生成任务
简单来说,Decoder-only 解决的生成任务是指:给定前
近年来,出现了使用 Diffusion 作为 Language Model 的生成,达到了极快的生成速度。
Decoder-only 架构通常用于
生成任务
,代表作包括 GPT,GPT-2 等。简单来说,Decoder-only 解决的生成任务是指:给定前
近年来,出现了使用 Diffusion 作为 Language Model 的生成,达到了极快的生成速度。