混合精度的数字电路设计
最近在看的
大语言模型推理加速器中的进阶数制格式
毕设论文阅读笔记第二期,介绍Anda、AMXFP4、MicroScopiQ、BitMoD、HiFloat8、QLoRA、t分布等进阶内容
大语言模型推理加速器中的数制格式与基础架构
毕设论文阅读笔记第一期,介绍FIGNA、MX格式、ReDCIM和OPAL
Transformer非线性单元的硬件优化方案
整理了近年来关于Transformer中非线性单元(SoftMax、GELU、LayerNorm等)的硬件优化方案
躺在云上
影子铺满了大地





