这个项目提供了LLM(大语言模型)推理过程中各种算子的交互式可视化演示。
包含14个核心算子的动画演示:
- Token Embedding - 词嵌入
- Positional Encoding - 位置编码
- Standard Attention - 标准注意力机制
- Multi-Head Attention - 多头注意力
- KV Cache - 键值缓存
- RoPE - 旋转位置编码
- Flash Attention - Flash注意力优化
- LayerNorm & RMSNorm - 层归一化
- FFN & GLU - 前馈网络与门控单元
- Softmax & Temperature - Softmax与温度控制
- Sampling Strategies - 采样策略
- Quantization - 量化技术
- Speculative Decoding - 推测解码
- Complete LLM Pipeline - 完整推理流程
每个动画都包含:
- 交互式控制(开始/暂停/重置)
- 可调参数
- 实时数据流可视化
- 详细的步骤说明
卷积神经网络的可视化演示
- 克隆仓库:
git clone https://github.com/friendmine/aidemo.git- 在浏览器中打开HTML文件:
llm_inference_operators.html- LLM推理算子演示demo_cnn.html- CNN演示
- 纯HTML/CSS/JavaScript实现,无需后端服务
- 响应式设计,适配不同屏幕尺寸
- 平滑的动画效果
- 教育友好,适合学习和教学
欢迎提交Issue和Pull Request!
MIT License