FlagAttention 是一个用 Triton 语言(https://github.com/openai/triton)实现的内存高效Attention 算子项目。FlagAttention 由语言模型中对非标准 ...