关于：MLiRの话题(技术问答) - 万象大数据平台 - 万象素材

49

LLVM(MLIR)安装编译

张3 发布于 2025-07-27
收藏 MLiR

本文旨在为有兴趣自行安装和编译 LLVM（利用 MLIR 作为后端输出的主要方式）的读者提供一份详细指南。在实际操作过程中，可能会遇到一些理解上的偏差，欢迎指正。由于目标是能在 x86 和 RISCV 上运行，所有配置均基于 i7-12700H 笔记本，运行 Ubuntu 20.04 LTS 系统。以下是编译配置的步骤：第一步：...

49

[MLIR] CodeGen Dialect 总结-2

张3 发布于 2025-07-27
收藏 MLiR

这个系列的前几篇文章对MLIR的组件有了一些粗浅的认识,这篇文章不继续讲MLIR的架构。而是从实践的角度带读者来看一下,MLIR帮助我做了什么,这里仍然以OneFlow Dialect为例。在 MLIR:摩尔定律终结的编译器基础结构论文解读这篇文章的评论部分已经简单介绍了OneFlow Dialect相关的组件是如何实现的。在实现了OneFlow ...

49

从MLIR 看 unsiged 和 size_t

张3 发布于 2025-07-27
收藏 MLiR

探讨了在C API中关于返回值类型的选择，具体涉及`mlirOperationGetNumOperands`函数的返回值类型是否应为`size_t`或`ssize_t`。对于`unsigned`类型的使用，存在代码大小、性能和64位主机的一般性问题。使用`unsigned`类型在可移植性方面存在缺陷，其表示范围受限于硬件平台，可能无法表示较大的操作数。而`...

49

【从零开始学深度学习编译器】十九,MLIR的Pass机制实践

张3 发布于 2025-07-27
收藏 MLiR

IREE体系结构基于MLIR，提供统一的中间表示（IR）支持，可扩展至数据中心和移动/边缘设备。关键特性包括：使用Vulkan、SPIR-V、WebGPU等标准，与开源社区紧密合作；基于编译器优化生成最佳任务；统一IR表示，实现程序优化；可扩展性，支持多样化的加速器与部署场景。标准与社区合作：采用Vulkan、SPIR-V、WebGPU...

49

MLIR-Toy-实践-3-Dialect转换

张3 发布于 2025-07-27
收藏 MLiR

在转换过程中，需要关注指数位全0和全1的特殊用途，以及符号位的表示方法。在MLIR中，可以使用const算子读取权重，并通过API函数进行float32到float16的转换。float16的优点包括减少显存占用和加速训练，但存在上/下溢出和舍入误差的问题。解决方案包括损失缩放和f32权重备份，以避免这些问题。

49

float32转float16原理与代码解析(适用MLIR)

张3 发布于 2025-07-27
收藏 MLiR

OpenAI Triton MLIR的源码编译步骤如下：访问并克隆代码库：首先，访问Triton的官方网站，找到其官方代码库。使用git clone命令克隆代码库到本地，以便进行后续的编译操作。安装依赖：LLVM：作为Triton的核心后端，LLVM的安装至关重要。确保LLVM的版本与Triton兼容，并按照官方文档进行编译安装。pybind11：用于...

49

MegEngine 使用小技巧:如何解读 MegCC 编译模型几个阶段 Pass 的作用...

张3 发布于 2025-07-27
收藏 MLiR

在电脑中遇到trojan.PSW.MLir病毒，尤其是双系统环境下，处理起来较为棘手。首先，不建议直接使用Windows 98来进行病毒清除。尽管理论上可以尝试，但若对手动处理方法不熟悉，很可能反而导致问题恶化。在Windows 98环境下运行杀毒软件，可能会误删Windows XP的系统文件，因两个操作系统独立运行，不共享文件。...

49

IREE体系结构介绍

张3 发布于 2025-07-27
收藏 MLiR

实现CenterNet图像分割算法模型的转换和量化的步骤如下：下载主干网预训练模型：运行命令下载dlav0预训练模型。转换为ONNX格式模型：将下载的pth文件转换为ONNX格式，以便进行后续的模型转换和量化。转换为MLIR模型：将ONNX模型进一步转换为MLIR模型，MLIR是一种多层中间表示，用于优化和编译不同级别的抽象。

49

OpenAI/Triton MLIR 第零章: 源码编译

张3 发布于 2025-07-27
收藏 MLiR

利用TPUMLIR实现LLM INT8量化部署的关键在于采用W8A16策略。以下是具体实现步骤和优势：策略选择：鉴于传统TPUMLIR INT8量化策略对大型语言模型不适用，成本高且精度损失大，因此采用了ChatGLM2的W8A16策略。该策略只对GLMBlock中的Linear Layer权重进行通道级量化，运算时恢复到F16，以保持高精度。TPUMLIR...

关于：MLiRの话题！

标签动态

技术问答

专栏文章

云+社区

云+市场

技术讲座

标签百科