TensorRT • Shattered217のBlog

发布于 2025-07-19

288 热度无~ Linux

摘要

这篇文章讲解如何在单卡 A100 上，通过 TensorRT-LLM 实现 Qwen3-8B 模型的量化推理，内容涵盖环境设置、模型转换及推理运行，适合关注高性能计算的开发者。

发布于 2025-07-19

218 热度无~ Linux

摘要

在PVE系统中，为Ubuntu虚拟机直通 A100 显卡、安装 NVIDIA 驱动、CUDA Toolkit 和 TensorRT。内容涵盖虚拟机设置、环境配置到深度学习工具的完整安装流程。