Jetson Orin NX 16G开箱实战:从零配置Ubuntu 20.04到CUDA全验证
刚拿到Jetson Orin NX开发板的开发者们,往往既兴奋又忐忑。这款搭载了NVIDIA最新AI计算架构的嵌入式设备,性能强大但配置过程对新手来说可能充满挑战。本文将带你一步步完成从开箱到CUDA环境验证的全过程,确保你的开发板能够顺利运行AI计算任务。
1. 开箱检查与初始设置
拆开包装后,首先检查配件是否齐全:开发板本体、电源适配器(建议使用原装)、散热风扇(如有)、以及必要的连接线。确认无误后,按照以下步骤进行初始设置:
- 连接电源与显示器:使用HDMI或DP接口连接显示器,插入键盘和鼠标,最后接通电源。首次启动可能需要几分钟时间。
- 系统初始化:根据屏幕提示完成Ubuntu 20.04的基本设置,包括:
- 创建用户账户
- 设置密码(建议使用强密码)
- 配置时区和键盘布局
提示:Jetson Orin NX默认用户名通常是"nx",密码可能为"yahboom"(视供应商而定),首次登录后请立即修改密码。
- 网络连接:建议使用有线网络连接以获得更稳定的下载速度,无线连接也可用但可能影响后续软件下载效率。
# 查看网络连接状态 ifconfig # 测试网络连通性 ping -c 4 www.baidu.com2. 系统更新与基础工具安装
在开始配置AI环境前,确保系统是最新的并安装一些必要工具:
# 更新软件源列表 sudo apt update # 升级已安装的软件包 sudo apt upgrade -y # 安装常用工具 sudo apt install -y curl wget git vim htop对于不熟悉Linux命令行的用户,以下是一些基本操作备忘:
- 文件操作:
ls:列出目录内容cd:切换目录cp:复制文件mv:移动或重命名文件
- 文本编辑:
nano:简单易用的文本编辑器vim:功能更强大的编辑器(学习曲线较陡)
3. JetPack组件验证与配置
Jetson系列设备使用JetPack作为核心软件栈,它包含了CUDA、cuDNN、TensorRT等关键组件。验证这些组件是否正确安装是确保AI开发环境正常工作的关键。
3.1 检查JetPack版本
# 查看JetPack版本 sudo apt show nvidia-jetpack # 或者使用jtop工具(需先安装) sudo -H pip install jetson-stats sudo jtopjtop是一个非常有用的系统监控工具,可以直观地查看:
- GPU和CPU使用情况
- 内存占用
- JetPack各组件版本
- 温度监控
3.2 CUDA环境配置
虽然系统镜像已经预装了CUDA,但仍需要正确配置环境变量:
# 编辑bash配置文件 vim ~/.bashrc在文件末尾添加以下内容(按i进入插入模式):
export PATH=/usr/local/cuda/bin:$PATH export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH export CUDA_HOME=/usr/local/cuda保存退出(按ESC然后输入:wq)后,执行:
# 使配置生效 source ~/.bashrc # 验证CUDA安装 nvcc --version预期输出应显示CUDA 11.4版本信息。
3.3 cuDNN验证
cuDNN是深度神经网络加速库,验证其安装状态:
# 查看cuDNN版本 dpkg -l | grep cudnn # 或者检查头文件 cat /usr/include/cudnn_version.h | grep CUDNN_MAJOR -A 24. 深度学习环境搭建
4.1 Python环境管理
虽然系统自带Python3.8,但建议使用conda管理不同的Python环境:
# 下载Anaconda(ARM64版本) wget https://repo.anaconda.com/archive/Anaconda3-2023.07-2-Linux-aarch64.sh # 安装 bash Anaconda3-2023.07-2-Linux-aarch64.sh # 按照提示完成安装,建议安装在默认位置 # 初始化conda source ~/.bashrc配置conda国内镜像加速下载:
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/ conda config --set show_channel_urls yes创建专用于PyTorch的环境:
conda create -n pytorch python=3.8 conda activate pytorch4.2 PyTorch安装
Jetson设备需要安装特定版本的PyTorch:
# 安装依赖 sudo apt-get install -y libopenblas-base libopenmpi-dev # 下载预编译的PyTorch wheel文件 wget https://nvidia.box.com/shared/static/ssf2v7pf5i245fk4i0q926hy4imzs2ph.whl -O torch-2.0.0+nv23.05-cp38-cp38-linux_aarch64.whl # 安装 pip install torch-2.0.0+nv23.05-cp38-cp38-linux_aarch64.whl验证PyTorch是否能正确识别CUDA:
import torch print(torch.__version__) print(torch.cuda.is_available()) # 应该返回True print(torch.version.cuda) # 应该显示11.44.3 TensorRT验证
TensorRT是NVIDIA的推理优化器,验证其安装:
import tensorrt as trt print(trt.__version__)5. 开发工具配置
5.1 VS Code安装
# 下载VS Code(ARM64版本) wget https://update.code.visualstudio.com/1.85.2/linux-deb-arm64/stable -O code.deb # 安装 sudo dpkg -i code.deb # 修复可能的依赖问题 sudo apt install -f安装Python扩展:
- 启动VS Code
- 打开扩展市场(Ctrl+Shift+X)
- 搜索并安装"Python"扩展
5.2 Jupyter Notebook配置
# 在conda环境中安装 conda install jupyter # 生成配置文件 jupyter notebook --generate-config # 设置密码 jupyter notebook password # 启动(可在后台运行) nohup jupyter notebook --ip=0.0.0.0 --no-browser &6. 性能测试与优化建议
完成所有安装后,建议进行简单的性能测试:
import torch # 矩阵乘法测试 a = torch.randn(10000, 10000).cuda() b = torch.randn(10000, 10000).cuda() %timeit torch.matmul(a, b)优化建议:
- 电源模式:Jetson设备有不同的电源模式,影响性能
# 查看当前模式 sudo nvpmodel -q # 设置为最大性能模式(模式0) sudo nvpmodel -m 0 - 散热:长时间高负载运行时确保良好散热
- 内存管理:监控内存使用,避免OOM错误
7. 常见问题排查
CUDA不可用:
- 检查
nvidia-smi是否正常运行 - 验证驱动版本与CUDA版本是否匹配
- 确认环境变量设置正确
PyTorch安装失败:
- 确保下载了正确的ARM64版本
- 检查Python版本是否为3.8
- 尝试使用
--no-cache-dir选项重新安装
cuDNN错误:
- 验证cuDNN版本与CUDA版本兼容
- 检查库文件路径是否正确
- 尝试重新创建软链接
经过以上步骤,你的Jetson Orin NX应该已经准备好进行AI开发了。在实际项目中,根据具体需求可能还需要安装其他库和工具,但基础环境已经搭建完成。