为什么选择 Python
Python 已经成为人工智能和机器学习领域的事实标准语言。无论是学术界的研究论文,还是工业界的生产系统,Python 都占据着主导地位。其背后的原因是多方面的:
- 生态系统成熟:NumPy、Pandas、PyTorch、TensorFlow、Hugging Face Transformers 等世界顶级 AI 库均以 Python 为核心。
- 语法简洁易读:Python 的表达力极强,让开发者可以专注于算法本身而非语言细节。
- 社区活跃庞大:遇到问题时,Stack Overflow、GitHub Issues 和各类中文社区都能快速找到答案。
- 交互式开发体验:Jupyter Notebook 让数据探索和模型实验变得直观高效。
- 与 AI 服务无缝集成:OpenAI、Anthropic、Google 等主流 AI 平台的官方 SDK 首先支持 Python。
总之,如果你想进入 AI 开发领域,Python 是你绕不开的第一步。
Python 安装
推荐安装 Python 3.10 或更高版本(3.11、3.12 均可)。AI 框架对旧版本的支持越来越有限,部分库(如 Pydantic v2、LangChain)已要求 3.10+。
Windows 安装
- 访问 python.org/downloads,下载最新的 Windows 安装包(.exe)。
- 运行安装程序时,务必勾选 "Add Python to PATH" 选项,否则命令行无法直接使用
python。 - 安装完成后,打开 PowerShell 或 CMD,输入以下命令验证:
python --version
pip --version
winget install Python.Python.3.12
macOS 安装
macOS 自带的 Python 版本通常较旧(甚至是 2.x),不建议直接使用。推荐通过 Homebrew 安装:
# 先安装 Homebrew(如果尚未安装)
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
# 安装 Python 3.12
brew install python@3.12
# 验证版本
python3 --version
pip3 --version
python3 和 pip3 命令,以避免与系统自带的 Python 2 冲突。
包管理器与虚拟环境
在 Python 开发中,良好的环境隔离是工程实践的基础。不同项目可能依赖不同版本的库,混用会导致难以排查的冲突。
pip — 标准包管理器
pip 是 Python 的官方包管理工具,随 Python 一起安装。常用命令:
# 安装包
pip install requests
# 安装指定版本
pip install openai==1.30.0
# 升级包
pip install --upgrade openai
# 导出当前环境依赖
pip freeze > requirements.txt
# 从文件批量安装
pip install -r requirements.txt
venv — 标准虚拟环境
venv 是 Python 内置的虚拟环境模块,无需额外安装:
# 创建虚拟环境(目录名通常为 .venv 或 venv)
python -m venv .venv
# 激活虚拟环境(Windows PowerShell)
.venv\Scripts\Activate.ps1
# 激活虚拟环境(macOS / Linux)
source .venv/bin/activate
# 退出虚拟环境
deactivate
.venv。
conda — 科学计算环境管理
conda 由 Anaconda 公司开发,尤其适合需要管理 CUDA、C 扩展库等复杂依赖的场景:
# 创建新环境
conda create -n ai-dev python=3.12
# 激活环境
conda activate ai-dev
# 安装包
conda install numpy pandas
# 列出所有环境
conda env list
常用 AI 库安装
以下是 AI 开发中最常用的 Python 库,建议在项目虚拟环境中按需安装:
深度学习框架
# PyTorch(CPU 版本)
pip install torch torchvision torchaudio
# PyTorch(CUDA 12.1 GPU 加速版本)
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
# TensorFlow
pip install tensorflow
Hugging Face 生态
# Transformers 模型库(NLP 任务首选)
pip install transformers
# Datasets 数据集加载
pip install datasets
# Accelerate 分布式训练加速
pip install accelerate
# 一次性安装常用 HF 工具
pip install transformers datasets accelerate sentencepiece
OpenAI 与 LLM 集成
# OpenAI 官方 SDK
pip install openai
# Anthropic Claude SDK
pip install anthropic
# LangChain 应用框架
pip install langchain langchain-openai langchain-community
# LlamaIndex 知识库增强
pip install llama-index
数据处理与科学计算
# 核心科学计算栈
pip install numpy pandas scipy matplotlib seaborn
# 机器学习工具
pip install scikit-learn xgboost
# 向量数据库客户端
pip install chromadb faiss-cpu pinecone-client
nvidia-smi 命令查看当前 CUDA 版本。
Jupyter Notebook 配置
Jupyter Notebook(或更现代的 JupyterLab)是 AI 开发中不可或缺的交互式环境,特别适合数据探索、模型实验和结果可视化。
安装与启动
# 安装 JupyterLab(推荐,功能更强大)
pip install jupyterlab
# 安装经典 Jupyter Notebook
pip install notebook
# 启动 JupyterLab
jupyter lab
# 启动经典 Notebook
jupyter notebook
将虚拟环境注册为 Jupyter 内核
如果你使用了虚拟环境,需要将其注册到 Jupyter,否则 Notebook 中无法使用环境内的包:
# 在激活虚拟环境后执行
pip install ipykernel
python -m ipykernel install --user --name ai-dev --display-name "Python (AI Dev)"
重启 Jupyter 后,在新建 Notebook 时选择 "Python (AI Dev)" 内核即可。
.ipynb 文件,无需打开浏览器,体验更流畅。
第一个 AI 程序
下面以调用 OpenAI API 为例,编写你的第一个 AI 程序。在运行前,请确保已安装 openai 库,并在环境变量中配置了 API Key。
设置 API Key
# Windows PowerShell
$env:OPENAI_API_KEY = "sk-xxxxxxxxxxxxxxxxxxxxxxxx"
# macOS / Linux
export OPENAI_API_KEY="sk-xxxxxxxxxxxxxxxxxxxxxxxx"
.env 文件管理敏感信息。
示例代码:简单对话
import os
from openai import OpenAI
# 从环境变量读取 API Key
client = OpenAI(api_key=os.environ.get("OPENAI_API_KEY"))
def chat(user_message: str) -> str:
"""向 GPT 发送消息并返回回复"""
response = client.chat.completions.create(
model="gpt-4o-mini",
messages=[
{
"role": "system",
"content": "你是一个专业的 AI 助手,请用简洁清晰的中文回答问题。"
},
{
"role": "user",
"content": user_message
}
],
max_tokens=500,
temperature=0.7
)
return response.choices[0].message.content
if __name__ == "__main__":
question = "请简单介绍一下大语言模型的工作原理。"
print(f"问:{question}")
print(f"答:{chat(question)}")
运行此脚本,你将看到模型的回复输出到终端。这是所有 AI 应用开发的起点——接下来可以在此基础上添加上下文记忆、工具调用、流式输出等功能。
常见问题与解决
问题一:pip 安装速度慢
默认 PyPI 服务器位于国外,国内访问较慢。可以临时或永久切换为国内镜像源:
# 临时使用清华镜像(单次安装)
pip install numpy -i https://pypi.tuna.tsinghua.edu.cn/simple
# 永久配置清华镜像
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
问题二:ModuleNotFoundError
出现 ModuleNotFoundError: No module named 'xxx' 通常是以下原因之一:
- 虚拟环境未激活:检查终端提示符前是否显示环境名称(如
(.venv))。 - 包未安装在当前环境:使用
pip list确认包是否存在。 - Jupyter 内核与虚拟环境不匹配:按照上文步骤重新注册内核。
问题三:CUDA 不可用
在使用 PyTorch 时,torch.cuda.is_available() 返回 False:
import torch
print(torch.cuda.is_available()) # 应为 True
print(torch.version.cuda) # 查看 PyTorch 内置 CUDA 版本
解决步骤:①确认 GPU 驱动已安装;②确认安装的是 GPU 版本的 PyTorch(URL 中含 cu121);③确认 CUDA 版本与 PyTorch 要求匹配。
问题四:Python 版本冲突
系统中存在多个 Python 版本时,建议使用 pyenv(macOS/Linux)或 pyenv-win(Windows)进行版本管理,可以为不同项目指定不同的 Python 版本,彻底避免冲突。
# pyenv 安装指定版本
pyenv install 3.12.0
# 为当前目录设置 Python 版本
pyenv local 3.12.0
.venv 目录 + requirements.txt 锁定依赖版本 + .env 文件管理密钥,这将为你节省大量调试环境问题的时间。