为什么选择 Python

Python 已经成为人工智能和机器学习领域的事实标准语言。无论是学术界的研究论文,还是工业界的生产系统,Python 都占据着主导地位。其背后的原因是多方面的:

总之,如果你想进入 AI 开发领域,Python 是你绕不开的第一步。

Python 安装

推荐安装 Python 3.10 或更高版本(3.11、3.12 均可)。AI 框架对旧版本的支持越来越有限,部分库(如 Pydantic v2、LangChain)已要求 3.10+。

Windows 安装

  1. 访问 python.org/downloads,下载最新的 Windows 安装包(.exe)。
  2. 运行安装程序时,务必勾选 "Add Python to PATH" 选项,否则命令行无法直接使用 python
  3. 安装完成后,打开 PowerShell 或 CMD,输入以下命令验证:
python --version
pip --version
💡 提示:Windows 用户也可以使用 winget 安装 Python:
winget install Python.Python.3.12

macOS 安装

macOS 自带的 Python 版本通常较旧(甚至是 2.x),不建议直接使用。推荐通过 Homebrew 安装:

# 先安装 Homebrew(如果尚未安装)
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"

# 安装 Python 3.12
brew install python@3.12

# 验证版本
python3 --version
pip3 --version
⚠️ 注意:macOS 上请始终使用 python3pip3 命令,以避免与系统自带的 Python 2 冲突。

包管理器与虚拟环境

在 Python 开发中,良好的环境隔离是工程实践的基础。不同项目可能依赖不同版本的库,混用会导致难以排查的冲突。

pip — 标准包管理器

pip 是 Python 的官方包管理工具,随 Python 一起安装。常用命令:

# 安装包
pip install requests

# 安装指定版本
pip install openai==1.30.0

# 升级包
pip install --upgrade openai

# 导出当前环境依赖
pip freeze > requirements.txt

# 从文件批量安装
pip install -r requirements.txt

venv — 标准虚拟环境

venv 是 Python 内置的虚拟环境模块,无需额外安装:

# 创建虚拟环境(目录名通常为 .venv 或 venv)
python -m venv .venv

# 激活虚拟环境(Windows PowerShell)
.venv\Scripts\Activate.ps1

# 激活虚拟环境(macOS / Linux)
source .venv/bin/activate

# 退出虚拟环境
deactivate
💡 建议:每个新项目都创建独立的虚拟环境,这是 Python 开发的最佳实践。IDE(如 VS Code、PyCharm)会自动检测并使用项目目录下的 .venv

conda — 科学计算环境管理

conda 由 Anaconda 公司开发,尤其适合需要管理 CUDA、C 扩展库等复杂依赖的场景:

# 创建新环境
conda create -n ai-dev python=3.12

# 激活环境
conda activate ai-dev

# 安装包
conda install numpy pandas

# 列出所有环境
conda env list

常用 AI 库安装

以下是 AI 开发中最常用的 Python 库,建议在项目虚拟环境中按需安装:

深度学习框架

# PyTorch(CPU 版本)
pip install torch torchvision torchaudio

# PyTorch(CUDA 12.1 GPU 加速版本)
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

# TensorFlow
pip install tensorflow

Hugging Face 生态

# Transformers 模型库(NLP 任务首选)
pip install transformers

# Datasets 数据集加载
pip install datasets

# Accelerate 分布式训练加速
pip install accelerate

# 一次性安装常用 HF 工具
pip install transformers datasets accelerate sentencepiece

OpenAI 与 LLM 集成

# OpenAI 官方 SDK
pip install openai

# Anthropic Claude SDK
pip install anthropic

# LangChain 应用框架
pip install langchain langchain-openai langchain-community

# LlamaIndex 知识库增强
pip install llama-index

数据处理与科学计算

# 核心科学计算栈
pip install numpy pandas scipy matplotlib seaborn

# 机器学习工具
pip install scikit-learn xgboost

# 向量数据库客户端
pip install chromadb faiss-cpu pinecone-client
⚠️ 注意:安装 PyTorch GPU 版本前,请先确认系统已安装对应版本的 NVIDIA 驱动和 CUDA Toolkit,并通过 nvidia-smi 命令查看当前 CUDA 版本。

Jupyter Notebook 配置

Jupyter Notebook(或更现代的 JupyterLab)是 AI 开发中不可或缺的交互式环境,特别适合数据探索、模型实验和结果可视化。

安装与启动

# 安装 JupyterLab(推荐,功能更强大)
pip install jupyterlab

# 安装经典 Jupyter Notebook
pip install notebook

# 启动 JupyterLab
jupyter lab

# 启动经典 Notebook
jupyter notebook

将虚拟环境注册为 Jupyter 内核

如果你使用了虚拟环境,需要将其注册到 Jupyter,否则 Notebook 中无法使用环境内的包:

# 在激活虚拟环境后执行
pip install ipykernel
python -m ipykernel install --user --name ai-dev --display-name "Python (AI Dev)"

重启 Jupyter 后,在新建 Notebook 时选择 "Python (AI Dev)" 内核即可。

💡 VS Code 用户:安装 "Jupyter" 扩展后,可以直接在 VS Code 中打开和运行 .ipynb 文件,无需打开浏览器,体验更流畅。

第一个 AI 程序

下面以调用 OpenAI API 为例,编写你的第一个 AI 程序。在运行前,请确保已安装 openai 库,并在环境变量中配置了 API Key。

设置 API Key

# Windows PowerShell
$env:OPENAI_API_KEY = "sk-xxxxxxxxxxxxxxxxxxxxxxxx"

# macOS / Linux
export OPENAI_API_KEY="sk-xxxxxxxxxxxxxxxxxxxxxxxx"
⚠️ 安全提示:切勿将 API Key 硬编码在代码文件中,也不要提交到 Git 仓库。始终通过环境变量或 .env 文件管理敏感信息。

示例代码:简单对话

import os
from openai import OpenAI

# 从环境变量读取 API Key
client = OpenAI(api_key=os.environ.get("OPENAI_API_KEY"))

def chat(user_message: str) -> str:
    """向 GPT 发送消息并返回回复"""
    response = client.chat.completions.create(
        model="gpt-4o-mini",
        messages=[
            {
                "role": "system",
                "content": "你是一个专业的 AI 助手,请用简洁清晰的中文回答问题。"
            },
            {
                "role": "user",
                "content": user_message
            }
        ],
        max_tokens=500,
        temperature=0.7
    )
    return response.choices[0].message.content

if __name__ == "__main__":
    question = "请简单介绍一下大语言模型的工作原理。"
    print(f"问:{question}")
    print(f"答:{chat(question)}")

运行此脚本,你将看到模型的回复输出到终端。这是所有 AI 应用开发的起点——接下来可以在此基础上添加上下文记忆、工具调用、流式输出等功能。

常见问题与解决

问题一:pip 安装速度慢

默认 PyPI 服务器位于国外,国内访问较慢。可以临时或永久切换为国内镜像源:

# 临时使用清华镜像(单次安装)
pip install numpy -i https://pypi.tuna.tsinghua.edu.cn/simple

# 永久配置清华镜像
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

问题二:ModuleNotFoundError

出现 ModuleNotFoundError: No module named 'xxx' 通常是以下原因之一:

问题三:CUDA 不可用

在使用 PyTorch 时,torch.cuda.is_available() 返回 False

import torch
print(torch.cuda.is_available())   # 应为 True
print(torch.version.cuda)          # 查看 PyTorch 内置 CUDA 版本

解决步骤:①确认 GPU 驱动已安装;②确认安装的是 GPU 版本的 PyTorch(URL 中含 cu121);③确认 CUDA 版本与 PyTorch 要求匹配。

问题四:Python 版本冲突

系统中存在多个 Python 版本时,建议使用 pyenv(macOS/Linux)或 pyenv-win(Windows)进行版本管理,可以为不同项目指定不同的 Python 版本,彻底避免冲突。

# pyenv 安装指定版本
pyenv install 3.12.0

# 为当前目录设置 Python 版本
pyenv local 3.12.0
💡 最终建议:建立一套固定的工作流程——每个项目独立 .venv 目录 + requirements.txt 锁定依赖版本 + .env 文件管理密钥,这将为你节省大量调试环境问题的时间。