本文价值：这不是“十分钟精通 Python”，也不是把所有语法硬塞成字典。它是一份适合新手从零开始照着走的 Python 学习手册：先把环境跑通，再学变量、类型、数据结构、控制流、函数、模块、虚拟环境、文件读写、异常、面向对象、标准库、类型标注和测试，最后用一个小项目把基础串起来。学 Python 不需要神化它，也不要小看它。它是工具，工具要能解决问题。

先说结论：Python 新手不要一上来就冲 AI 和框架#

很多人学 Python，第一天就装一堆库，第二天就想爬虫，第三天就想写 AI 应用，第四天就开始问为什么 pip install 之后还是 ModuleNotFoundError。

这不是 Python 难，是学习顺序烂。

Python 的学习顺序应该很朴素：

先知道 Python 怎么安装、怎么运行、解释器是什么。
再知道 .py 文件、命令行、交互式环境分别怎么用。
再学变量、数字、字符串、布尔值、空值。
再学 list、tuple、dict、set。
再学 if、for、while、match。
再学函数、参数、返回值、作用域。
再学模块、包、pip、虚拟环境。
再学文件读写、JSON、CSV。
再学异常处理和日志。
再学类、对象、继承、组合。
再学常用标准库、类型标注和测试。
最后才分方向：Web、自动化、爬虫、数据分析、AI 工程。

这条线看起来慢，其实最快。因为 Python 的语法很宽松，写得快，也很容易写烂。基础不稳时，框架会放大问题；基础稳了，再学 FastAPI、Django、Pandas、Playwright、PyTorch，都是自然展开。

本文参考 Python 官方教程、标准库文档和 Python Packaging User Guide 的基础路径，但不会照搬文档。官方文档负责定义事实，本文负责把这些事实整理成新手能真正走完的一条路线。

0. Python 到底是什么#

Python 是一门解释型、动态类型、跨平台的编程语言。

这句话拆开讲：

解释型：你写的 .py 文件通常由 Python 解释器运行，不需要像 C / Go 那样先显式编译成二进制再执行。
动态类型：变量本身不固定类型，值有类型。name = "zgm" 后，name 指向字符串；你后面也能让它指向数字，但不要滥用。
跨平台：Windows、macOS、Linux 都能跑。
标准库丰富：文件、路径、日期、JSON、正则、日志、HTTP、测试都有内置支持。
生态巨大：Web、自动化、爬虫、数据分析、AI 都有成熟库。

Python 适合做什么？

方向	常见用途
自动化脚本	批量改文件、处理 Excel、调用接口、生成报表
Web 后端	Django、Flask、FastAPI
爬虫	requests、httpx、BeautifulSoup、Scrapy、Playwright
数据处理	pandas、numpy、matplotlib
AI / 机器学习	PyTorch、TensorFlow、scikit-learn
工具开发	CLI 工具、运维脚本、代码生成器

Python 不适合什么？

不适合拿来炫语法。
不适合把所有逻辑都写进一个巨大的脚本文件。
不适合完全不管类型、不写测试、不管依赖环境。
不适合用“能跑”当作“能维护”的借口。

Python 的优点是快，缺点也是快。写得快，烂得也快。

1. 安装环境：先把解释器跑起来#

新手第一步不要背语法，先让 Python 在你的机器上跑起来。

1.1 安装哪个版本#

如果你是新手，直接安装 Python 3 的当前稳定版就行。不要装 Python 2，不要追预发布版本，也不要同时装十几个版本把自己绕晕。

在 2026 年 5 月这个时间点，Python 3.14 已经是当前主要特性版本线之一。新手只要记住一个原则：从 python.org 下载稳定版 Python 3.x，别下载 alpha、beta、rc 预览版。

安装完成后，在命令行检查：

1
python --version

Windows 上有时也可以用：

1
py --version

你应该看到类似：

1
Python 3.x.x

不要在这里纠结小版本号。能跑，是第一目标。

1.2 第一个 Python 程序#

新建一个文件：

1
hello.py

写入：

1
print("Hello, Python")

运行：

1
python hello.py

如果输出：

1
Hello, Python

环境就通了。

1.3 交互式解释器#

直接输入：

1
python

你会进入交互式环境：

1
>>>

可以直接写：

1
1 + 2
2
"hello".upper()

交互式环境适合试小东西，不适合写项目。真正的代码还是放进 .py 文件。

1.4 新手最常见的环境坑#

第一个坑：装了 Python，但命令行说找不到。

原因通常是 PATH 没配置。Windows 安装时要勾选类似 “Add Python to PATH” 的选项。如果已经装完没勾，最省事的办法通常是重新运行安装器，选择修改安装，把 PATH 补上。

第二个坑：pip install 成功，但代码里 import 失败。

这通常不是库坏了，而是你安装包用的是一个 Python，运行代码用的是另一个 Python。最稳的写法是：

1
python -m pip install requests
2
python your_script.py

用同一个 python 去调用 pip，能少掉很多玄学问题。

第三个坑：全局安装一堆包。

全局环境不是垃圾桶。不同项目需要不同依赖，应该用虚拟环境隔离。后面会讲。

2. Python 文件和基本结构#

Python 文件通常以 .py 结尾。

一个最小脚本：

1
print("start")
2

3
name = "zgm"
4
age = 23
5

6
print(name, age)
7
print("end")

Python 从上往下执行。没有 main() 也能跑，但项目里建议写入口函数：

1
def main():
2
    name = "zgm"
3
    age = 23
4
    print(name, age)
5

6

7
if __name__ == "__main__":
8
    main()

这段代码新手一开始看会觉得怪。先记住：

def main(): 定义主函数。
if __name__ == "__main__": 表示这个文件被直接运行时才执行。
这样写方便以后把文件里的函数给别的文件导入，而不会一导入就乱执行。

这是一个好习惯。

3. 变量：名字指向值，不要乱起名#

Python 声明变量很简单：

1
name = "zgm"
2
age = 23
3
is_active = True

左边是变量名，右边是值。

Python 不需要写：

1
string name = "zgm"

这是其他语言的风格，不是 Python。

3.1 变量名怎么写#

3.2 Python 是动态类型，但不是没有类型#

1
age = 23
2
age = "二十三"

这在 Python 里能运行，但这不代表你应该这样写。

坏处很明显：

1
age = "23"
2
print(age + 1)

这会报错，因为字符串不能直接加整数。

动态类型给你自由，不是让你制造混乱。

3.3 常量怎么写#

Python 没有真正强制不可变的常量。约定俗成用全大写：

1
MAX_RETRY = 3
2
APP_NAME = "personal-blog-tool"

这只是约定，不是编译器强制。别人仍然可以改：

1
MAX_RETRY = 100

所以 Python 项目里，约定和代码审查很重要。

4. 基本类型：先吃透常用的#

Python 常用基础类型：

类型	示例	用途
`int`	`23`	整数
`float`	`3.14`	小数
`str`	`"hello"`	字符串
`bool`	`True` / `False`	布尔值
`NoneType`	`None`	空值

4.1 数字#

1
count = 10
2
price = 19.9
3
total = count * price
4
print(total)

常见运算：

1
print(10 + 3)  # 13
2
print(10 - 3)  # 7
3
print(10 * 3)  # 30
4
print(10 / 3)  # 3.333...
5
print(10 // 3) # 3，整除
6
print(10 % 3)  # 1，取余
7
print(2 ** 3)  # 8，幂

注意：/ 永远得到浮点数，哪怕能整除。

1
print(6 / 3)   # 2.0
2
print(6 // 3)  # 2

4.2 字符串#

字符串可以用单引号或双引号：

1
name = "zgm"
2
city = 'Nanjing'

多行字符串用三引号：

1
message = """
2
第一行
3
第二行
4
第三行
5
"""

常见操作：

1
name = "zgm"
2

3
print(name.upper())      # ZGM
4
print(name.startswith("z"))
5
print(len(name))

字符串拼接：

1
first = "hello"
2
second = "python"
3
print(first + " " + second)

更推荐 f-string：

1
name = "zgm"
2
age = 23
3
print(f"{name} is {age} years old")

f-string 是新手必须尽早掌握的东西。比 + 拼接清楚。

4.3 布尔值#

1
is_active = True
2
is_deleted = False

注意首字母大写：True、False。不是 true、false。

常见判断：

1
age = 20
2
print(age >= 18)  # True

4.4 None#

None 表示空值。

1
user = None

判断是否为 None，用 is：

1
if user is None:
2
    print("no user")

不要写：

1
if user == None:
2
    print("no user")

能跑，但味道差。

5. 数据结构：list、tuple、dict、set#

Python 真正项目里，最常用的不是复杂语法，而是这四个东西。

5.1 list：有顺序、可修改#

1
names = ["Tom", "Jerry", "Alice"]

读取：

1
print(names[0])   # Tom
2
print(names[-1])  # Alice

添加：

1
names.append("Bob")

删除：

1
names.remove("Jerry")

遍历：

1
for name in names:
2
    print(name)

带下标遍历：

1
for index, name in enumerate(names):
2
    print(index, name)

切片：

1
numbers = [1, 2, 3, 4, 5]
2

3
print(numbers[0:2])  # [1, 2]
4
print(numbers[:3])   # [1, 2, 3]
5
print(numbers[2:])   # [3, 4, 5]

新手要注意：list 是可变对象。

1
a = [1, 2]
2
b = a
3
b.append(3)
4
print(a)  # [1, 2, 3]

a 和 b 指向同一个列表。不是复制。

如果要复制：

1
b = a.copy()

5.2 tuple：有顺序、不可修改#

1
point = (10, 20)

读取：

1
x = point[0]
2
y = point[1]

更常见的是解包：

1
x, y = point

tuple 适合表达固定结构，比如坐标、函数返回多个值。

1
def get_position():
2
    return 10, 20
3

4

5
x, y = get_position()

不要把 tuple 当成“不能改的 list”那么肤浅。它更像一个轻量的数据组合。

5.3 dict：键值映射，项目里极常用#

1
user = {
2
    "id": 1,
3
    "name": "zgm",
4
    "age": 23,
5
}

读取：

1
print(user["name"])

如果 key 不存在，user["xxx"] 会报错。更稳的写法：

1
nickname = user.get("nickname", "")

修改：

1
user["age"] = 24

新增：

1
user["email"] = "test@example.com"

遍历 key 和 value：

1
for key, value in user.items():
2
    print(key, value)

dict 常用于：

表达 JSON 数据
表达配置
表达接口响应
做快速查找

5.4 set：去重和集合判断#

1
tags = {"Python", "Go", "Python"}
2
print(tags)  # {'Python', 'Go'}

set 会自动去重。

判断元素是否存在：

1
if "Python" in tags:
2
    print("has python")

交集、并集、差集：

1
a = {"Python", "Go", "PHP"}
2
b = {"Python", "JavaScript"}
3

4
print(a & b)  # 交集
5
print(a | b)  # 并集
6
print(a - b)  # 差集

权限、标签、分类、去重场景里，set 很好用。

6. 控制流：if、for、while、match#

控制流就是程序怎么分支、怎么循环。

6.1 if#

1
age = 20
2

3
if age >= 18:
4
    print("adult")
5
else:
6
    print("child")

多个条件：

1
score = 85
2

3
if score >= 90:
4
    print("A")
5
elif score >= 80:
6
    print("B")
7
elif score >= 60:
8
    print("C")
9
else:
10
    print("D")

Python 靠缩进表达代码块。缩进不是装饰，是语法。

坏写法：

1
if score >= 60:
2
print("pass")

会直接报错。

6.2 条件表达式#

简单分支可以写一行：

1
age = 20
2
label = "adult" if age >= 18 else "child"

不要滥用。复杂逻辑老老实实写 if。

6.3 for#

遍历列表：

1
names = ["Tom", "Jerry", "Alice"]
2

3
for name in names:
4
    print(name)

遍历数字范围：

1
for i in range(5):
2
    print(i)

输出 0 到 4。

指定起止：

1
for i in range(1, 6):
2
    print(i)

输出 1 到 5。

带步长：

1
for i in range(0, 10, 2):
2
    print(i)

输出偶数。

6.4 while#

1
count = 0
2

3
while count < 3:
4
    print(count)
5
    count += 1

while 适合“不知道要循环几次”的场景。新手最容易写出死循环：

1
while True:
2
    print("bad")

除非你有明确退出条件，否则别乱写。

6.5 break 和 continue#

break 结束循环：

1
for number in [1, 2, 3, 4, 5]:
2
    if number == 3:
3
        break
4
    print(number)

continue 跳过当前循环：

1
for number in [1, 2, 3, 4, 5]:
2
    if number % 2 == 0:
3
        continue
4
    print(number)

6.6 match#

Python 3.10 之后有 match，类似其他语言的模式匹配。

1
status = "paid"
2

3
match status:
4
    case "pending":
5
        print("待支付")
6
    case "paid":
7
        print("已支付")
8
    case "cancelled":
9
        print("已取消")
10
    case _:
11
        print("未知状态")

新手不用一开始就沉迷 match。先把 if 和 dict 映射写清楚。

7. 函数：把一段逻辑起个名字#

函数是组织代码的基本单位。

1
def greet(name):
2
    return f"Hello, {name}"
3

4

5
message = greet("zgm")
6
print(message)

7.1 参数和返回值#

1
def add(a, b):
2
    return a + b
3

4

5
result = add(1, 2)

函数应该做一件清楚的事。不要写这种：

1
def handle_user_order_payment_notify_report():
2
    ...

名字已经长到离谱，说明职责混了。

7.2 默认参数#

1
def connect(host, port=3306):
2
    print(host, port)
3

4

5
connect("localhost")
6
connect("localhost", 3307)

注意：默认参数不要用可变对象。

坏写法：

1
def add_item(item, items=[]):
2
    items.append(item)
3
    return items

这个 items 会在多次调用之间复用，容易出鬼。

好写法：

1
def add_item(item, items=None):
2
    if items is None:
3
        items = []
4
    items.append(item)
5
    return items

7.3 关键字参数#

1
def create_user(name, age, city):
2
    return {
3
        "name": name,
4
        "age": age,
5
        "city": city,
6
    }
7

8

9
user = create_user(name="zgm", age=23, city="Nanjing")

参数多时，关键字参数更清楚。

7.4 *args 和 **kwargs#

*args 接收多个位置参数：

1
def total(*numbers):
2
    result = 0
3
    for number in numbers:
4
        result += number
5
    return result
6

7

8
print(total(1, 2, 3))

**kwargs 接收多个关键字参数：

1
def print_profile(**profile):
2
    for key, value in profile.items():
3
        print(key, value)
4

5

6
print_profile(name="zgm", age=23)

新手不要滥用。业务函数参数应该尽量明确。

7.5 作用域#

1
name = "global"
2

3

4
def show():
5
    name = "local"
6
    print(name)
7

8

9
show()
10
print(name)

函数内部的 name 和外部的 name 不是一个东西。

不要为了省事到处用全局变量。全局变量让代码变得难测、难改、难追踪。

8. 列表推导式：好用，但别写成谜语#

普通写法：

1
numbers = [1, 2, 3, 4, 5]
2
squares = []
3

4
for number in numbers:
5
    squares.append(number * number)

列表推导式：

1
squares = [number * number for number in numbers]

带条件：

1
even_numbers = [number for number in numbers if number % 2 == 0]

这很好。

但不要写这种：

1
result = [x.strip().lower() for row in rows for x in row if x and x.strip()]

能看懂，不代表好维护。超过一层循环或逻辑明显复杂时，老老实实拆开。

9. 模块、包、pip、虚拟环境#

这是 Python 新手真正容易死的地方。

9.1 模块#

一个 .py 文件就是一个模块。

比如 math_utils.py：

1
def add(a, b):
2
    return a + b

在 main.py 中使用：

1
from math_utils import add
2

3
print(add(1, 2))

9.2 包#

包是一个目录，里面放多个模块。

1
my_app/
2
  main.py
3
  user/
4
    __init__.py
5
    service.py

user/service.py：

1
def get_user_name():
2
    return "zgm"

main.py：

1
from user.service import get_user_name
2

3
print(get_user_name())

__init__.py 在现代 Python 里不总是必须，但新手先放着，少踩坑。

9.3 pip#

pip 是 Python 包安装工具。

安装第三方库：

1
python -m pip install requests

查看已安装包：

1
python -m pip list

导出依赖：

1
python -m pip freeze > requirements.txt

安装依赖：

1
python -m pip install -r requirements.txt

记住：优先用 python -m pip，少用裸 pip。裸 pip 到底对应哪个 Python，有时会坑你。

9.4 虚拟环境#

虚拟环境就是给每个项目单独放一套依赖。

创建：

1
python -m venv .venv

Windows PowerShell 激活：

1
.\.venv\Scripts\Activate.ps1

macOS / Linux 激活：

1
source .venv/bin/activate

激活后再安装依赖：

1
python -m pip install requests

退出虚拟环境：

1
deactivate

项目里不要提交 .venv 目录。它应该能被删除、重建。

.gitignore 里应该有：

1
.venv/
2
__pycache__/
3
*.pyc

新手只要养成一个习惯：一个项目一个 .venv。

10. 文件读写：脚本最常用的能力#

Python 很适合处理文件。

10.1 读取文本文件#

1
from pathlib import Path
2

3
path = Path("example.txt")
4
content = path.read_text(encoding="utf-8")
5

6
print(content)

推荐用 pathlib.Path，比手写字符串路径舒服。

10.2 写入文本文件#

1
from pathlib import Path
2

3
path = Path("output.txt")
4
path.write_text("Hello, Python", encoding="utf-8")

10.3 按行读取#

1
from pathlib import Path
2

3
path = Path("users.txt")
4

5
for line in path.read_text(encoding="utf-8").splitlines():
6
    print(line)

大文件不要一次性 read_text() 全读进内存，可以用：

1
from pathlib import Path
2

3
path = Path("large.log")
4

5
with path.open("r", encoding="utf-8") as file:
6
    for line in file:
7
        print(line.rstrip())

with 会自动关闭文件。

10.4 JSON#

JSON 是接口、配置、数据交换里最常见的格式。

读取 JSON：

1
import json
2
from pathlib import Path
3

4
path = Path("user.json")
5
data = json.loads(path.read_text(encoding="utf-8"))
6

7
print(data["name"])

写入 JSON：

1
import json
2
from pathlib import Path
3

4
user = {
5
    "id": 1,
6
    "name": "zgm",
7
    "skills": ["Python", "Go", "PHP"],
8
}
9

10
path = Path("user.json")
11
path.write_text(
12
    json.dumps(user, ensure_ascii=False, indent=2),
13
    encoding="utf-8",
14
)

ensure_ascii=False 可以保留中文，不会变成一堆转义。

10.5 CSV#

读取 CSV：

1
import csv
2
from pathlib import Path
3

4
path = Path("users.csv")
5

6
with path.open("r", encoding="utf-8", newline="") as file:
7
    reader = csv.DictReader(file)
8
    for row in reader:
9
        print(row["name"], row["age"])

写入 CSV：

1
import csv
2
from pathlib import Path
3

4
rows = [
5
    {"name": "Tom", "age": 20},
6
    {"name": "Jerry", "age": 21},
7
]
8

9
path = Path("users.csv")
10

11
with path.open("w", encoding="utf-8", newline="") as file:
12
    writer = csv.DictWriter(file, fieldnames=["name", "age"])
13
    writer.writeheader()
14
    writer.writerows(rows)

文件处理是 Python 的基本功。很多真实工作不是写大系统，而是把一堆脏数据变干净。

11. 异常处理：不要让错误裸奔#

错误一定会发生。文件不存在、接口超时、JSON 格式错、用户输入错，都很正常。

11.1 try / except#

1
try:
2
    number = int("abc")
3
except ValueError:
4
    print("不是合法数字")

不要这样写：

1
try:
2
    number = int("abc")
3
except Exception:
4
    pass

这叫吞错误。代码看起来没报错，实际问题被你埋了。

11.2 捕获具体异常#

1
from pathlib import Path
2

3
path = Path("missing.txt")
4

5
try:
6
    content = path.read_text(encoding="utf-8")
7
except FileNotFoundError:
8
    print(f"文件不存在：{path}")

能捕获具体异常，就不要上来 except Exception。

11.3 finally#

finally 一定会执行：

1
try:
2
    print("do something")
3
finally:
4
    print("cleanup")

但文件、连接这类资源更推荐用 with 管理。

11.4 主动抛异常#

1
def divide(a, b):
2
    if b == 0:
3
        raise ValueError("b 不能为 0")
4
    return a / b

抛异常不是坏事。静默返回奇怪结果才坏。

12. 日志：别只会 print#

print 适合学习和临时调试，不适合正式程序。

基本日志：

1
import logging
2

3
logging.basicConfig(level=logging.INFO)
4

5
logging.info("program started")
6
logging.warning("something may be wrong")
7
logging.error("something failed")

带上下文：

1
import logging
2

3
logging.basicConfig(
4
    level=logging.INFO,
5
    format="%(asctime)s %(levelname)s %(message)s",
6
)
7

8
user_id = 1001
9
logging.info("load user profile: user_id=%s", user_id)

日志要有上下文。不然线上看到一句 failed，跟没写一样。

13. 面向对象：类不是越多越好#

Python 支持面向对象，但新手最容易把类当仪式感。

13.1 定义类#

1
class User:
2
    def __init__(self, user_id, name):
3
        self.user_id = user_id
4
        self.name = name
5

6
    def display_name(self):
7
        return f"{self.user_id}-{self.name}"
8

9

10
user = User(1, "zgm")
11
print(user.display_name())

解释：

class User 定义类。
__init__ 是初始化方法。
self 指当前对象。
self.name 是对象属性。

13.2 dataclass#

简单数据对象可以用 dataclass：

1
from dataclasses import dataclass
2

3

4
@dataclass
5
class User:
6
    user_id: int
7
    name: str
8
    age: int
9

10

11
user = User(user_id=1, name="zgm", age=23)
12
print(user.name)

这比手写一堆 __init__ 清楚。

13.3 继承#

1
class Animal:
2
    def speak(self):
3
        return "..."
4

5

6
class Dog(Animal):
7
    def speak(self):
8
        return "wang"

继承能用，但不要滥用。很多时候组合更简单。

13.4 组合优先#

比如你要发送通知：

1
class EmailSender:
2
    def send(self, message):
3
        print(f"email: {message}")
4

5

6
class NotificationService:
7
    def __init__(self, sender):
8
        self.sender = sender
9

10
    def notify(self, message):
11
        self.sender.send(message)

NotificationService 不需要继承 EmailSender。它只需要持有一个 sender。

好代码不是类越多越好。类是为了表达状态和行为，不是为了显得高级。

14. 常用标准库：先学这些就够了#

Python 标准库很大，新手不需要全背。先掌握高频的。

14.1 pathlib#

1
from pathlib import Path
2

3
base_dir = Path("data")
4
file_path = base_dir / "users.json"
5

6
print(file_path.exists())

路径拼接用 /，比字符串拼接稳。

14.2 os#

1
import os
2

3
print(os.getenv("APP_ENV", "local"))

os 常用于环境变量、进程信息、系统相关操作。路径优先用 pathlib。

14.3 datetime#

1
from datetime import datetime
2

3
now = datetime.now()
4
print(now.strftime("%Y-%m-%d %H:%M:%S"))

日期时间很容易出坑：时区、格式、字符串转换都要小心。新手先掌握格式化和解析。

14.4 json#

前面讲过，接口和配置经常用。

1
import json
2

3
text = '{"name": "zgm"}'
4
data = json.loads(text)

14.5 re#

正则：

1
import re
2

3
text = "phone: 13800138000"
4
match = re.search(r"\d{11}", text)
5

6
if match:
7
    print(match.group())

正则强大，但别把业务规则全写成正则谜语。能用清楚的字符串方法解决，就别上正则。

14.6 argparse#

写命令行工具会用到：

1
import argparse
2

3
parser = argparse.ArgumentParser()
4
parser.add_argument("--name", required=True)
5

6
args = parser.parse_args()
7
print(f"hello {args.name}")

运行：

1
python main.py --name zgm

14.7 subprocess#

调用外部命令：

1
import subprocess
2

3
result = subprocess.run(
4
    ["python", "--version"],
5
    capture_output=True,
6
    text=True,
7
    check=True,
8
)
9

10
print(result.stdout)

不要随便把用户输入拼成 shell 命令。安全问题往往就从这里来。

15. 类型标注：Python 可以动态，但项目要清楚#

Python 类型标注不会把 Python 变成 Java。它只是让代码更清楚。

15.1 基础类型标注#

1
name: str = "zgm"
2
age: int = 23
3
is_active: bool = True

函数：

1
def add(a: int, b: int) -> int:
2
    return a + b

15.2 容器类型#

1
names: list[str] = ["Tom", "Jerry"]
2
scores: dict[str, int] = {"Tom": 90}
3
tags: set[str] = {"Python", "Go"}
4
point: tuple[int, int] = (10, 20)

15.3 可空类型#

现代写法：

1
def find_user_name(user_id: int) -> str | None:
2
    if user_id == 1:
3
        return "zgm"
4
    return None

调用时要处理 None：

1
name = find_user_name(2)
2

3
if name is None:
4
    print("user not found")
5
else:
6
    print(name.upper())

15.4 TypedDict#

如果你经常处理 dict，可以用 TypedDict 表达结构：

1
from typing import TypedDict
2

3

4
class UserDict(TypedDict):
5
    id: int
6
    name: str
7
    age: int
8

9

10
def display_user(user: UserDict) -> str:
11
    return f"{user['id']}-{user['name']}"

类型标注不是为了装饰。它能让 IDE、静态检查工具和读代码的人更早发现问题。

16. 测试：不要靠手点验证#

Python 自带 unittest，但新手和项目里更常用 pytest。

安装：

1
python -m pip install pytest

写一个函数 calculator.py：

1
def add(a: int, b: int) -> int:
2
    return a + b

写测试 test_calculator.py：

1
from calculator import add
2

3

4
def test_add():
5
    assert add(1, 2) == 3

运行：

1
python -m pytest

测试不是大型项目才需要。越是脚本，越容易因为“就改一行”把行为改坏。

16.1 测试什么#

优先测试：

数据转换函数
文件解析函数
接口响应处理函数
金额、状态、权限等业务判断
容易被重构影响的核心逻辑

不要测试：

纯粹调用第三方库的一行包装
没有任何逻辑的 getter / setter
今天写明天删的临时代码

测试要服务现实，不是服务覆盖率数字。

17. 项目结构：别把所有代码塞进 main.py#

一个小项目可以这样组织：

1
python-learning-demo/
2
  .venv/
3
  .gitignore
4
  requirements.txt
5
  README.md
6
  main.py
7
  app/
8
    __init__.py
9
    config.py
10
    file_store.py
11
    service.py
12
  tests/
13
    test_service.py

含义：

main.py：程序入口。
app/config.py：配置读取。
app/file_store.py：文件读写。
app/service.py：业务逻辑。
tests/：测试。
requirements.txt：依赖列表。

不要一上来搞复杂架构。小项目先做到：

入口清楚。
业务逻辑和文件读写分开。
配置不要写死太多。
有基础测试。
依赖能重装。

18. 一个完整小项目：命令行待办清单#

下面用一个小项目把基础串起来。

目标：

添加待办。
查看待办。
完成待办。
数据保存到 JSON 文件。

18.1 项目结构#

1
todo_app/
2
  main.py
3
  todo_store.py
4
  todo_service.py
5
  todos.json

18.2 数据格式#

todos.json：

1
[
2
  {
3
    "id": 1,
4
    "title": "学习 Python 变量",
5
    "done": false
6
  }
7
]

18.3 文件存储#

todo_store.py：

1
import json
2
from pathlib import Path
3

4

5
DATA_FILE = Path("todos.json")
6

7

8
def load_todos() -> list[dict]:
9
    if not DATA_FILE.exists():
10
        return []
11

12
    text = DATA_FILE.read_text(encoding="utf-8")
13

14
    if not text.strip():
15
        return []
16

17
    return json.loads(text)
18

19

20
def save_todos(todos: list[dict]) -> None:
21
    DATA_FILE.write_text(
22
        json.dumps(todos, ensure_ascii=False, indent=2),
23
        encoding="utf-8",
24
    )

这里做了几个必要判断：

文件不存在时返回空列表。
文件为空时返回空列表。
保存时用 UTF-8。
保存 JSON 时保留中文。

18.4 业务逻辑#

todo_service.py：

1
from todo_store import load_todos, save_todos
2

3

4
def list_todos() -> list[dict]:
5
    return load_todos()
6

7

8
def add_todo(title: str) -> dict:
9
    todos = load_todos()
10

11
    next_id = 1
12
    if todos:
13
        next_id = max(todo["id"] for todo in todos) + 1
14

15
    todo = {
16
        "id": next_id,
17
        "title": title,
18
        "done": False,
19
    }
20

21
    todos.append(todo)
22
    save_todos(todos)
23

24
    return todo
25

26

27
def complete_todo(todo_id: int) -> bool:
28
    todos = load_todos()
29

30
    for todo in todos:
31
        if todo["id"] == todo_id:
32
            todo["done"] = True
33
            save_todos(todos)
34
            return True
35

36
    return False

这段代码没有上来搞数据库，也没有搞框架。它先把“数据读取、业务处理、数据保存”这条线写清楚。

18.5 命令行入口#

main.py：

1
import argparse
2

3
from todo_service import add_todo, complete_todo, list_todos
4

5

6
def handle_list() -> None:
7
    todos = list_todos()
8

9
    if not todos:
10
        print("暂无待办")
11
        return
12

13
    for todo in todos:
14
        mark = "✓" if todo["done"] else " "
15
        print(f"{todo['id']}. [{mark}] {todo['title']}")
16

17

18
def handle_add(title: str) -> None:
19
    todo = add_todo(title)
20
    print(f"已添加：{todo['id']} - {todo['title']}")
21

22

23
def handle_done(todo_id: int) -> None:
24
    ok = complete_todo(todo_id)
25

26
    if ok:
27
        print("已完成")
28
    else:
29
        print("待办不存在")
30

31

32
def main() -> None:
33
    parser = argparse.ArgumentParser()
34
    subparsers = parser.add_subparsers(dest="command")
35

36
    subparsers.add_parser("list")
37

38
    add_parser = subparsers.add_parser("add")
39
    add_parser.add_argument("title")
40

41
    done_parser = subparsers.add_parser("done")
42
    done_parser.add_argument("id", type=int)
43

44
    args = parser.parse_args()
45

46
    if args.command == "list":
47
        handle_list()
48
    elif args.command == "add":
49
        handle_add(args.title)
50
    elif args.command == "done":
51
        handle_done(args.id)
52
    else:
53
        parser.print_help()
54

55

56
if __name__ == "__main__":
57
    main()

运行：

1
python main.py add "学习 Python 函数"
2
python main.py list
3
python main.py done 1
4
python main.py list

这个小项目覆盖了：

变量
dict / list
函数
模块导入
文件读写
JSON
条件判断
循环
命令行参数
简单业务逻辑

这比刷十个孤立语法例子有用。

19. Python 常见方向怎么继续学#

基础学完后，再分方向。

19.1 Web 后端#

路线：

HTTP 基础
JSON API
FastAPI 或 Django
数据库：MySQL / PostgreSQL
ORM：SQLAlchemy / Django ORM
鉴权：JWT / Session
日志、配置、错误处理
部署：Docker / Linux / Nginx

如果你目标是找后端工作，建议先学 FastAPI。它轻、类型友好、适合理解现代 API。

19.2 自动化脚本#

路线：

pathlib / os / shutil
Excel / CSV / JSON
requests / httpx
argparse
logging
定时任务
打包成命令行工具

自动化最重要的是输入输出清楚。脚本也要能重复跑、能报错、能记录日志。

19.3 爬虫#

路线：

HTTP 请求和响应
HTML 结构
requests / httpx
BeautifulSoup / lxml
Playwright
反爬基础
数据保存

爬虫不是“请求一下就完事”。要尊重网站规则，也要处理失败、重试、限速和数据清洗。

19.4 数据分析#

路线：

numpy
pandas
matplotlib / seaborn
Jupyter
数据清洗
分组统计
可视化

数据分析不是只会 import pandas as pd。真正难的是理解数据含义和清洗脏数据。

19.5 AI 工程#

路线：

Python 基础
numpy
PyTorch 基础
API 调用
向量数据库基础
Prompt 工程
RAG
模型服务部署

AI 方向更不能跳基础。不会文件、JSON、异常、日志、HTTP、并发，做 AI 应用会到处漏水。

20. 新手最容易写烂的地方#

20.1 一个文件写到底#

坏味道：

1
main.py  2000 行

这不是简单，这是失控。至少把文件读写、业务逻辑、入口拆开。

20.2 到处复制粘贴#

看到三段相似代码，就该考虑函数。
看到十段相似代码，还继续复制，就是坏品味。

20.3 吞异常#

1
try:
2
    do_something()
3
except Exception:
4
    pass

这是把错误埋到地雷里。迟早炸。

20.4 不用虚拟环境#

全局安装依赖，今天能跑，明天另一个项目一装包就冲突。
一个项目一个 .venv，这不是洁癖，是基本卫生。

20.5 函数太长#

函数超过几十行就该警惕。不是绝对不能长，而是长函数通常在做多件事。

拆函数不是为了形式好看，是为了让每段逻辑能单独理解、单独测试。

20.6 命名含糊#

坏命名：

1
data = get_data()
2
handle(data)

好一点：

1
users = load_users()
2
send_welcome_messages(users)

名字就是文档。名字烂，代码就烂一半。

20.7 过早上框架#

不会函数、模块、异常、文件，就开始 Django / FastAPI。最后只会复制目录，不知道每层在干什么。

框架是放大器。基础好，框架放大生产力；基础差，框架放大混乱。

21. 最后给一张 Python 学习路线表#

阶段	重点	能力标准
1	安装、解释器、`.py` 文件	能运行脚本
2	变量、基础类型	能表达数字、字符串、布尔值和空值
3	list / tuple / dict / set	能处理列表、映射、去重
4	if / for / while / match	能写清楚的分支和循环
5	函数、参数、作用域	能把重复逻辑拆成函数
6	模块、包、pip	能组织多个文件并安装依赖
7	虚拟环境	能让项目依赖隔离、可重建
8	文件、JSON、CSV	能处理真实数据
9	异常和日志	能让错误可见、可追踪
10	类和 dataclass	能表达业务对象
11	标准库	能独立写常见工具脚本
12	类型标注	能让代码更清楚
13	pytest	能用测试保护逻辑
14	小项目	能写一个可运行、可维护的小工具
15	分方向深入	Web、自动化、爬虫、数据、AI

结尾：Python 的核心不是“简单”，而是快而清楚#

Python 容易入门，但不代表可以随便写。

真正好的 Python 代码应该是：

文件结构清楚。
函数职责清楚。
数据格式清楚。
错误处理清楚。
依赖环境清楚。
输入输出清楚。

Python 最适合做什么？快速把想法变成工具，快速把数据处理干净，快速把接口和自动化跑起来。

但“快”不是“乱”。

如果你是新手，就按这份手册走。先别急着喊 AI、爬虫、Web 框架。先把变量、数据结构、函数、模块、文件、异常、虚拟环境和测试写熟。基础稳了，后面学 FastAPI、Django、Pandas、Playwright、PyTorch，都不会虚。

参考资料#

2026-05-31 强化：从“会语法”到“能维护一个 Python 项目”#

前面讲的是 Python 基础。这里补真正的工程分水岭：Python 入门不是背完语法，而是能把一个脚本收拾成可重复、可测试、可交付的小项目。 很多教程一上来就爬虫、AI、Pandas，最后新手连 pip install 到底装进哪个解释器都说不清。这不是 Python 难，是学习顺序烂。

我建议按三层学：

1
语言能跑：解释器 / .py 文件 / 变量 / 数据结构 / 函数 / 模块
2
项目能管：.venv / python -m pip / pyproject.toml / src layout / 测试 / 日志
3
问题能解：CLI 工具 / 文件处理 / HTTP 调用 / 数据清洗 / 小型自动化

24. 官方路线怎么读#

Python 官方 Tutorial 的顺序很朴素：解释器、基础类型、控制流、数据结构、模块、输入输出、异常、类、标准库，最后到虚拟环境和包。别把文档当字典背，每读一章就写一个能跑的小程序。

阶段	你要掌握的东西
解释器	`python` / `py` / REPL / 运行 `.py`
基础类型	数字、字符串、布尔、`None`、列表切片
控制流	`if`、`for`、`while`、`match`、函数参数
数据结构	`list`、`tuple`、`dict`、`set`、推导式
模块	一个文件如何被另一个文件导入，包如何组织
I/O	文本文件、JSON、CSV、路径处理
异常	什么时候捕获，什么时候让错误暴露
标准库	`pathlib`、`argparse`、`logging`、`datetime`、`json`
环境	`.venv`、`python -m pip`、依赖隔离

25. `.venv` 是底线，不是高级技巧#

每个项目都应该有自己的虚拟环境：

1
python -m venv .venv
2
python -m pip install --upgrade pip

Windows PowerShell：

1
.\.venv\Scripts\Activate.ps1

macOS / Linux：

1
source .venv/bin/activate

优先用 python -m pip，不要裸 pip。裸 pip 很容易指到另一个 Python。python -m pip 至少保证：你正在用哪个解释器，就给哪个解释器装包。

一个正常小项目应该长这样：

1
article-lint/
2
├── .venv/                  # 本机环境，不进 git
3
├── pyproject.toml
4
├── README.md
5
├── src/
6
│   └── article_lint/
7
│       ├── __init__.py
8
│       ├── cli.py
9
│       ├── markdown.py
10
│       └── rules.py
11
└── tests/
12
    ├── test_markdown.py
13
    └── test_rules.py

把业务代码放进 src/包名/，不是装腔。它能避免测试时误导入当前目录里的同名文件，让你的包更接近真实安装后的行为。

26. `pyproject.toml` 先写最少的#

现代 Python 项目应该有 pyproject.toml，但新手别一上来塞满 200 行配置。够用即可：

1
[build-system]
2
requires = ["setuptools>=68"]
3
build-backend = "setuptools.build_meta"
4

5
[project]
6
name = "article-lint"
7
version = "0.1.0"
8
description = "Check markdown articles for simple quality rules."
9
readme = "README.md"
10
requires-python = ">=3.12"
11
dependencies = []
12

13
[project.scripts]
14
article-lint = "article_lint.cli:main"

然后本地开发安装：

1
python -m pip install -e .
2
article-lint src/content/posts/python-beginner-learning-manual.md

这就是从“一次性脚本”到“可安装工具”的第一步。

27. 用博客自己的问题练手：Markdown 文章质量检查器#

别再抄“学生管理系统”。对这个博客来说，最真实的小项目是 Markdown 质检器：

1
输入：一个或多个 .md 文件
2
输出：标题、正文非空白字符数、二级标题数、参考资料是否存在
3
规则：少于 3000 字警告；无二级标题警告；无参考资料警告；frontmatter 无 title 报错

核心数据结构：

1
from dataclasses import dataclass
2
from pathlib import Path
3

4
@dataclass(frozen=True)
5
class ArticleReport:
6
    path: Path
7
    title: str
8
    body_chars: int
9
    heading_count: int
10
    warnings: list[str]
11
    errors: list[str]

解析 frontmatter：

1
def split_frontmatter(path: Path) -> tuple[dict[str, str], str]:
2
    text = path.read_text(encoding="utf-8")
3
    if not text.startswith("---"):
4
        return {}, text
5
    parts = text.split("---", 2)
6
    if len(parts) < 3:
7
        return {}, text
8
    meta = {}
9
    for line in parts[1].splitlines():
10
        if ":" not in line:
11
            continue
12
        key, value = line.split(":", 1)
13
        meta[key.strip()] = value.strip().strip('"')
14
    return meta, parts[2]

规则检查：

1
def inspect_article(path: Path) -> ArticleReport:
2
    meta, body = split_frontmatter(path)
3
    errors, warnings = [], []
4
    title = meta.get("title", "")
5
    if not title:
6
        errors.append("frontmatter missing title")
7
    body_chars = sum(1 for ch in body if not ch.isspace())
8
    heading_count = sum(1 for line in body.splitlines() if line.startswith("## "))
9
    if body_chars < 3000:
10
        warnings.append("article body is too short")
11
    if heading_count == 0:
12
        warnings.append("missing second-level headings")
13
    if "参考资料" not in body and "资料来源" not in body:
14
        warnings.append("missing references section")
15
    return ArticleReport(path, title, body_chars, heading_count, warnings, errors)

这个小项目把 pathlib、字符串处理、dict/list、dataclass、函数拆分、CLI 返回码、测试全部串起来。比“看完教程”可靠得多。

28. 测试和异常：别把错误埋了#

先测纯函数：

1
def test_split_frontmatter_reads_title(tmp_path):
2
    file = tmp_path / "post.md"
3
    file.write_text('---\ntitle: "Python 学习"\n---\n\n正文', encoding="utf-8")
4
    meta, body = split_frontmatter(file)
5
    assert meta["title"] == "Python 学习"
6
    assert "正文" in body

运行：

1
python -m pytest

别写这种垃圾：

1
try:
2
    do_work()
3
except Exception:
4
    pass

能处理就处理，不能处理就失败。捕获具体异常，给出清楚错误。长期运行的工具和服务用 logging，不要靠一堆 print 猜线上发生了什么。

29. 学习验收清单#

阶段	产出	验收
基础语法	10 个小脚本	`python script.py`
数据结构	JSON/CSV 转换器	输入输出可对比
模块	拆成 3 个 `.py` 文件	能被 `import`
环境	每项目 `.venv`	不污染全局
包管理	`pyproject.toml`	`python -m pip install -e .`
CLI	`argparse` 命令	返回码 0/1 明确
测试	5-10 个单测	`python -m pytest`
小项目	Markdown 检查器	能检查本博客文章

30. 参考资料#

Python Tutorial：https://docs.python.org/3/tutorial/
Virtual Environments and Packages：https://docs.python.org/3/tutorial/venv.html
venv 标准库文档：https://docs.python.org/3/library/venv.html
Installing Packages：https://packaging.python.org/en/latest/tutorials/installing-packages/
Packaging Python Projects：https://packaging.python.org/en/latest/tutorials/packaging-projects/
Writing your pyproject.toml：https://packaging.python.org/en/latest/guides/writing-pyproject-toml/