005 Python 的安装和设置
大家好,我是张大鹏,欢迎来到大鹏AI教育。
在 AI 时代,我们一起学编程、做项目,把技术真正用起来。
这一节课,我们来认真讲清楚一件事:如何在 Ubuntu 上安装 Python。
安装环境,是很多人学编程踩的第一个坑。
所以这一节我会讲得细一点,把原理和注意事项都讲到。
我们先说环境。
这门课,我们以 Ubuntu 26 作为参考系统。
Ubuntu 通常有两种版本。
一种是桌面版,它带有图形界面,可以用鼠标点击操作,也有浏览器。
另一种是服务器版,它没有图形界面,只有一个命令行窗口。
我们平时在自己电脑上学习,多半用的是桌面版。
而真正把程序部署到云服务器上跑的时候,面对的往往是服务器版。
这两种版本,安装 Python 的思路完全一样。
区别只有一点:桌面版可以打开浏览器下载文件,服务器版主要靠命令来下载。
所以下面讲的命令,两种版本基本都能用,大家不用担心。
在动手之前,我还想先帮大家建立一个重要的概念。
Python 的安装,其实不止"有没有装"这么简单。
它还涉及到三样东西:Python 本体、包管理工具,以及环境隔离。
Python 本体,就是能运行 Python 代码的解释器。
包管理工具,是用来安装第三方库的,比如我们后面要学的 Pandas。
环境隔离,是为了让不同的项目,各自用各自的库,互不干扰。
这三样东西,后面讲每种安装方式时,我都会带到。
现在大家先有个印象就好。
下面我们介绍第一种方式,安装官方版本的 Python。
其实 Ubuntu 26 系统本身,就已经自带了 Python。
我们可以先打开终端。
桌面版可以在应用列表里找到"终端"这个程序。
服务器版登录进去,本身就是命令行,不用再找。
然后输入下面这句,查看版本:
python3--version如果显示出版本号,说明系统里已经有 Python 了。
这里有一个细节要提醒大家。
在 Ubuntu 上,命令通常是python3,而不是python。
因为系统为了兼容,把这两个名字做了区分。
直接敲python有时候会提示找不到命令,这是正常的。
接下来我要讲一个很重要的注意事项。
系统自带的这个 Python,叫做"系统 Python"。
Ubuntu 系统自己很多功能,都依赖它来运行。
所以我们尽量不要去删除它,也不要去随意升级或者覆盖它。
更不要动不动就用sudo加pip去往系统里装库。
一旦把系统 Python 搞乱,可能会导致系统的一些功能出问题。
那我们正确的做法是什么呢?
是在系统 Python 之外,把我们自己要用的工具补齐,并且用独立的环境来做项目。
在更新软件列表之前,我建议先做一件事。
就是把软件源,换成国内的镜像源。
这是什么意思呢?
Ubuntu 默认的下载服务器在国外。
我们在国内直接下载,速度往往很慢,有时候还会失败。
而国内的一些机构,比如清华、阿里、中科大,都提供了镜像源。
镜像源里的内容和官方一模一样,但服务器在国内,下载快很多。
所以换源,是国内用户几乎必做的一步。
Ubuntu 26 用的是一种新的软件源配置格式。
它的配置文件在这个位置:
/etc/apt/sources.list.d/ubuntu.sources我们在修改之前,先把它备份一份,万一改错了也能还原:
sudocp/etc/apt/sources.list.d/ubuntu.sources /etc/apt/sources.list.d/ubuntu.sources.bak然后用下面两条命令,把里面的官方地址,替换成清华的镜像地址:
sudosed-i's@//.*archive.ubuntu.com@//mirrors.tuna.tsinghua.edu.cn@g'/etc/apt/sources.list.d/ubuntu.sourcessudosed-i's@//.*security.ubuntu.com@//mirrors.tuna.tsinghua.edu.cn@g'/etc/apt/sources.list.d/ubuntu.sources如果你不习惯用命令替换,也可以用编辑器打开这个文件,手动把里面的网址改掉。
换好源之后,我们再来更新软件列表:
sudoaptupdate这时候你会发现,下载速度明显快了很多。
然后安装 pip 和虚拟环境工具:
sudoaptinstallpython3-pip python3-venv这条命令会装好两样东西。
一个是 pip,也就是 Python 的包管理工具,以后装 Pandas 就靠它。
另一个是 venv,也就是虚拟环境工具,用来做环境隔离。
装完之后,我们就有了一套比较完整的官方 Python 环境。
既然装好了 pip,我再顺便教大家配置一下 pip 的国内源。
道理和刚才换 Ubuntu 源是一样的。
pip 默认是从国外的服务器下载 Python 库。
在国内同样会比较慢。
所以我们也把它换成国内镜像。
我们可以用一条命令,一次性把它配置好:
pip3 configsetglobal.index-url https://pypi.tuna.tsinghua.edu.cn/simple这条命令的意思,是把 pip 默认的下载源,设置成清华的镜像。
配置好之后,以后我们用 pip 装任何库,都会自动走国内源,速度很快。
这个配置是全局的,以后在虚拟环境里也同样有效。
如果你只是想临时用一次国内源,而不想永久修改配置,也可以在安装命令后面加上-i参数,例如:
pipinstallpandas-ihttps://pypi.tuna.tsinghua.edu.cn/simple这样就只有这一次安装走国内源。
讲到这里,我顺便把"虚拟环境"这个概念再说清楚。
虚拟环境,简单理解,就是给每个项目单独开一个干净的小房间。
我们在这个小房间里装的库,只属于这个项目。
换一个项目,就再开一个新房间,互不影响。
创建虚拟环境的命令,是下面这样,最后是一个自己起的名字:
python3-mvenv myenv然后用下面这句把它激活:
sourcemyenv/bin/activate激活之后,命令行前面会出现这个环境的名字。
这时候我们再用 pip 装库,就只装在这个环境里,非常干净。
这是专业开发里很重要的一个好习惯。
官方版 Python 的方式,我们就讲到这。
它的特点是干净、轻量、可控,但需要我们自己动手补齐工具。
下面我们介绍第二种方式,安装 Anaconda。
如果说官方版是"自己一样一样配齐",那 Anaconda 就是"全家桶一次到位"。
Anaconda 是一个专门为数据科学打造的发行版。
它装好之后,不仅有 Python。
还自带了 Pandas、NumPy、Matplotlib、Jupyter 等几百个常用工具。
所以对初学者特别友好,装完基本就能直接开始学。
它的核心,是一个叫 conda 的工具。
conda 既能管理第三方库,又能管理虚拟环境。
也就是说,前面我们说的包管理和环境隔离,conda 一个工具就全包了。
我们来看怎么装。
如果是桌面版,可以打开浏览器,进入 Anaconda 官网,下载 Linux 版的安装包。
如果是服务器版,没有浏览器,我们就用wget命令,把下载链接拉下来。
这里同样推荐用国内镜像,速度更快:
wgethttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-2024.xx-Linux-x86_64.sh下载到的,是一个.sh结尾的安装脚本。
然后用bash加上这个脚本的文件名,运行它:
bashAnaconda3-2024.xx-Linux-x86_64.sh接下来会进入一个交互过程。
它会让你阅读并同意许可协议,输入 yes。
还会问你安装位置,一般用默认的就行。
最后会问你要不要做初始化,这里建议输入 yes。
这个"初始化",我要专门解释一下。
所谓初始化,就是 conda 把自己写进你的终端配置里。
这样以后一打开终端,conda 就能直接用。
所以装完 Anaconda 之后,要把终端关掉再重新打开一次。
重新打开后,你会发现命令行前面多了一个(base)。
这个base,就是 conda 默认的基础环境。
它说明 conda 已经在正常工作了。
我们可以用下面这句来确认:
conda--version能显示版本号,就说明 Anaconda 装好了。
Anaconda 也有它的代价。
它体积比较大,会占用好几个 G 的硬盘空间。
另外还有一点要提醒大家。
Anaconda 这个发行版,对大型企业的商业使用,是有授权要求的。
我们个人学习、做项目,是完全没问题的。
但如果将来在大公司里大规模使用,就要留意它的授权政策。
下面我们介绍第三种方式,安装 Miniconda。
Miniconda,可以理解成 Anaconda 的精简版。
它只保留了最核心的两样东西:conda 工具和 Python。
不像 Anaconda 那样,一上来就装几百个库。
所以它的体积很小,只有几百兆。
那有人可能会问,工具少了,会不会不够用?
不会。
因为 conda 还在。
我们需要什么库,后面用 conda 命令单独装就行了。
相当于先要一个干净的底子,再按需添砖加瓦。
它的安装方式,和 Anaconda 几乎一模一样。
同样推荐用国内镜像下载 Linux 版的安装脚本:
wgethttps://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-x86_64.sh然后用bash运行它,按提示一路确认,初始化选 yes:
bashMiniconda3-latest-Linux-x86_64.sh装完同样关掉终端再打开,看到(base)就成功了。
再用conda --version验证一下版本号。
对于服务器这种只有命令行、又很在意空间的环境,Miniconda 往往是最受欢迎的选择。
那么这三种方式,我们到底该怎么选呢?
我们可以这样来理解。
第一,如果你想环境干净、占用空间小,也愿意之后自己动手补工具,那就选官方版 Python。
它最轻、最可控,也最能帮你真正理解环境是怎么回事。
第二,如果你是初学者,希望一步到位、尽量少折腾,那就选 Anaconda。
装完全家桶都齐了,可以把精力直接放在学习数据分析上。
第三,如果你既想要 conda 的方便,又不想占太多空间,那就选 Miniconda。
它是前面两者之间的一个折中。
我们再结合系统版本来看。
桌面版这三种方式都可以随意选择。
服务器版因为只有命令行、又更在意空间,一般更推荐官方版或者 Miniconda。
最后我再强调一个贯穿始终的好习惯。
不管你用哪种方式装 Python,都建议为每个项目使用独立的虚拟环境。
用官方版,就用 venv 来建环境。
用 Anaconda 或 Miniconda,就用 conda 来建环境。
养成这个习惯,你以后的项目会非常干净,也很少会遇到库冲突的问题。
这一节我们需要记住一个判断标准:
不管用哪种方式,只要在终端里敲python3 --version或者conda --version能正常显示版本号,就说明 Python 已经装好了。
后面我们学习 Pandas 的所有内容,都会建立在这套装好的 Python 环境之上。
好了,这节课我们就先讲到这里。
我是张大鹏,关注大鹏AI教育,我们一起在 AI 时代学编程、做项目。