跳转至

机器学习入门 - 环境搭建

Anaconda 环境

我们选择使用 Anaconda 来配置在机器学习的环境。一方面其添加了许多常用的数据科学的包如 Numpy、TensorFlow 等,也包含了它们所依赖的更多模组;另一方面它能更方便地管理和切换运行环境。用一句话说,Anaconda 就是一个一站式的数据科学编程环境。

Anaconda 的下载:https://www.anaconda.com/download

安装完成后,如何开始呢?你可以看这个官方课程,一步步入手:Get Started with Anaconda,也可也直接参考以下的简明步骤开始。

当安装完成后,可以在 Anaconda Prompt 命令行界面,输入命令 conda list 验证其安装状况以及内置的包列表。

官方推荐创建一个虚拟环境,这样如果玩坏了可以直接换一个,不必重新卸载安装:

conda create --name NEW_ENV_NAME
conda activate NEW_ENV_NAME

conda 默认的 channel 是 defaults,但这个 channel 的代码包不全,所以将其更换为 conda-forge:

conda config --add channels conda-forge

接着,在这个虚拟环境里安装一些常用的包:

conda install jupyterlab rich faker chime schedule pandas scikit-learn

最后,启动 JupyterLab:

jupyter lab

scikit-learn 机器学习工具包

接下来的文章,将使用 scikit-learn 入门机器学习。scikit-learn(sklearn)包含了分类、回归、降维、聚类等基础常用的机器学习算法,也包含了特征提取、数据处理、模型评估等模块,适合入门。

参考与致谢