从零开始学机器学习之第一天
1 机器学习 rabin 49 阅读 • 6个月前

工欲善其事必先利其器,在学习机器学习之前,我们需要拥有自己的开发环境,网上有很多教程,这里推荐使用anaconda或者dm工具(仅支持linux,或者安装有docker的操作系统)。

一、开发环境准备:

不建议在开发环境上浪费时间,我是直接用的dm工具:

dm run py-note

之后py-note logs查看一下里面的端口8888和8889的token。

二、代码调试:

访问你的机器ip:10002(jupyterlab),输入8889的token。

新建一个python3 notebook,贴入代码:

from sklearn import datasets
from sklearn.model_selection import cross_val_predict
from sklearn import linear_model
import matplotlib.pyplot as plt

lr = linear_model.LinearRegression()
boston = datasets.load_boston()
y = boston.target

# cross_val_predict returns an array of the same size as `y` where each entry
# is a prediction obtained by cross validation:
predicted = cross_val_predict(lr, boston.data, y, cv=10)

fig, ax = plt.subplots()
ax.scatter(y, predicted, edgecolors=(0, 0, 0))
ax.plot([y.min(), y.max()], [y.min(), y.max()], 'k--', lw=4)
ax.set_xlabel('Measured')
ax.set_ylabel('Predicted')
plt.show()

按下shift+enter,稍等片刻后,如果出现结果就代表运行成功。

三、数据集准备:

网上有提供很多数据集,我也收集了几个,放到我的git仓库里了,以后还会持续增加。

导入方法:

jupyterlab里,新建terminal,输入:

apt install git

安装git,之后把数据集clone过来:

git clone https://github.com/shemic/data /src/data

好了,现在开始你的机器学习之旅吧。

评论:0