在七月中旬,我曾经问过涛哥,sklearn 的学习侧重,他给的建议是先学习应用.这与我重应用,补理论的观点不谋而合.

这是针对零基础的入门方法.对于数学功底一般(如果没有,那就还是先补一补数学吧…)的人,先看应用,在应用的过程中理解理论知识,这是比较稳妥的办法,也可以避免但看理论的枯燥,避开中期乏力的问题.

而如果数学\统计学底子好的,可以由理论入实践,这样会更快.

以下是一些资源:
python 机器学习应用

这是涛哥推荐的应用型学习网站,我已经全都看完,并且对其中的一些代码进行了优化,这里的优化是指性能优化,并不是说原来的不好,原来的为了照顾新人,所以有些地方写得太难看了.当然,原来的代码有些地方是有问题的,如果遇到了,可以问我.

datacamp

datacamp,不知道你能不能连上去,这里面的课程是收费的,不过你可以蹭一节 sklearn 的应用先导课,这门可的第一节免费的,可以通过这个知道一下 sklearn 的入门方式.这是我目前看到的最好的实践教学网站(穷穷不说话).

这是我所说的那门课程

sklearn 的中文翻译
sklearn 的中文翻译对数学底子不好的新手实在过于不友好了.作为低配的官方文档使用.

sklearn 官方文档
sklearn 的官方文档是我少见的良心文档之一,只把它作为”工具书”来用实在过于屈才,但是如果只靠它来学习 sklearn(反正我是撑不下去…)

以上是主要的资源,以前发给你们的电子书,那本<数据挖掘导论>可以看一下,毕竟是导论嘛.我这里是有书后习题的答案的,当时好像没有给你们.

其余的一些不是很重要的资源,等我想到了再做补充吧~