2016年4月25日开始

肖凯老师数据科学课笔记

课程大纲

  1. 导论
  2. 工具基础(linux/ipython)
  3. 数值计算(numpy)
  4. 数据绘图(matplotlib)
  5. 数据操作(pandas)
  6. 概率和统计分析(statsmodels)
  7. 数值计算(scipy)
  8. 线性模型(statsmodels)
  9. 机器学习初步(sklearn)
  10. 毕业典礼+大作业

课程安排

整体安排

每周课程元素:视频+代码+练习+阅读资料+互动答疑(+毕业项目)。

总共 9 次课,每次课程视频时长 45 mins 左右。

关键节点:

  • 0wd1(160425) 18:00 组建学员微信群,配置 开智学堂 APP 使用权限
  • 0wd2(160426) 19:42 开学典礼
  • 9wd6(160702) 19:42 结业路演+结业典礼

每周学习节奏

  • 助教 *wd1 通知本周要完成的内容,学有余力的学员可根据自身进度提前学习下周内容
  • 学员自己安排时间学习、完成作业
    • 疑问发布到 Issue 中,发布方式参考 Issue 提问模板
    • 导师/助教 异步答疑指点
    • 尽量不在微信群中讨论技术问题
  • *wd6 20:42~21:42 学员微信群集中答疑
  • (*+1)wd1 11:42 前学员提交作业到 Data102 学员仓库的每周作业 Issues

课程教辅团队

  • 课程导师:肖凯 @xccds
  • 课程助教:竹子 @bambooom ,张亮 @hysic ,裘德 @jude90

若有课程/技术疑问,欢迎联系课程导师和课程助教。

  • 课程助理:章靛 @zhangdian0801

若有其它疑问/需求,欢迎联系@一休或课程助理。

课程资源索引

所用参考资料

  • 《深入浅出数据分析》
  • 《统计学的世界》
  • 《利用Python进行数据分析》
  • 《数据科学实战》
  • Numerical Python
  • Think Stats
  • Python for science
  • http://www.scipy-lectures.org/

自行预习材料

为了你能获得更好的学习体验,正式上课之前建议你学习以下资料:

反馈渠道

  1. 学习疑问优先发布在 Data102 学员仓库 Issue中进行主题异步讨论
  2. 反馈课程内容错误请点 开智学堂 APP 内容错误反馈 · Issue #4 · OpenMindClub/Data102
  3. 反馈课程意见建议直接联系一休,或发邮件到 [email protected]
  4. 提交开智学堂 APP Bug 请点 OpenMindClub/OMC.App

常用网址

(建议将以下页面添加书签以便及时取用)

附:

学员要求

  • 有兴趣,有时间(每周≥10h),有目标
  • 不怕代码,不怕公式,不怕英文
  • 必须进行线下补充阅读和练习
  • 软件环境推荐是 Linux/OS X(Win 同学建议安装虚拟机)

缩写规约

数字

  • 数字序列从 0 开始
  • 自然周从 星期天 开始,计为 第 0 日

时间

  • w ~ week 周
  • d ~ day 日
  • h ~ hour 小时
  • 时间的表述最短为 .5h ~ 半小时
  • 以固定的课程起点当周为中心点
    • 开课前,为负数
      • -1wd3 为 4.26 前一周第三天,即 160420
    • 开课后,为正数
      • 0wd1 为 4.26 当周第一天,即 160425