组队学习数据分析,有一起学的吗

最近在技客时间这个课程里学数据分析快一个月了,课程是不错,蛋疼的是pd.dataframe操作起来我都懵了啊,于是我有了一个想法,模仿课程的代码,用Julia写一遍。
但是你们知道Julia文档比较少,没多少是中文的,我想看看有没有组队一起学习的,大纲我都搞好了


现在就缺队友了,我把文档贴一下,以后就从这些文档里我们每个人分配好任务学习,到一定时间汇报吧


文档

  1. [数据分析]机器学习框架 MLJ
    https://alan-turing-institute.github.io/DataScienceTutorials.jl/
    Home · MLJ
    这个数据变换我找不到这些函数,不知道怎么回事
  2. [数据准备]数据框 DataFrame
    Introduction · DataFrames.jl
  3. [数据探索] Plots
    Home · Plots

任务列表

  1. DataFrame
  2. 数据清洗
  3. 数据变换
  4. 数据探索(Plots)
  5. 数据分析

一起学习

私信我,带你加入我的组织,然后到这个仓库里克隆一份,创建自己的新文档,名字
[任务名称]@yourname,example : [数据分析]@nesteiner

总结方式

可以用Readme或思维导图的形式写到自己的文件夹里,思维导图可以用xmind文件,图片或其他


分享
如果你和我一样没钱,我在Pandownload没封之前,就把这个课程下好了
链接: 百度网盘 请输入提取码 提取码: e3cz


再补充一点

建议周一到周五学习,周六总结,周日预习下次课程

3 个赞

期末考劝退,看看期末考完有没有时间帮楼主

Queryserve 官网有提到作者做的演讲视频,可以看看。

Youtube的Julialang官方频道也有一些DataFrames.jl的内容

看不懂英文 :rofl:

才刚学Julia一段时间,适合加入吗

欢迎啊,我是打算每个人先确定每个人要学习的环节,然后每个人学完汇报,最后我把我们的学习成果公布出来
@heniancheng 你想选哪个来学

我可以选数据探索(Plots)的部分学,看怎么统一学习总结的文档模板?@nesteiner

我觉得思维导图 + 代码案例吧,大概这样(学matplotlib时总结的)


ps: 重点就放在画图吧,动画可以先不用管
你打算什么时候开始,至少学个两周吧 :yum:

思维导图用起来挺不错,但好像放到论坛上分享不太方便?
代码案例可以脱管到github仓库吧?@nesteiner

https://github.com/nesteiner/data-anlaysis.git
平时用到git的时候不多,要是有人发了一个Pull Request我也不知道该怎么办
你自己在这个仓库见一个属于你的文件吧,大概这样 [数据探索Plots]@yourname

换一下,到这里好了

github帐号给我,我邀请你

grouping 和sorting都很慢。用它的话要小心。

还是建一个Q群沟通起来比较方便吧,相关细节要很多的。DataFrame正好最近我要用,如果没有做这块的话,我先做这块的翻译总结吧

DataFrame的学习你来吧,记得总结,总结的越简洁越好
我也有建群的想法,要不去discord里建一个好了,记得挂代理
邀请 Discord

这个挂代理要拒绝很多人了吧。。我把github帐号私信你

请问这两个具体由Queryverse哪个包提供,我才开始研究Queryverse。

julia数据处理能力还需要完善,比如一个最常见的数组字符串处理,用python可以df.columns.str然后进行split、replace、astype(转换数据类型)、count等等,但是Julia没有在一个pkg里提供统一的数据处理的api,所以处理起来很麻烦。其次,Julia没有提供统一的读取文件,并转化为dataframe的包,CSV和XLSX太分散了,而且并不好用,不如pandas强大的文件读取功能。再次,对于机器学习领域来说,Julia目前提供的api,对数据进行处理的api依旧太少,很多功能需要自己去写,效率较为低下
当然,相信随着更多开发者的加入,julia的生态后续会越来越好

其实这个现象跟R初期真的很像,那个时候没有成熟文档的包,都是东一榔头西一棒子,后来有了tidyverse,但是我感觉没有pandas直观,一个统一的强大的包真的是对语言的发展很重要,一堆人开发重复的包,不如组队开发强一点的包

你好!
我也想学习数据分析,请大师们带带我,谢谢!

都好几年前的事了,结束了诶