最近在技客时间这个课程里学数据分析快一个月了,课程是不错,蛋疼的是pd.dataframe操作起来我都懵了啊,于是我有了一个想法,模仿课程的代码,用Julia写一遍。
但是你们知道Julia文档比较少,没多少是中文的,我想看看有没有组队一起学习的,大纲我都搞好了
现在就缺队友了,我把文档贴一下,以后就从这些文档里我们每个人分配好任务学习,到一定时间汇报吧
文档
- [数据分析]机器学习框架 MLJ
https://alan-turing-institute.github.io/DataScienceTutorials.jl/
Home · MLJ
这个数据变换我找不到这些函数,不知道怎么回事
- [数据准备]数据框 DataFrame
Introduction · DataFrames.jl
- [数据探索] Plots
Home · Plots
任务列表
- DataFrame
- 数据清洗
- 数据变换
- 数据探索(Plots)
- 数据分析
一起学习
私信我,带你加入我的组织,然后到这个仓库里克隆一份,创建自己的新文档,名字
[任务名称]@yourname,example : [数据分析]@nesteiner
总结方式
可以用Readme或思维导图的形式写到自己的文件夹里,思维导图可以用xmind文件,图片或其他
分享
如果你和我一样没钱,我在Pandownload没封之前,就把这个课程下好了
链接: 百度网盘 请输入提取码 提取码: e3cz
再补充一点
建议周一到周五学习,周六总结,周日预习下次课程
3 个赞
Queryserve 官网有提到作者做的演讲视频,可以看看。
Youtube的Julialang官方频道也有一些DataFrames.jl的内容
欢迎啊,我是打算每个人先确定每个人要学习的环节,然后每个人学完汇报,最后我把我们的学习成果公布出来
@heniancheng 你想选哪个来学
我可以选数据探索(Plots)的部分学,看怎么统一学习总结的文档模板?@nesteiner
我觉得思维导图 + 代码案例吧,大概这样(学matplotlib时总结的)
ps: 重点就放在画图吧,动画可以先不用管
你打算什么时候开始,至少学个两周吧 
思维导图用起来挺不错,但好像放到论坛上分享不太方便?
代码案例可以脱管到github仓库吧?@nesteiner
https://github.com/nesteiner/data-anlaysis.git
平时用到git的时候不多,要是有人发了一个Pull Request我也不知道该怎么办
你自己在这个仓库见一个属于你的文件吧,大概这样 [数据探索Plots]@yourname
grouping 和sorting都很慢。用它的话要小心。
还是建一个Q群沟通起来比较方便吧,相关细节要很多的。DataFrame正好最近我要用,如果没有做这块的话,我先做这块的翻译总结吧
DataFrame的学习你来吧,记得总结,总结的越简洁越好
我也有建群的想法,要不去discord里建一个好了,记得挂代理
邀请 Discord
这个挂代理要拒绝很多人了吧。。我把github帐号私信你
请问这两个具体由Queryverse哪个包提供,我才开始研究Queryverse。
julia数据处理能力还需要完善,比如一个最常见的数组字符串处理,用python可以df.columns.str然后进行split、replace、astype(转换数据类型)、count等等,但是Julia没有在一个pkg里提供统一的数据处理的api,所以处理起来很麻烦。其次,Julia没有提供统一的读取文件,并转化为dataframe的包,CSV和XLSX太分散了,而且并不好用,不如pandas强大的文件读取功能。再次,对于机器学习领域来说,Julia目前提供的api,对数据进行处理的api依旧太少,很多功能需要自己去写,效率较为低下
当然,相信随着更多开发者的加入,julia的生态后续会越来越好
其实这个现象跟R初期真的很像,那个时候没有成熟文档的包,都是东一榔头西一棒子,后来有了tidyverse,但是我感觉没有pandas直观,一个统一的强大的包真的是对语言的发展很重要,一堆人开发重复的包,不如组队开发强一点的包
你好!
我也想学习数据分析,请大师们带带我,谢谢!