GLM包作为Julia生态系统数据科学中的一员,貌似现在还远远不能达到诸如流行统计软件SAS、STATA和R等功能。除了GLM包,Julia数据科学中还有其他类似的包能实现这个目的吗?
TimeSeries.jl, HypothesisTests.jl, Stan.jl 都是很好用的包。
中短期内很难达到R的高度,北美和澳洲的统计系的default language是R,一般在统计学上有新的理论突破第一时间会在R上作出包应用。Julia写包比较容易,R的包大部分都是用C++写好再用Rcpp连接。一般Julia的包普通用户都能写和贡献,R的比较常见的包都是比较少的部分大佬在写。这种区别很难说那个更好,至于语言特性,R确实要比Julia差一些,不过R的data science应该是市面上最好的,Hadley Wickham一个人顶半边天,吊打pandas和linq。
至于sas和stata我本人都在多年前用过,我想说的是二十一世纪是属于开源的时代。闭源的商业软件的结局要么是性能问题要么是越来越臃肿而且跟不上时代。很多时候之所以像sas这种不便宜又不好用的东西还有市场,都是历史原因,以及出了问题可以让sas公司顶包。
1 个赞
非常感谢坛主的回复,本人也非常认可您对于语言及其应用软件的见解。正如您介绍的,Julia非常容易实现各种功能包,哪怕各领域的普通用户也能实现。那么,哪里可以找到 “如何利用Julia写功能包?” 的介绍。或者是否有相关的培训活动?这样可以增加社群的贡献者,从而大大丰富各种应用包,谢谢!
如何写Julia包可以再开一个帖子问哈,这个问题很好!
你可以先看一个比较简单的包,我推荐financial toolbox.jl