数据挖掘技术日趋成熟和复杂,随着互联网发展以及大批*数据的到来,之前传统的依靠spss、SAS等可视化工具实现数据挖掘建模已经越来越不能满足日常需求,依据美国对数据科学家(data scientist)的要求,想成为一名真正的数据科学家,编程实现算法以及编程实现建模已经是必要条件;目前很多从事数据挖掘工作的人,大多都是出身非计算机**,本身对编程基础比较低,所以找到一门**上手而又*的编程语言是至关重要的,好的工具和编程语言可以起到事半功倍的效果。 目前在数据挖掘算法方面用的较多的编程语言有:Java、C++、C、Python、R等等。由于小编本身属于数理统计出身,复杂而**的语言对我来说性价比并不高,所以想从头对Java、C++、C开始学起,浪费的时间和精力与收获明显不成正比。所以Python和R语言成了较佳选择。至于Python和R两者如何选择,本人有点粗浅认识: 这两个工具都很方便,不需要非常高深的编程能力,都适合算法开发,有大量的package供你使用。 Python入门简单 而R则相对比较难一些(纯个人感觉,依据每个人之前的经验,可能不同的体验)。 Python几乎都可以做 函数比R多,比R快。它是一门语言,R较像是一种软件,所以python较能开发出flexible的算法。 Python适合处理大量数据 而R则在这方面有很多力不从心,当然这么说的前提是对于编程基础比较一般的童鞋,对于大牛来说,多灵活运用矢量化编程的话,R的速度也不会太差。 R做文本挖掘现在还有点弱 当然它的优点在于函数都给你写好了,你只需要知道参数的形式就行了,有时候即使参数形式不对,R也能“智能地”帮你适应。这种简单的软件适合想要专注于业务的人。 本文转自上海西线学院官/ 高薪等你来拿,就看你敢来挑战报名吗? 全国**电话:400-772-1689 咨询Q
西线学院是国内数据分析师培训教育机构领**牌,致力于互联网数据分析师培训,大数据培训实战型人才孵化与培养,是国内一家互联网数据分析EDA和N+N实训模式的实践者,数据分析师培训*机构。