datamining 需要了解的十个知识

IMG_1751

1

DataMining和统计分析有什么不同?

硬要去区分DataMining和Statistics的差异其实是没有太大意义的。一般将之定义为DataMining技术的CART、CHAID或模糊计算等等理论方法,也都是由统计学者根据统计理论所发展衍生,换另一个角度看,Data Mining有相当大的比重是由高等统计学中的多变量分析所支撑。但是为什么Data Mining的出现会引发各领域的广泛注意呢?主要原因在相较于传统统计分析而言,Data Mining有下列几项特性:

处理大量实际数据更强势,且无须太专业的统计背景去使用Data Mining的工具;
阅读全部内容

数据可视化的工具

摘至《大数据时代下的统计学》

1. 入门工具 :人生若只如初见.

excel:如邻家小妹一样清新,亲切的入门工具.普及率高,但图形样式有限,非专业水平.

2. 在线工具:众里寻她千百度.

  • google chart api:只提供动态图表,功能完备,并且Google风格浓郁.
  • Flot:线框图表库,支持几乎所有主流浏览器.
  • Raphael:创建图表和图形的JavaScript库,可生成矢量格式,分辨率好.
  • D3:能够提供大量线性图和条形图之外的复杂样式.效果花俏,应当注意保持简约.

阅读全部内容