LI ”模块提供的命令行功能。由于 weka 暂不支持中文输入,所以挑选了在 D 盘下进行转换,在新窗口的最下方(上方是不能写字的)输入框写上数据挖掘-WAKA 实验报告 9 java weka.core.converters.CSVLoader D:/Fund - data.csv > D:/Fund - data.csv.arff 即可完成转换,生成文件“ D:/Fund - data.csv.arff ”。见下图 5: 图5 进入“ Exploer ”模块, 从上方的按钮中打开 CSV 文件然后另存为 ARF F 文件亦可。我们应该注意到,“ Exploer ”还提供了很多功能, 实际上可以说这是 WEKA 使用最多的模块。现在我们先来熟悉它的界面, 然后利用它对数据进行预处理。界面展现见下图 6: 图中显示的是使用“ Exploer ”打开“ Fund - data.csv. csv ”的情况。数据挖掘-WAKA 实验报告 10 图6 2 、预处理通常对于 WEKA 来说并不支持中文, 所以我们将一些涉及中文的字段删除。勾选属性“ fund_name ”、“ company ”、“ business_name ”、“ remark ”, 并点击“ Remove ”。将新的数据集保存一次。其中“ fares_type ”只有 2 个取值: 全额结算和净额结算。这时我们在 UltraEdit 中直接修改 ARFF 文件,把@attribute fares_type { 全额结算,净额结算} 改为@attribute fares_type { Full , Net } @attribute date { numeric } 改为@attribut date {2009/8/24,2009/8/25,2009/8/26,2009/8/27,2009/8/28 } 就可以了。