首页 > Weka 开发[1]-Instances类

Weka 开发[1]-Instances类

      先google一下,把Weka软件下载下来,安装完成之后,在Weka的安装目录中有一个weka.jar的包。

       把包添加到工程中后,就可以调用weka中的函数了。

       再介绍一点weka的基本知识,在weka的目录下,有一个data的文件夹,里面存放的是一些数据集,以第一个数据集contact-lenses.arff为例,用EditPlus或是别的编辑器打开数据集,以%开头的表示的是一些注释,@relation表示这个数据集的名字,@attribute表示属性的属性,@data后就是数据集了,一般来说最后一列是类别(在LibSVM中第一列是类别)。

       下面我写了一个微不足道的一个weka的入门代码:

package instanceTest;

 

import java.io.FileReader;

import weka.core.Instances;

 

public class InstanceTest

{

    public static Instances getFileInstances( String fileName ) throwsException

    {

        FileReader frData = new FileReader( fileName );

          Instances data = new Instances( frData );

        

          return data;

    }

   

    public static void main(String[] args) throws Exception

    {

Instances instances = getFileInstances"F://Program Files//Weka-3-4//data//contact-lenses.arff");

       

        //把数据集全部输入出

        //System.out.println( instances );

       

        //用numInstances可以获得数据集中有多少样本

        forint i = 0; i < instances.numInstances(); i++ )

        {

            //instance( i )是得到第i个样本

            System.out.println( instances.instance( i ) );

        }

    }

}

转载于:https://www.cnblogs.com/94julia/p/4617888.html

更多相关:

  • 本文是西门子开放式TCP通信的第2篇,上一篇我们讲了使用西门子1200PLC作为TCP服务器的程序编写,可以点击下方链接阅读:【公众号dotNet工控上位机:thinger_swj】基于Socket访问西门子PLC系列教程(一)在完成上述步骤后,接下来就是编写上位机软件与PLC之间进行通信。上位机UI界面设计如下图所示:从上图可以看出...

  • 我有一个大型数据集,列出了在全国不同地区销售的竞争对手产品。我希望通过使用这些新数据帧名称中的列值的迭代过程,根据区域将该数据帧分成几个其他区域,以便我可以分别处理每个数据帧-例如根据价格对每个地区的信息进行排序,以了解每个地区的市场情况。我给出了以下数据的简化版本:Competitor Region ProductA Product...

  • 作为一名IT从业者,我来回答一下这个问题。首先,对于具有Java编程基础的人来说,学习Python的初期并不会遇到太大的障碍,但是要结合自己的发展规划来制定学习规划,尤其要重视学习方向的选择。Java与Python都是比较典型的全场景编程语言,相比于Java语言来说,当前Python语言在大数据、人工智能领域的应用更为广泛一些,而且大...

  • 这段时间通过学习相关的知识,最大的变化就是看待事物更加喜欢去了解事物后面的本质,碰到问题后解决问题思路也发生了改变。举个具体的例子,我在学习数据分析,将来会考虑从事这方面的工作,需要掌握的相关专业知识这个问题暂且按下不表,那哪些具体的问题是我需要了解的呢,以下简单罗列:1、了解数据分析师这个岗位在各个地区的需求情况?2、数据分析师的薪...

  • 这一节将开始学习python的一个核心数据分析支持库---pandas,它是python数据分析实践与实战的必备高级工具。对于使用 Python 进行数据分析来说,pandas 几乎是无人不知,无人不晓的。今天,我们就来认识认识数据分析界鼎鼎大名的 pandas。目录一. pandas主要数据结构 SeriesDataFrame二...

  • 发信人: finallyliuyu (领头驴), 信区: NLP标  题: 求weka JVM outofMemory问题的解决方案发信站: 水木社区 (Sun Feb 20 10:36:12 2011), 站内正在用weka做文本分类的实验(主要侧重点在于衡量特征词选择算法的优劣)。语料库: Reteurs21578featurew...