创建或修改目录:/www/wwwroot/104.219.215.234/data 失败!
四色播播 Weka中数据挖掘与机器学习系列之Weka系统装置(四) - 抖阴视频

AV色情

你的位置:抖阴视频 > AV色情 >

四色播播 Weka中数据挖掘与机器学习系列之Weka系统装置(四)

发布日期:2024-11-01 12:12    点击次数:172

擦玻璃 裸舞

 四色播播四色播播

 

 

  能来看我这篇博客的一又友,想必全球都知说念,Weka采纳Java编写的,因此,具有Java“一次编译,到处运行”的脾气。维持的操作系统有Windows x86、Windows x64、Mac OS X、Linux等。这里未几赘述。

 

 Weka系统装置一共分为:

 

1、装置Weka所需系统条目

  下表,列举了运行Weka的特定版块对Java版块的条目。

 

 

Java

1.4

1.5

1.6

Weka

<3.4.0

X

X

X

3.4.x

X

X

X

3.5.x

3.5.0~3.5.2

>3.5.2

r2892, 20/02/2006

X

3.6.x

 

X

X

3.7.x

 

3.7.0

>3.7.0

r5678, 25/06/2009

                             表 Weka各版块对Java版块的条目

 

  表上有两处还注明了因版块变更对Java版块条目的变化,采纳前缀r加数字示意Subversion改良版块,比肩出变更时刻。

  Linux/Gnome系统中,使用Java 5.0及以上版块会碰到界面的缺省外不雅浮现问题。Mac OS X用户使用Weka 3.6.5/3.7.4版块需要装置Java for Mac OS X 10.6 Update 3及以上版块。

 

 

 

 

  怎样下载Weka的历史版块

  ~ml/weka/

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2、Weka装置经过

  我这里,以Weka Weka 3.6在Windows 7旗舰版上的下载及装置经过。

  1. Weka的下载

  天然从SourceForge.net网站也不错下载,但从Weka官网下载会更为便捷,更为热切的是Weka官网还有好多干系资源,供下载的软件版块也更为王人全。在浏览器地址栏中输入“~ml/weka/”,并按Enter键,在主页的导航栏单击Download超集会,字据我方的谋略机所装置的操作系统遴荐下载文献。

 

  要细心的是,Weka主要版块有三种:

  (1)第一种称为Snapshots(快照版块),是开荒经过中构建的版块,并不是郑再版,这是为想要最新的失实修正版的用户确立的;

  (2)第二种称为Stable book 3rd ed. version(第3版书的踏实版块),是Ian Witten的第3版著述对应的Weka完毕的踏实版块,版块为3.6.x;

  (3)第三种称为Developer version(开荒者版块),目下版块为3.7.x,这是Weka的骨干版块,是踏实3.6版块代码的延续,进行了失实建造并新增了一些新功能,因此,它是学习和商讨Weka的设想版块,本系列博客亦然基于这个版块。

  由于博主我使用的操作系统为Windows 7旗舰版,况兼一经装置过Java 7,因此,遴荐下载weka-3-8-1-x64.exe; 50.6 MB,如下图所示。

   若是本机莫得装置java,不错遴荐带有jre的版块。

 

 

 

   提议,全球用迅雷进行下载。

 

 

   这里。全球不错去遴荐最新的版块。

 -3-9-1-x64.exe

 

   

  我这里,就用(因为,我腹地windows7下,一经装置好了jdk1.7了)

第一步:双击它

 

第二步:最初出现的是迎接界面,如下如所示,单击Next装置干预下一步,即可。

 

 

 第三步:随后出现的是GNU GPL契约,必须高兴才能进行装置。单击I Agree按钮。

 

 

 第四步:下一步是遴荐装置组件。选项有Full 、Minimal和custom三项,默许为Full,由于王人备装置也不占多大空间,遴荐默许的Full选项,因此保握默许选项不动,单击Next按钮,干预下一步。

 

 

 第五步:下一步是遴荐装置旅途,字据我方谋略机的硬盘空间来进行遴荐,我一般心爱专科点,不装置在C盘,而遴荐装置在D:\SoftWare(这是我系数的软件一说念都装置在这里。)

 

 

 

 第六步:接下来即是遴荐开首菜单文献夹称号,这里我是,Weka 3.7.8,莫得畸形条目则无须编削,单击Install按钮来开首装置。

 

 

 

 

 

 

 

  装置得胜!

 

  装置完成后,最佳花上小数时刻来望望我方一经装置好的软件,如下图所示,Weka-3-7目次下有三个子目次。

 

 

changelogs子目次用于存放Weka版块的变更情况,除非想参与到Weka项筹办开荒,或者想知说念Weka的某版块在上一个版块的基础上究竟变更了哪些内容,才需要进行商讨;

 

   data子目次存放自带的23个ARFF文献四肢测试用途的示例数据集。

 

 

 

  doc子目次存放Weka文档,进行二次开荒的期间东说念主员需要仔细阅。

 

 

   细心:装置目次下,还有几个文献全球要值得温存。

 

 

 

    这个WekaManual.pdf,是Weka用户手册,无论生人如故老履历用户。该手册的匡助都会很大。(全球在用的经过中,搭配网上的汉文贵府吧!)

 

 

 

 

 

  weka-src.jar是打包源规范,不错解压出来供深头绪的用户来使用。想必,好多东说念主都跟我一样,刚开首战斗不久,就别去这套了,飞速毕业紧要。

 

 

 

  RunWeka.ini是运行Weka的建立文献。

 

 

  这里,全球可能第一次装置,会弹出一个指示,提议把它内存调大。

  我这里,电脑内存8g,确立为maxheap=3g。

 

 

 

 

 

   装置得胜。

 

 

 

 

 

 

3、Weka软件的使用初步

  全球,Weka装置完成后,在咱们的Windows左下角的开首菜单中,不错找到Weka 3.7.8。底下会有四个菜单,如下图所示。

  

 

 

   

   单击第一个菜单项,即Documentation(参考贵府),不错浏览Weka提供的至极有效的参考贵府,包括Weka 手册、Java包 API文档,还有一些在线资源,如Weka主页、Weka维基、Pentaho的Weka社区文档、以及SourceForge网站下的Weka。如下图所示。

 

  第二个菜单选项是卸载Weka。

 

 

 

  第三个和第四个菜单项均不错启动Weka界面,不同的是第三个选项带有一个终局台输出,而第四个选项是莫得的。非论全球使用哪种形状来启动Weka后,主要浮现界面都为一个称作Weka GUI遴荐器的窗口。如下所示。

 

 

 

 

 

 

 

 

  底下,我给全球先容,Weka使用的MDI(多文档界面)外不雅,让系数绽开的窗口愈加精真金不怕火明了。Weka菜单分为以下四个部分。

1、Program(编排菜单)

  LogWindows(日记窗口)菜单项:绽开一个纪录输出到stdout或stderr内容的日记窗口。在Windows环境下,若是不带终局台输出启动Weka,日记窗口相比有效。

   点击干预,得到

 

 

 

 

 

  Memory usage(内存使用情况)菜单项:绽开一个浮现内存使用情况的窗口,若是用户发现内存占用过大,可单击窗口右边的GC按钮,启动垃圾回收器,如下图所。

 

   Exit(退出)菜单项,关闭Weka。

 

 

 

 

 2、Visualization(可视化)菜单

  Plot(散点图)菜单项:画出数据集的二维散点图。

 

 

  ROC(接管者操作特征)菜单项:浮现事先保存的ROC弧线。

 

 

 

  

  TreeVisualizer(树可视化器具)菜单项:浮现一个有向图,举例,决策树。

 

 

   GraphVisualizer(图可视化器具)菜单项:浮现XML、BIF或DOT样子的图片,举例,贝叶斯网罗。

 

 

 

 

 

 

  

  Boudary Visualizer(领域可视化器具)菜单项:允许在二维空间中对分类器的决策领域进行可视化。

 四色播播

 

 

 

 

 

 3、Tools(器具)菜单

    Package manager(包经管器)菜单项:允许用户遴荐装置感深嗜或需要的软件包。

 

 

 

 

 

 

 

  ArffViewer(ARFF检验器)菜单项:一个MDI欺诈规范,使用电子表格的体式来检验ARFF文献。

 

 

  SqlViewer(SQL检验器)菜单项:通过JDBC查询数据库的简短窗口,维持阿谀数据库,实施SQL语句,并浮现成果。

 

 

 

 

  Bayes net editor(贝叶斯网罗剪辑器)菜单项:一个剪辑、可视化和学习贝叶斯网罗的欺诈规范。

 

 

 

 

 

 4、Help(匡助)菜单

  Weka homepage(Weka主页)菜单项:绽开一个浏览器窗口,浮现Weka主页。

 

 

  HOWTOs,code sinppets , etc. (基本常识、代码段等)菜单项:常用的WekaWiki,含有多数的示例,以及开荒和使用Weka的基本常识(HOWTO)

 

 

 

 

  Weka on Sourceforge(Sourceforge网站的Weka)菜单项:Weka状貌在Sourceforge.net网站上上的主页。

 

 

 

   SystemInfp(系统信息)菜单项:列出一些对于Java/Weka的环境信息,如WEKA_HOME、file.encoding等。

 

 

 

 

 

 

Weka系统运行细隐衷项

   1、使用Weka包经管器

  频频术语“包”(package)指的是Java通过包来组织Java类。自Weka3.7.2开首,Weka引入包的宗旨,它将特等功能从weka.jar文献等分离,以软件包的体式单独提供。Weka。Weka包由各式jar文献、文档、元数据,以及可能的源代码组成。从版块3.7.2幵始,早期版块Weka中的许多学习算法和器具就成为单独的包。这样作念的最大平正即是简化了 Weka的中枢系统,允许用户遴荐装置我方需要或者感深嗜的软件包。它还提供了一种简 单机制,用户大要实时使用到Weka喜爱者提供的新功能。Weka不错使用好多包,这些 包以某种形状添加学习决策,或彭胀中枢系统的功能,好多包都由Weka团队和第三方提供。

  Weka自带软件包的经管机制,能在运行时动态加载包。软件包经管器分为高歌行和 图形用户界面两种,底下别离赐与说明。  假设wekajar文献在classpath旅途中,使用如下高歌即可访谒包经管器:

  运行成果如下图所示。详备的高歌行包经管器的使用将在我写的后续博客里敷陈。

  这里图,暂时不祥。

 

  不错看到,除非是规范员,使用高歌行包经管器至极缺乏,条目输入多少高歌行选项。因此,平常东说念主员如故使用图形化用户界面进行包经管较为直不雅便捷。  最初启动GUI Chooser窗口,在Tools菜单下,遴荐Package manager菜单项,或者按 Ctrl+U快捷键,则弹出如下图所示的包经管器窗口。在高歌行包经管系统的一说念功能都不错在GUI版块中使用,GUI版块还大要一键装置和卸载多个包。

 

                                包经管器窗口

     

 

 

  包经管器窗口沿水平主张分为上、下两部分:顶部是一个软件包的列表,底部是一个微型的浏览器,用于浮现现时遴荐的包信息。

 

 

  包列表浮现了包的称号(Package)、类别(Category)、如己装置则浮现目下装置的版块 (Installed version)、存储库中可用的最新版块(Repository version),以及包是否己经加载 (Loaded)。不错通过单击此列表相应的列标题,按照包称号或类别进行排序。第二次单击疏导标题会回转成列方法。在窗口左上角,有三个单选按钮不错用来过滤列表中浮现的内容,默许选中单选按钮All(系数软件包),甲.选按钮Avaiiable用于浮现系数可用的尚未安 装软件包,单选按钮Installed用于浮现已装置的软件包。

 

 

 

  若是某一种软件包有多个版块可用,不错遴荐对应的Repository version列来中式版块。

 

 

 

  窗口顶部有三个按钮,别离为Refresh repository cache(刷新库缓存)、Install(装置)和 Uninstall(卸载)。第一个按钮用于刷新包信总库中的元数据的缓存副本。细心到第一次使用规范包经管器,无论是GUI如故高歌行,都会出现顷然的延长,这是因为第一次要建立运转缓存。另外两个按钮别离用于装置和卸戟包,不错一次装置或删除多个包,不错使用 “Shift键+鼠标单击”组合遴荐领域,也不错使用“Ctrl键+申击”轮番添加到遴荐集合中。在装置和卸载按钮的底下,有一个Ignore dependencies/conflicts(忽略依赖关系和突破) 复选框,选中该复选框不错忽略所选杼软件包的依赖关系和可能发生的任何突破。若是在装置软件包时选中该复选框,将无法装置存在依赖关系的软件包。

 

 

 

 

 

下而以wavelet(小波)预处理包的装置和卸戟为实例进行说明。

  最初装置。选中All单选按钮,浮现一说念包,选中wavelet包,如下图所示。

 

 

  然后,单击Install按钮进行装置。这时,Weka会弹出一个窗口请用户证明,单击 “是(Y)”按钮证明我方的操作,在窗n右上角浮现装置进程,经过一小段时刻后,所选中的wavelet包对应的Loaded列也会浮现Yes字样,说明装置完成。

 

 

 

  当今卸载wavelet包。选中Installed单选按钮,浮现己装置的包,选中wavelet包,这 时,Uninstall按钮从不可用变为可用,如下图所示。

   这里未几赘述。

 

 

 

 

  2、确立CLASSPATH 和 PATH

  CLASSPATH环境变景见知Java应该在什么场合去查找Java类。因为Java老是按照—定方法去查找CLASSPATH环境变景里的类旅途,因此,用户应该致密商酌将何种旅途放到CLASSPATH的什么位置。  底下以Windows操作系统下添加MySQL驱动规范mysql-connector-java-5.1.21.jar为例进行说明。唯有将该jar文献添加到CLASSPATH环境变量中,Weka才能通过JDBC访谒MySQL数据库。

  比如,我这里,就放到Weka的装置目次下,新建一个lib。

 

 

 

 

  JAVA_HOME%\jre\lib\ext下,也要放弃

 

 

 

 

 

 

确立Weka所需的环境变量

        此处环境变量的建立和JDK一样,最初新建WEKA_HOME=D:\SoftWare\Weka-3-7

 

  

  CLASSPATH: %WEKA_HOME%\lib\mysql-connector-java-5.1.37-bin.jar

 

 

修改Path,在path的最前边加上

        %WEKA_HOME%\lib\mysql-connector-java-5.1.21-bin.jar;%JAVA_HOME%\jre\lib\ext\mysql-connector-java-5.1.21-bin.jar;

 

 

 

 

 

 

 

 

  在Windows终局面板下,切换至“高档”标签页,然后査找到一个浮现“环境变量”的按钮,单击该按钮,出现标题栏为“环境变量”的窗口。字据谋略机是仅供一东说念主使用如故多东说念主使用,不错遴荐将环境变量设罝为用户变最如故系统变量。若是不知说念该确立为哪一种变量,提议确立为用户变量若是一经存在CLASSPATH环境变量,则进行剪辑,不然,单击“新建”按钮进行新建。  说白了,这里很简短。未几说了。  3、使用UTF-8数据集或文献

  Java原来就维持UTF-8字符集,因此Weka应该大要处理UTF-8字符集的数据集或文 件,只消遴荐合适的字符集就不错。在Windows下,Weka默许使用另一种字符集———— Cpl252,不错通过以下形状将文献编码(file encoding)改为“utf-8”,从头启动就能维持汉字。

  若是径直在高歌行下运行Weka,只消在高歌行添加如下参数就行:

  若是在“开首”菜单下启动Weka,那么就需要修改RunWEKA.ini文献,身手如下。

   身手1、在Weka装置目次下,找到RunWEKA.ini文献,用轻易文本剪辑器绽开该文献。(提议用Notepad++)

 

 

 

 

  身手2、在第32行隔壁,找到“fileEncoding=Cpl252”的行,将“Cpl252”改为 “utf-8”,细心不要有引号;若是莫得找到这一转,那么,找到系数的java/javaw高歌, 在这些高歌行中添加“-Dfile.encoding=utf-8”参数。

 

 

 

 

  4、常见运行失实

  1)OutOfMemoryException(内存不及例外)大多数Java编造机只分派一定数额的最大内存来运行Java规范,频频远低于谋略机 中的内存大小。可是,不错通过确立顺应的选项,彭胀编造内存。举例,不错用高歌:

  确立最大Java堆的大小为512MB。还不错使用Xmx2g将其确立为2GB,这样就弥漫 使用。天然,这还要看谋略机的建立,确立过大的内存会影响运行性能6  2) StackOverflowError(栈溢出失实)  这是由r设賈的堆栈过小形成的失实。尝试增多编造机的堆栈,不错使用底下的高歌 来增多堆栈空间:

  该高歌设罝Java的最大堆栈大小为512KB,若是如故不够,请冷静增多。  3) training and test set are not compatible(考验集和测试集不兼容)  Weka假设考验集和测试集的结构应该王人备一致,这意味若考验集和测试集的属性不 但在数目上疏导,而且在类型上也应该王人备一样。对于标称属性,必须确保标签的数目和煦序是王人备一致。  使用己经考验好的分类器进行权衡,不需要包括任何分类属性的信息。出于速率的原因,Weka子虚施任何关系数据集会构的检验,既莫得将属性称号从考验空间映射到测试 空间,也莫得映射标签。在里面,数据集的申-行示意为一个double型数组。对于数值属 性,这并不组成问题,但对于其他类型的属性,如标称属性,double值示意可用标签列表的索引。标签的不同方法会导致不同的标签却釆用疏导的索引示意,这样,权衡就不可靠。  措置办法是使用批量过滤(Batch filtering)。若是第二个数据集(频频为测试集)需要与第 一个数据集(频频为考验集)处理为具有疏导的统计数据,那么就使用批量过滤。  举例,使用Standardize过滤器别离对两个数据集实施模范化操作,确定会创建两个不 同的模范化输出文献,因为若是数据集不同,输入数据就不同,导致均值和模范偏差也就 不同。StringToWordVector也相似会产生这个问题,因为在考验集和测试荟萃单词出现的 次数不同,导致单词辞书也相应改变,输出两个互不兼容的文献。  为了创建兼容的考验集和测试集,有必要使用批量过滤。启用批量过滤,必须提供额 外的高歌行参数-b。此外,第一个输入/输出对(-i/-o)运回荡过滤器的统计数据,第二个输 入/输出对(-r/-s)字据这些统计数据进行处理。  举例,如下的Java调用启用批量过滤:

   细心:上述高歌,是适用于Linux/UNIX的bash,反斜杠示意续行。若是采纳Windows或SimpleCLI,需要去掉反斜杠标识,并在一转内写全高歌。

 

 

 

Weka访谒数据库(本系列博客只作念访谒MySQL)

  天然Weka数据集默许不错保存在ARFF样子的文献中,但好多数据挖掘欺诈都可能条目径直访谒数据库,对数据库表的纪录进行挖掘,尤其是在数据集至极大的情况下。Weka使用JDBC访谒数据库。

1、建立文献  最初作念三项准备责任:第一,若是Wcka正在运行中,铭刻先关闭Weka:第二,下载 数据库驱动。Weka维持大部分常用数据库,本系列博客采纳的数据库是MySQL 5.5.15,使用的 JDBC 驱动是 com.mysql.jdbc.Driver,因此本博客下载 mysql-connector-java-5.1.6.jar 驱动文 件,并确立CLASSPATH环境变量 指向该驱动,这使得Weka能找到JDBC驱动,这里未几说了;第三,启动数据库运行,确保己经建立称号为weka的数据库,为该库建立称号为APP的用户,密码自定,并为APP用户赋予查询权限。  要正常访谒数据库,字据谋略机的内容情况正确修改建立文献是关节。Weka的配罝 文献称号为 DatabaseUtils.props,位于 weka.experiment 包中。不错从 weka.jar 或 weka- src.jar存档文献获得该配.胃.文献。具体作念法是,使用解压缩器具(博主我推选全球用360解压缩器具)将存档文献解幵。我的这个系列博客是径直在此基础上进行修改哈。

  为了便捷用户,Weka对常用数据库都提供对应建立文献,茌对应建立文献上进行修改要便捷得多。举例:  (1) DatabaseUtils.props.hsql:适用 HSQLDB 数据库;  (2) DatabaseUtils.props.msaccess:适用 MS Access 数据挥:  (3) DatabaseUtils.props.mssqlserver:适用 MS SQL Server 2000 数据库;  (4) DatabaseDtils.props.mssqlserver2005:适用 MS SQL Server 2005 数据痒:  (5) DatabaseUtils.props.mysqi:适用 MySQL 数据库;(目下我一般用到这就好了,可是全球最佳这个别动,径直去修改DatabaseUtils.props,将它实在立改为mysql所需。)(具体见底下)  (6) DatabaseUtils.props.odbc:适用 ODBC/JDBC 桥阿谀的数据库;  (7) DatabaseUtils.props.oracle:适用 Oracle 10g 数据库:  (8) DatabaseUtils.props.postgresql:适用 PostgreSQL 7.4 数据库:  (9) DatabaseUtils.props.sqlite3:适用 sqlite 3.x 数据库。

  细心:Weka只会去寻找称号为DatabaseUtils.props的建立文献,若是用户想以其余建立文献中的一个(如DatabaseUtils.props.mysql)四肢模板,在此基础上进行修改,一定记着要先更名。

 

 

  再在 weka/experiment子目次不错找到DatabaseUtils.props建立文献。本系列博客径直在该建立文献的基础上进行修改。

  

 

 

 

   那么好,何如一个修改法呢?对DatabaseUtils.props建立文献,字据我方的需求情况(这个场合很热切!)

 

 

 

 

   因为,我这个系列博客用的是,MySQL,是以,

 

   细心:若是你们,我方还有其他的不同数据库的话,或者说,有使用不同的端标语的话,则,那么全球字据我方的实情去作念取确立好这两处场合就好了。

 

 

  

 

 

  咱们在完成DatabaseUtils.props文献实在立后,必须要将它放在如下三个固定位置之一,Weka才能找到。(全球按照我前边身手来的话,不错径直跳过这一步了)  (1)现时目次。径直放在Weka 3.7的装置目次中;(因为,我是径直在装置目次下进行修改的。)  (2)用户目次中。若是使用Windows的用户不知说念我方的用户目次,不错在高歌行输入如下高歌:

  就不错得到用户目次的旅途。Weka 3.7.2以下的版块径直将建立文献放在用户目次中,而Weka 3.7.2以上(我的是属于这个)的版块则需要将建立文献放在用户目次下的wekafiles/ props子目次中;  (3)类旅途中。频频是weka.jar文献。  细心,Weka亦然按上述方法去查找建立文献的,找到后就不再进行查找。因此前边位置优先于背面位置。

 

 

 

 

 

 

  这里,给全球擢升下,如安在windows下载装置mysql,其实这个很简短。

数据库详细、mysql-5.7.11-winx64.zip 的下载、装置、建立和使用(windows里装置)图文详解  (这个我用的是3306端口) MySQL Server类型之MySQL客户端器具的下载、装置和使用 (这个,我为了幸免就确立为3309)

 

 

  全球也不错学我这样,用的时候,切换旅途就好

 

 

 

 

 

 或者

 

 

 

 

 

 

 

   创建好weka用户之后,然后,咱们再来创建weka数据库。

 

  因为我这里,是用的是3309装置的阿谁Mysql。而且,我之前是创建好了weka用户针对localhost嘛。

MySQL Server类型之MySQL客户端器具的下载、装置和使用 (这个,我为了幸免就确立为3309)

 

 

 

 

 

 

 

 

 

 

   或者,全球也不错用

数据库详细、mysql-5.7.11-winx64.zip 的下载、装置、建立和使用(windows里装置)图文详解  (这个我用的是3306端口)

  铭刻把,系统环境变量改下就好(这样就得胜的完毕了。在windows下多个mysql客户端切换。)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  因为,这是对于采纳图形化形状装置的MySQL,不错径直通过Windows的“开首”菜单  --> “终局面板” --> "经管器具" --> “就业”菜单。

来启动和关闭MySQL5和MySQL。

  全球在这里别想路繁密,我正因为这样写,是挑升让全球,去学会玩多个windows下的mysql客户端,同期,自行去修改端口,这是大牛必备的抗搅扰和整理能力。

 

 

 

  说明:在

数据库详细、mysql-5.7.11-winx64.zip 的下载、装置、建立和使用(windows里装置)图文详解  (这个我用的是3306端口) MySQL Server类型之MySQL客户端器具的下载、装置和使用 (这个,我为了幸免就确立为3309)

 

  当今,我想调换即,变成

数据库详细、mysql-5.7.11-winx64.zip 的下载、装置、建立和使用(windows里装置)图文详解  (3309端口) MySQL Server类型之MySQL客户端器具的下载、装置和使用 (3306端口)

  该怎样去作念呢?

 

 

 

 

 

 

 

 

 

 

 

 

 

   好啦,当今,我一经改回归了。(后续博客都是用的这个)

数据库详细、mysql-5.7.11-winx64.zip 的下载、装置、建立和使用(windows里装置)图文详解  (3309端口) MySQL Server类型之MySQL客户端器具的下载、装置和使用 (3306端口)

 

 

 

 

 

 

 

   对于创建数据库啊,全球不错在这个可视化界面来创建。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 2、Weka访谒数据库(本系列博客只作念访谒MySQL)

   从头启动Weka,在Weka GUI遴荐器中,单击右边的第一个装置Explorer,启动探索者,单击探索者的第三个按钮Open DB,弹出如下所示

 

   因为,咱们之前,在DatabaseUtils.props建立文献修改好了访谒MySQL数据库模式,不错看到,一经变成了之前修改的jdbcURL的值。说明得胜了

 

   继续,单击 按钮,确立数据库阿谀参数,如下图所示。字据我方谋略机的内容建立哈。输入数据库用户名和密码。单击Ok完成确立。

 

 

   然后,单击按钮,进行阿谀数据库,若是全球前边实在立没错的话,则这一步一定会得胜,全球不错在SQL检验器窗口的下部出现数据库一经阿谀的指示。如下图所示。

 

 

 

 

Weka中数据挖掘与机器学习系列之数据样子ARFF和CSV文献样子之间的编削(五)

 

Weka里怎样将arff文献或csv文献批量导入MySQL数据库(六)

 

   

  当今,需要从数据库中查询数据了,因为,我之前一经将iris数据集导入到称号为iris的数据库表中了,因此,当今,实施如下。

 

 

   得到,查询后的成果,如下所示

  恭喜你,从数据库中得胜查询到数据了。

     

 

 

 

 

 

 

常见问题过火措置办法

  若是全球莫得阿谀上数据库,不要慌张。按如下方法轮番检验可能产生问题实在立: 数据库驱动规范是否正确? CLASSPATH实在立是否正确?建立文献中jdbcDriver和 jdbcURL两项配贾是否正确拼写?建立文献是否放到正确位置?数据库用户名和密码是否 正确?该数据库用户是否领有弥漫权限?数据库是否己经启动?等等。  由于Weka仅维持五种数据类型的属性:标称型(nominal)、数字型(numeric)、字符串 (string)、日历型(date)和关系型(relational),而数据库(比如MySQL)种类郁勃,维持的字段类型也不长入。因此,下表仅列出Weka维持的通过JDBC将数据库字段类型映射到Java数据类型,而不逐个列举所维持的数据库字段类型。

 

 

   偶然候啊,某些数据库(如MySQL可能会出现一些字段类型不可施展为Weka属性类型的情况),那么,在这个时候,就需要将字段类型映射为Weka维持的java类型。举例,JDBC驱动会将MySQL的TEXT类型映射为BOLO类型,需要在建立文献中手工映射关系。

 

 

 

 

 

 

 

 

详解Weka自带的示例数据集

  Weka的data目次下,自带了23个ARFF文献四肢测试用示例数据集,如下所示。

  不错看出,包括了,大部分场景的数据。

  

 

 

  我这里,我要点拿天气问题、鸢尾花、CPU、玻璃数据、好意思国国会投票纪录和乳腺癌数据来。

 1、天气问题

 

 

  weather.nominal.arff里有两个属性是使用具体连气儿性数值。

 

 

 

 

 

   而weather.numeric.arff里,一说念都是使用标称型属性。

 

 

   两个数据集里都是共有5个属性,别离是天气趋势(outlook)、温度(temperature)、湿度(humidity)、起风(windy)和是否允许(play)。

 

 

 

 

 

 

 

   很昭彰,weather.numeric.arff的分析,要难于weather.nominal.arff的分析。

 

 

 

 

 

 

2、鸢尾花

  鸢尾花数据集包括三个类别:Iris Setosa(山鸢尾)、Iris Versicolour(变色鸯尾)和Iris VirginiCa(维吉尼亚鸢尾 ),每个类别各有50个实例。数据集界说了 5个厲性:sepal length(花萼长)、sepal width(花萼宽)、petal length(花瓣长)、petal width(花瓣宽)、class(类别)。终末一个属性一般四肢类别性,其余属性都是数值,单元为cm(厘米)。

  即sepal length(花萼长)、sepal width(花萼宽)、petal length(花瓣长)、petal width(花瓣宽)成为平常属性。

  class(类别)成为类别属性。

 

 

 

   该数据集即是要字据鸢尾花的花萼和花瓣数据,来找出不同类别的花的特色分散情况,揭示出其中秘密的法规性。

 

 

 

 

 

 

 

 

 CPU

  CPU数据集的属性和类别属性都是数值型,考验目次是学习CPU的几个干系属性与其处理能力的关联,总计有209条不同的CPU建立。Weka提供两个数据文献,cpu.arff和cpu.with.vendor.arff,区别在于前者不带CPU厂商信息(vendor),后者的第一个属性即是厂商。

 

 

 

 

 

 

 

 

 

 

 

 

 

  玻璃数据集

  包含七种类型的玻璃数据,通过其折射率和所包含的化学元素进奇迹貌,筹办即是基于这些特征对不同类型的玻璃分类。

 

 

 

 

  玻璃数据荟萃的实例有214个,一说念属性(包含属性和类别属性)都是连气儿值,属性加上类别属性一共是10个。而且是莫得缺失值的。

 

 

 

 

 

 

 

 

  好意思国国会投票纪录

  

   该数据集包括435个实例,每个实例是一个国会议员的信息,其中共有267名民主党,168名共和党。一说念属性都是二元属性,总计有16个属性,外加他们的党派四肢类别属性

 

  

 

 

 

 

   细心:该好意思国国会投票纪录数据集,是带有一些缺失值的,使用'?'来示意的。

 

 

 

 

 

 

 

 

  乳腺癌数据集

 

 

 



创建或修改目录:/www/wwwroot/104.219.215.234/data 失败!
JzEngine Create File False