凸凹人妻人人澡人人添,AV一本无码不卡在线播放,24小时日本高清在线视频观看免费

軟件介紹人氣軟件精品推薦相關(guān)文章網(wǎng)友評(píng)論下載地址
小編為您推薦： orange 數(shù)據(jù)挖掘數(shù)據(jù)處理

orange數(shù)據(jù)挖掘軟件是一款處理數(shù)據(jù)的應(yīng)用，操作起來(lái)非常的簡(jiǎn)單，快速而又多功能的可視化編程，有興趣的朋友歡迎來(lái)IT貓撲網(wǎng)下載體驗(yàn)！還有更多的功能等你來(lái)發(fā)現(xiàn)！

orange軟件介紹

Orange是一個(gè)基于組件的數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)軟件套裝，它的功能即友好，又很強(qiáng)大，快速而又多功能的可視化編程前端，以便瀏覽數(shù)據(jù)分析和可視化，基綁定了Python以進(jìn)行腳本開(kāi)發(fā)。它包含了完整的一系列的組件以進(jìn)行數(shù)據(jù)預(yù)處理，并提供了數(shù)據(jù)帳目，過(guò)渡，建模，模式評(píng)估和勘探的功能。其由C++ 和 Python開(kāi)發(fā)，它的圖形庫(kù)是由跨平臺(tái)的Qt框架開(kāi)發(fā)。

orange數(shù)據(jù)挖掘

orange使用方法

具體操作是用python嗎

你數(shù)據(jù)是存在哪兒的，如果是存在mysql里面的，那可以使用orngMySQL和orngSQL模塊，如下所示 t=orngMySQL.Connect('localhost','root','','test') data=t.query("SELECT * FROM busclass") tree=orngTree.TreeLearner(data) orngTree.printTxt(tree,nodeStr="%V (%1.0N)",leafStr="%V (%1.0N)")

Orange怎么用？

Orange是類似KNIME和Weka KnowledgeFlow的數(shù)據(jù)挖掘工具，它的圖形環(huán)境稱為Orange畫布（OrangeCanvas），用戶可以在畫布上放置分析控件（widget），然后把控件連接起來(lái)即可組成挖掘流程。這里的控件和KNIME中的節(jié)點(diǎn)是類似的概念。每個(gè)控件執(zhí)行特定的功能，但與KNIME中的節(jié)點(diǎn)不同，KNIME節(jié)點(diǎn)的輸入輸出分為兩種類型（模型和數(shù)據(jù)），而Orange的控件間可以傳遞多種不同的信號(hào)，比如learners, classifiers, evaluation results, distance matrices, dendrograms等等。Orange的控件不象KNIME的節(jié)點(diǎn)分得那么細(xì)，也就是說(shuō)要完成同樣的分析挖掘任務(wù)，在Orange里使用的控件數(shù)量可以比KNIME中的節(jié)點(diǎn)數(shù)少一些。

Orange的好處是使用更簡(jiǎn)單一些，但缺點(diǎn)是控制能力要比KNIME弱。

除了界面友好易于使用的優(yōu)點(diǎn)，Orange的強(qiáng)項(xiàng)在于提供了大量可視化方法，可以對(duì)數(shù)據(jù)和模型進(jìn)行多種圖形化展示，并能智能搜索合適的可視化形式，支持對(duì)數(shù)據(jù)的交互式探索。

Orange的弱項(xiàng)在于傳統(tǒng)統(tǒng)計(jì)分析能力不強(qiáng)，不支持統(tǒng)計(jì)檢驗(yàn)，報(bào)表能力也有限。Orange的底層核心也是采用C++編寫，同時(shí)允許用戶使用Python腳本語(yǔ)言來(lái)進(jìn)行擴(kuò)展開(kāi)發(fā)。

持Python的Orange數(shù)據(jù)挖掘軟件實(shí)例：

Orange的特點(diǎn)是界面友好易于使用，提供大量可視化方法，提供Python編程接口，于是決定試用一下。

網(wǎng)上可以搜索到的Orange中文資料不多，這篇《利用orange進(jìn)行關(guān)聯(lián)規(guī)則挖掘》給了一個(gè)通過(guò)Python調(diào)用Orange中的Apriori算法進(jìn)行關(guān)聯(lián)分析的例子，更詳細(xì)的通過(guò)Python調(diào)用Orange的文檔參考官網(wǎng)上的Beginning with Orange.圖形界面的使用沒(méi)看到文檔，不過(guò)界面簡(jiǎn)單易懂，看看features里的screenshots也可猜個(gè)大概。參考Beginning with Orange中的Classification小節(jié)，以用Naive Bayesian Classifer處理Orange自帶的示例數(shù)據(jù)集voting.tab為例，對(duì)代碼做了少量修改：

#-*- encoding: utf-8 -*-

# 導(dǎo)入orange包

import orange

# 導(dǎo)入測(cè)試數(shù)據(jù)voting.tab

data = orange.ExampleTable("voting")

# 使用Naive Bayesian Classifer

classifier = orange.BayesLearner(data)

# 輸出

all_data = len(data)

bingo = 0

for d in data:

# 分類器輸出的類別

cc = classifier(d)

# 原文件中數(shù)據(jù)中的類別

oc = d.getclass()

if oc == cc:

print 'bingo!',

bingo += 1

else:

print 'oh,no!',

print "original", oc, "classified as", cc

# 輸出Classification Accuracy

print "CA: %.4f" % (float(bingo)/all_data)

運(yùn)行上面的代碼，可得到如下輸出：

bingo! original republican classified as republican

……

bingo! original republican classified as republican

CA: 0.9034

分類準(zhǔn)確率CA為0.9034.

Python調(diào)用非常容易，只用了十幾行代碼，不過(guò)如果用圖形界面，這個(gè)簡(jiǎn)單的分類只需要選擇Data->File，Classify->Naive Bayes和Evaluate->Test Learners就行了，如下圖所示，在File窗口中選擇Data File為voting.tab，通過(guò)簡(jiǎn)單的拖拉將widget連起來(lái)即可，雙擊Test Learners可以看到CA為0.9011.

對(duì)比Python代碼的輸出和圖形界面的結(jié)果，會(huì)發(fā)現(xiàn)兩個(gè)結(jié)果不一致，原因是圖形界面中使用的是5重交叉驗(yàn)證，而代碼中使用的訓(xùn)練數(shù)據(jù)，如果選擇”Test on train data”，兩者就一致了。

更多>> 軟件截圖