谷歌 TensorFlow 穩(wěn)居第一:23 個(gè)深度學(xué)習(xí)庫(kù)的排名
來(lái)源:原創(chuàng) 時(shí)間:2017-11-08 瀏覽:0 次【導(dǎo)讀】:根據(jù) Github 和 Stack Overflow 上的活潑度以及 Google 查找成果,The Data Incubator 最近制作了一個(gè) 23 個(gè)搶手深度學(xué)習(xí)庫(kù)的排名。
下表顯現(xiàn)了規(guī)范化后的分?jǐn)?shù),其中值 1 表明高于均勻值的一個(gè)規(guī)范誤差(均勻值為 0)。 例如,Caffe 在 Github 中的活動(dòng)是一個(gè)高于均勻水準(zhǔn)的規(guī)范差,而 deeplearning4j 挨近均勻水平。見(jiàn)結(jié)尾的辦法。
成果和評(píng)論
該排名根據(jù)三個(gè)平等重要的部分:Github(star 和 fork),Stack Overflow(標(biāo)簽和問(wèn)題)和 Google 查找成果(總和以及季度增加率)。這 3 部分是經(jīng)過(guò)可用的 API 取得的。想弄一個(gè)全面的深化學(xué)習(xí)東西包列表不容易,所以在最終選取了我們以為具有代表性的五個(gè)不同的列表(有關(guān)詳細(xì)信息,請(qǐng)參閱下面的辦法)。核算每種衡量的規(guī)范化分?jǐn)?shù),使我們能夠看到在每個(gè)類別中哪些包是鋒芒畢露的。
TensorFlow 在最大活潑社區(qū)中占主導(dǎo)
TensorFlow 在一切核算衡量上的均勻值上至罕見(jiàn)兩個(gè)規(guī)范誤差。TensorFlow 和第二大盛行結(jié)構(gòu) Caffe 比較,在 Github 上的 fork 數(shù)幾乎是后者的三倍,在 Stack Overflow 上的問(wèn)題總量是后者的六倍以上。TensorFlow 由 Google Brain 團(tuán)隊(duì)于 2015 年首度敞開(kāi),現(xiàn)已超過(guò)了許多的高檔庫(kù),如 Theano(4)和 Torch(8),成為我們榜單的首位。TensorFlow 盡管與在 C++ 引擎上運(yùn)轉(zhuǎn)的 Python API 一同分發(fā),但表中的幾個(gè)庫(kù)能夠?qū)?TensorFlow 用作后端,并供給它們自己的接口。這些庫(kù)包含了 Keras(2),將很快成為 TensorFlow 和 Sonnet 的中心部分(6)。TensorFlow 的盛行可能是其通用的深度學(xué)習(xí)結(jié)構(gòu),靈敏的界面,美觀的核算圖形可視化和 Google 的重要開(kāi)發(fā)人員和社區(qū)資源的合力下的成果。
Caffe 尚未被 Caffe2 所替代
Caffe 在我們的名單上排名第三,除了 TensorFlow 外,Caffe 其在 Github 上的活潑度比其他競(jìng)爭(zhēng)對(duì)手都要多。Caffe 傳統(tǒng)上被以為比 Tensorflow 更專業(yè),而且專心于圖畫(huà)處理,方針辨認(rèn)和預(yù)先練習(xí)的卷積神經(jīng)網(wǎng)絡(luò)。Facebook 于 2017 年 4 月發(fā)布了 Caffe2(11),而且現(xiàn)已排在了深化學(xué)習(xí)庫(kù)的上半部分。Caffe2 是一個(gè)更輕盈、模塊化和可擴(kuò)展的 Caffe 版別,包含循環(huán)神經(jīng)網(wǎng)絡(luò)。Caffe 和 Caffe2 是彼此獨(dú)立的庫(kù)房(repo),所以數(shù)據(jù)科學(xué)家能夠持續(xù)運(yùn)用開(kāi)始的 Caffe??墒?,有一些搬遷東西,比方如 Caffe Translator,它供給了一種運(yùn)用 Caffe2 來(lái)驅(qū)動(dòng)現(xiàn)有 Caffe 模型的辦法。
Keras 是深度學(xué)習(xí)上最受歡迎的前端庫(kù)
Keras(2)是排名最高的非結(jié)構(gòu)庫(kù)。Keras 能夠用作 TensorFlow(1)、Theano(4)、MXNet(7)、CNTK(9)、deeplearning4j(14)的前端。在一切的三個(gè)衡量規(guī)范上, Keras 的體現(xiàn)均優(yōu)于均勻水平。Keras 的盛行可能是因?yàn)槠浜?jiǎn)單性和易用性。Keras 答應(yīng)快速的原型化,但價(jià)值是獻(xiàn)身了從結(jié)構(gòu)直接運(yùn)轉(zhuǎn)而發(fā)生的一些靈敏性和操控。數(shù)據(jù)科學(xué)家在數(shù)據(jù)集上做深度學(xué)習(xí)的相關(guān)試驗(yàn)時(shí),Keras 遭到了他們的喜愛(ài)。跟著 R Studio 最近發(fā)布了 Keras 的界面,Keras 的開(kāi)展和受歡迎程度還在不斷連續(xù)。
即便沒(méi)有巨子支撐,Theano 仍堅(jiān)持獨(dú)占鰲頭
在新的深度學(xué)習(xí)結(jié)構(gòu)的海洋中,Theano(4)是我們的排名中最陳舊的庫(kù)。Theano 創(chuàng)始性地運(yùn)用了核算圖(computational graph),并在研討界遍及做深度學(xué)習(xí)和機(jī)器學(xué)習(xí)之時(shí)仍堅(jiān)持盛行。Theano 本質(zhì)上是一個(gè) Python 的數(shù)值核算庫(kù),但能夠與像 Lasagne 這樣的高檔深度學(xué)習(xí)庫(kù)(15)一同運(yùn)用。盡管 Google 支撐 TensorFlow(1)和 Keras(2),F(xiàn)acebook 支撐 PyTorch(5)和 Caffe2(11),MXNet(7)是 Amazon Web Services 的官方深度學(xué)習(xí)結(jié)構(gòu),Microsoft 規(guī)劃并保護(hù)了 CNTK(9),Theano 在沒(méi)遭到職業(yè)巨子的正式支撐下仍然盛行。
Sonnet 是增加最快的庫(kù)
2017 年頭,Google 的 DeepMind 揭露發(fā)布了 Sonnet(6)的代碼,這是一個(gè)以 TensorFlow 為根底的高檔面向?qū)ο髱?kù)。Sonnet 的 Google 查找成果回來(lái)頁(yè)數(shù)比上個(gè)季度增加了 272%,是我們列表中一切庫(kù)中最大的。盡管 Google 在 2014 年收買了英國(guó)人工智能公司DeepMind,但 DeepMind 和 Google Brain 仍然在大體上是獨(dú)立團(tuán)隊(duì)。DeepMind 專心于通用人工智能,Sonnet 能夠協(xié)助用戶為他們的詳細(xì) AI 主意和研討做頂層規(guī)劃。
Python 是深度學(xué)習(xí)的接口言語(yǔ)
PyTorch(5)是我們表中增加速度第二的庫(kù),該結(jié)構(gòu)的僅有接口是 Python。與上季度比較,PyTorch 的 Google 查找成果增加了 236%。在我們排的 23 個(gè)開(kāi)源深度學(xué)習(xí)結(jié)構(gòu)和包裝器中,只要三個(gè)沒(méi)有 Python 接口:Dlib(10)、MatConvNet(20)和OpenNN(23)。在 23 個(gè)庫(kù)中,C ++ 和 R 接口別離只要 7 個(gè)和 6 個(gè)。盡管數(shù)據(jù)科學(xué)界在運(yùn)用 Python 方面有些挨近同一個(gè)一致,但對(duì)深度學(xué)習(xí)庫(kù)而言,還有許多的挑選。
約束
當(dāng)然,有些庫(kù)因?yàn)楝F(xiàn)已存在了更長(zhǎng)的時(shí)刻會(huì)有更高的數(shù)據(jù),因而排名更高。僅有考慮到這一點(diǎn)的目標(biāo),是 Google 查找季度增加率。
數(shù)據(jù)出現(xiàn)中遇到的一些困難:
·神經(jīng)規(guī)劃和 wolfram 數(shù)學(xué)是專有的,故被刪去
·cntk 也被稱為「微軟認(rèn)知東西包」,可是我們只運(yùn)用了 ctnk 稱號(hào)
·neon 變成了 nervana neon
·paddle 被改為 paddlepaddle
·一些庫(kù)顯然是其他庫(kù)的衍生品,如 Caffe 和 Caffe2。如果它們有獨(dú)自/獨(dú)立的 Github 庫(kù)房,我們分隔處理這些庫(kù)。
辦法
一切源代碼和數(shù)據(jù)都在我們的 Github 頁(yè)面上。我們首先從五個(gè)不同的來(lái)歷中生成了 23 個(gè)開(kāi)源深度學(xué)習(xí)庫(kù)的列表,然后收集了一切這些庫(kù)的目標(biāo),以取得排名。
Github 的數(shù)據(jù)根據(jù) star 數(shù)和 fork 數(shù)、Stack Overflow 的數(shù)據(jù)包含包稱號(hào)的標(biāo)簽和問(wèn)題,Google 查找成果則根據(jù)曩昔五年的 Google 查找成果總數(shù),并核算成果在曩昔三個(gè)月與前三個(gè)月比較的季度增加率。
一些注意事項(xiàng):
·有幾個(gè)庫(kù)是常用詞匯(caffe、chainer、lasagne),因而用于斷定 Google 查找成果數(shù)量的查找詞,包含庫(kù)的稱號(hào)和術(shù)語(yǔ)即“deep learning”。
·任何不可用的 Stack Overflow 計(jì)數(shù)都轉(zhuǎn)換為零計(jì)數(shù)。
·計(jì)數(shù)被規(guī)范化為均值 0 和誤差 1,然后均勻得到 Github 和 Stack Overflow 分?jǐn)?shù),并結(jié)合 Serch 成果,然后得到總分。
·做了一些手動(dòng)查看以承認(rèn) Github 庫(kù)房方位。