點擊右邊

21SZ娛樂城個必知的機械進修開源對象,涵蓋5大范疇

地下539玩法

  • 本文將先容21個你可能沒使用過的機械進修開源對象。
  • 每個開源對象都為數據迷信家處置數據庫供應了不同角度。
  • 本文將重點先容五種機械進修的對象——面向非法式員的對象(Ludwig、Orange、KNIME)、模子部署(CoreML、Tensorflow.js)、大數據(Hadoop、Spark)、計算機視覺(SimpleCV)、NLP(電競運彩分析StanfordNLP)、音頻以及強化進修(OpenAI Gym)。

你一定已經經曉得一些著名的開源對象,如R、Python、Jupyter條記本等。但除此以外,還有一個世界——一個在雷達下機械進修對象存在的世界。它們雖沒有那些著名的開源對象精彩,但卻可以輔助用戶辦理很多機械進修的使命。
開源機械進修對象可分為如下5類:
1. 面向非法式員的開源機械進修對象
關于沒有編程違景以及手藝違景的人來說,機械進修好像很龐大。這是一個遼闊的范疇,可以想象,首次打仗機械進修有多使人畏懼。一個沒有編程履歷的人能在機械進修范疇取得勝利嗎?
究竟證實,能取得勝利!如下三種對象可以輔助非法式員超過手藝鴻溝,進入聲名鵲起的機械進修世界:

  •  Uber Ludwig:Uber’s Ludwig是一個確立在TensorFlow上的對象箱。Ludwig許可用戶訓練以及測試深度進修模子,而不必要編寫代碼。用戶必要供應的只是一個包括數據的CSV文件,一個用作輸出的列表,和一個用作輸入的列表——而剩下事捕魚達人千砲版情將由Ludwig來實現。它對試驗特別很是有效,由于用戶只要耗損很少的時間以及精神,就能構建龐大的模子。而且用戶可以對其進行調整以及處置以后再決定是否要將其應用在代碼中。 
  • KNIME:KNIME可供用戶使用拖放界面創立整個數據迷信事情流。用戶可以根本完成從功效工程到功效選擇的一切功效,甚至可以經由過程這類方式將展望機械進修模子歸入事情流程中。這類可視化履行整個模子事情流的要領特別很是直觀,而且在處置龐大的成績時特別很是有效。
  • Orange:用戶無須曉得若何編寫代碼以使用or捕魚達人ange來發掘數據、處置數字和由此得出本人的見解。相反,用戶可履行根本可視化、數據操作、轉換以及數據發掘等使命。因為Orange的易用性及其增添多個附加組件以增補其功效的本領,該對象近來在門生以及教員中十分流行。

還有很多更乏味、收費的開源軟件可以供應很好的機械進修功效,而無需編寫(大批)代碼。
此外,一些付費服務也能夠思量,如Google AutoML、 Azure Studio、  Deep Cognition以及 Data Robot.
2. 旨在部署模子的開源機械進修對象
部署機械進修模子是一個十分緊張但最輕易被疏忽的使命,用戶應當加以注重。它一定會浮現在口試中,以是用戶需很好地相識這個話題。
如下四種對象可以使用戶更容易將其項目應用到實際裝備上。

  • MLFlo539大樂透中獎號碼查詢w: MLFlow旨在與機械進修庫或者算法共同使用,并治理包含試驗、再驗以及機械進修模子部署在內的整個生命周期。現在,MLFlow在Alpha中有3個部門——跟蹤、項目以及模子。
  • Apple’s CoreML: CoreMLl是一個十分受迎接的對象,它可將機械進修模子內置到用戶的iOS/Apple Watch/Apple TV/MacOS的運用法式中。CoreML的閃光點在于用戶無需對神經收集或者機械進修有普遍的相識,終極到達共贏的效果!
  • TensorFlow Lite: TensorFlow Lite是一套輔助開發職員在挪移裝備(Android以及iOS)以及物聯網裝備上運轉TensorFlow模子的對象,旨在便利開發職員在收集“邊沿”的裝備長進行機械進修,而不是從服務器往返發送數據。
  • TensorFlow.js :TensorFlow.js是用戶在網上部署機械進修模子的首選。這是一個凋謝源碼庫,供用戶在涉獵器中構建以及處置機械進修模子。它可為GPU加快,還主動支撐WebGL。用戶可以導入現有的預培訓模子,也能夠在涉獵器上從新處置整個現無機器進修模子!

3. 大數據開源機械進修對象
大數據是一個研究若何進行闡發、若何體系地從數據集中提守信息或者以其余方式處置傳統數據處置軟件沒法處置的太大或者太龐大的數據集的范疇。想象一下,天天處置數百萬條推特進行情感闡發。這感到像是一項艱巨的使命,不是嗎?
放寬解!如下三種對象可以輔助用戶處置大數據。

  • Hadoop: Hadoop是處置大數據最卓越也是最相關的對象之一。Hadoop許可用戶使用簡略的編程模子在計算機集群之間對大型數據集進行漫衍式處置。它旨在對單個服務器到數千臺機械,每臺機械都供應內地計算以及存儲。
  • Spark: Apache spark被認為在大數據運用法式方面是Hadoop的進階版。Apache spark的樞紐在于彌補了Apache Hadoop在數據處置方面的空缺。乏味的是,Spark可以同時處置批量數據以及及時數據。
  • Neo4j: 在處置大數據有關成績方面,Hadoop可能不是盡佳的選擇。例如,用戶必要處置大批的收集數據或者圖形相關成績(如交際收集或者生齒統計模式等)時。而圖形數據庫(Neo4j)則是最好選擇。

【免責聲明】本站內容轉載自互聯網,其相關談吐僅代表作者小我私家概念盡非權勢巨子,不代表本站態度。如您發明內容存在版權成績,請提交相關鏈接至郵箱:,咱們將實時予以處置。