點擊右邊

用金鈦娛樂于天然說話處置的12大開源對象

天然說話處置(NLP),為一切談天機械人,語音助理,展望文本和其余滲入到咱們生涯中的語音/文本運用供應支撐的手藝,在已往幾年中已經經有了長足的生長。本文為人人保舉一些開源NLP對象,輔助人人規劃基于語音或者文本的運用法式。
1、Python對象
1. 天然說話對象包(NLTK)
天然說話對象包(NLTK)是最全功效的對象。它幾近完成了你必要的任何NLP組件,如分類,標志化,剖析以及語義推理。而且每種要領平日都有多個完成,是以你可以選擇想要使用切實其實切算法或者要領。它還支撐多種說話。然則它以字符串的情勢透露表現一切數據,這關于簡略的架構很好,然則很難使用某些高等功效。與其余對象相比,它的生長點慢。總的來說,這是一個很好的對象包,實用于必要特定算法組合的試驗,索求以及運用法式。

2. SpaCy
SpaCy是NLTK的首要競爭敵手。在大多半環境下它速率更快,但每個NLP組件只有一個完成。此外,它將一切內容透露表現為工具而不是字符串,這簡化了構建運用法式的界面。這也有助于它與很多其余框架以及數據迷信對象集成,是以你可以在更好地輿解文本數據后履行更多操作。然則,SpaCy不支撐與NLTK同樣多的說話。它確鑿有一個簡略的界面,一組簡化的選擇以及良好的文檔,和說話處置以及闡發的種種組件的多個神經模子。總的來說,關于必要在臨盆中具備高機能而且不必要特定算法的新運用法式來說,這是一個很好的對象。

3. TextBlob
TextBlob是NLTK的擴大。可以經由過程TextBlob以簡化方式走訪很多NLTK函數,TextBlob還包括Pattern庫中的功效。若是你方才最先,這多是進修時使用的好對象,它可以在臨盆頂用于不必要過分履行的運用法式。總的來說,TextBlob在一切處所都使用,特別很是得當電競運彩分析小型項目。

4. Textacy
Textacy也是一個很棒的對象。它使用SpaCy作為其焦點NLP功效,但它處置了處置先后的大批事情。若是你打算使用SpaCy,也能夠使用Textacy,,如許就可以輕松地引入很多類型的數據,而無需編寫額定的輔助麻將online代碼。
5. PyTorch捕魚達人序號-NLP
PyTorch-NLP已經經推出了一段時間了,但它已經經有了一個復雜的社區。它是疾速原型線上麻將朋友建造的盡佳對象。它也常常經由過程最新的研究進行更新,頂級公司以及研究職員已經經發布了很多其余對象來進行種種驚人的處置,例如圖象變換。總體而言,PyTorch針對的是研究職員,但它也能夠用于原型以及初始臨盆事情負載,并供應開始進的算法。在它之上創立的庫也可能值得研究。

二、Node對象
6. Retext
Retext是unified collective的一部門。Unified是一個許可多個對象以及插件有用集成以及協同事情的界面。Retext是同一對象使用的三種語法之一;其余是Markmark的Remark以及HTML的Rehype。Retext沒有地下它的很多底層手藝,而是使用插件來完成你可能用NLP對準的效果。這很輕易做一些工作,譬如反省拼寫,修復排版,檢測情感,或者確保簡略的插件可以讀取文本。總的來說,若是你只要要實現某些事情而無需相識底層流程中的一切內容,那末這是一個精彩的對象以及社區。
7. Compromise
Compromise一定不是最龐大的對象。若是你正在探求開始進的算法或者最完備的體系,這可能不得當你。然則,若是想要一個具備普遍功效而且可以在客戶端運轉的高機能對象,那末你應當望望Compromise。
8. Natural
Natural包括你在一般NLP庫中可能指望的大多半功效。它首要側重于英語,但其余一些說話已經經供應,社區對其余奉獻持凋謝立場。它支撐標志化,詞干化,分類,語音,術語頻率——逆文檔頻率,WordNet,字符串類似性以及一些變形。它可能與NLTK最具可比性,由于它試圖將一切內容都包括在一個包中,但它更容易于使用,而且紛歧定集中在研究上。總的來說,這是一個特別很是完備的庫,但它仍處于努力開發階段,可能必要額定的底層完成學問才能齊全有用。
9. Nlp.js
Nlp.js確立在其余幾個NLP庫之上,包含Franc以及Brain.js。它為NLP的很多組件供應了一個很好的界面,如分類,情緒闡發,詞干,定名實體辨認以及天然說話天生。它還支撐多種說話,若是你企圖使用非英語之外的其余說話,這將特別很是有效。總的來說,這是一個很棒的通用對象,它簡化了與其余幾個對象的接口。在你必要更強盛或者更天真的功效之前,這可能會在你的運用法式中恒久使用。

3、Java對象
10. OpenNLP
OpenNLP由Apache Foundation托管,是以很輕易將其集成到其余Apache項目中,如Apache Flink,Apache NiFi以及Apache Spark。它是一個通用的N539領獎LP對象,涵蓋了NLP的一切常見處置組件,可以從下令行或者運用法式頂用作庫。它還普遍支撐多種說話。總體而言,OpenNLP是一個功效強盛的對象,具備很多功效,而且若是你使用Java,則可覺得臨盆事情負載做好預備。

11偏財運生肖. StanfordNLP
Stanford CoreNLP是一組對象,供應統計NLP,深度進修NLP以及基于規定的NLP功效。已經經創立了很多其余編程說話綁定,是以可以在Java以外使用此對象。它是一個由精英研究機構創立的特別很是強盛的對象,但它可能不是臨盆事情負載的最好選擇。此對象具備兩重允許,具備貿易用途的非凡允許。總的來說,這是一個很好的研究以及試驗對象,但它可能會在臨盆體系中發生額定的本錢。

12. CogCompNLP

【免責聲明】本站內容轉載自互聯網,其相關談吐僅代表作者小我私家概念盡非權勢巨子,不代表本站態度。如您發明內容存在版權成績,請提交相關鏈接至郵箱:,咱們將實時予以處置。