首頁>技術>

文字挖掘,也稱為文字資料探勘,大致相當於文字分析,是指從文字中獲取高品質資訊的過程。高品質的資訊通常是通過設計模式和趨勢通過統計模式學習等手段獲得的。

文字挖掘計算機程式可從許多商業和開放原始碼公司和原始碼獲得。

CommercialAmenity Analytics——開發基於雲的文字分析解決方案,使用自然語言處理和機器學習,從任何非結構化資料的來源獲取大規模的見解。Angoss文字分析通過嵌入式提供實體和主題提取、主題分類、情感分析和文件摘要功能AUTINDEX -是Saarbrucken應用資訊科學研究所開發的一個基於複雜語言學的商業文字挖掘軟體包。Autonomy -文字挖掘,聚類和分類軟體Averbis 提供文字分析,聚類和分類軟體,以及術語管理和企業搜尋Basis Technology 提供一套文字分析模組來識別語言,支援在20多種語言中搜索,提取實體,並有效地搜尋和翻譯實體。Clarabridge文字分析(文字挖掘)軟體,包括自然語言(NLP),機器學習,叢集和分類。提供SaaS,託管和現場文字和情感分析,使公司能夠收集,聽取,分析,並採取行動,對客戶的聲音(VOC)從外部(Twitter, Facebook, Yelp!內部資源(呼叫中心notes、CRM、企業資料倉庫、BI、調查、郵件等)。DigitalMR -社會媒體聽力和文字+影象分析工具的市場研究Endeca技術-提供分析和叢集非結構化文字的軟體。FICO評分-領先的分析供應商。General Sentiment -社交智慧平臺,利用自然語言處理,發現品牌粉絲與傳統電視節目粉絲在社交媒體上的親密關係。獨立的文字分析,以獲取社會知識庫的數十億主題儲存到2004年。IBM語言軟體——用於文字分析的IBM套件(工具和執行時)。IBM SPSS—Modeler Premium(以前稱為IBM SPSS Modeler和IBM SPSS文字分析)的提供者,它包含高階基於nlp的文字分析功能(多語言情感、事件和事實提取),可以與預測建模結合使用。調查文字分析提供了使用基於nlp的功能對調查響應進行分類的能力,以便進行進一步的分析或報告。Inxight -提供文字分析、搜尋和非結構化視覺化技術。(Inxight被SAP AG於2008年收購的Business Objects收購)。語言計算機公司-文字提取和分析工具,可在多種語言。Lexalytics -提供一個文字分析引擎,用於社交媒體監控、客戶語音、調查分析和其他應用。突出引擎。該軟體提供了將非結構化、基於文字的分析輸出與結構化資料合併的獨特功能,從而為改進的預測模型和關聯分析提供額外的預測變數。LexisNexis -基於廣泛的新聞和公司資訊內容集提供商業智慧解決方案。LexisNexis收購DataOps進行搜尋Linguamatics 提供基於自然語言處理(NLP)的企業文字挖掘和文字分析軟體,I2E,用於高價值的知識發現和決策支援。Luminoso -經過麻省理工學院媒體實驗室十多年的自然語言處理(NLP)、機器學習和人工智慧研究,開發出企業反饋和文字分析解決方案Mathematica -為文字對齊、模式匹配、聚類和語義分析提供內建工具。參見Wolfram語言,Mathematica的程式語言。MATLAB提供文字分析工具箱,用於匯入文字資料,將其轉換為數字形式,用於機器和深度學習、情緒分析和分類任務MeaningCloud 以前被稱為text talytics:一組文字分析api,以SaaS模式和內部環境提供,完全可定製,以獲得最高的精確度,並且由於其SDKs和外掛,非常容易整合到任何系統或環境中。Medallia -提供一個記錄系統的調查,社會,文字,書面和線上反饋。Megaputer Intelligence—從大量文字和結構化資料中獲取可操作的知識,包括自然語言處理(NLP)、機器學習、情感分析、實體提取、聚類和分類。NetOwl -多語言文字和實體分析產品套件,包括實體提取、連結和事件提取、情感分析、地理標記、名稱翻譯、名稱匹配和身份解析等。PoolParty Semantic Suite允許您開發一個知識圖——從而構建並表示您的優先順序知識域。高效能的PoolParty服務按照複雜的文字挖掘演算法提取實體和術語。RapidMiner及其文字處理擴充套件-資料和文字挖掘軟體。SAS - SAS文字挖掘和字謎;用於資訊管理的商業文字分析、自然語言處理和分類軟體。Semantria -通過API和Excel外掛提供服務。它是文字分析軟體Lexalytics的一個分支,但不同之處在於它是通過API和Excel外掛提供的,而且它包含了更大的知識庫並使用深度學習。Sketch Engine -一個語料庫管理器和分析軟體,提供從上傳的文字或網路建立文字語料庫,包括詞性標註和引理或檢測一個特定的網站Smartlogic -訊號;內容智慧平臺包含商業文字分析、自然語言處理、基於規則的分類、本體/分類法建模和用於資訊管理的資訊視覺化軟體。StatSoft -為預測分析解決方案提供了一個可選的擴充套件。Sysomos -提供社交媒體分析軟體平臺,包括文字分析和線上消費者對話的情緒分析。WordStat -用於分析大量文字資料的QDA Miner的內容分析和文字挖掘附加模組。Open sourceCarrot2 -文字和搜尋結果聚類框架。Coding Analysis Toolkit - CAT是一個免費的、基於web的、開源的文字分析服務。在團隊中載入、編碼和註釋文字資料。衡量評估者之間的可靠性,並判斷程式設計師之間的差異。報告程式碼和編碼器的準確性。通過系統迭代訓練更好的程式設計師。GATE-文字工程的通用架構,一個自然語言處理和語言工程的開源工具箱。Gensim 大型主題建模和從非結構化文字(Python)中提取語義資訊。Natural Language Toolkit (NLTK)——一套用於Python程式語言的符號和統計自然語言處理(NLP)的庫和程式。OpenNLP 自然語言處理。Orange及其文字挖掘附加元件。Stanbol 一個針對語義內容管理的開源文字挖掘引擎。程式語言R 為包tm中的文字挖掘應用程式提供了一個框架。自然語言處理任務檢視包含tm和其他文字挖掘庫包KNIME 文字處理擴充套件。The PLOS 文字挖掘集合Voyant Tools 一個基於web的文字分析環境,建立為一個學術專案。spaCy - Python的開源自然語言處理庫參考文獻^阿爾巴,大衛(2015年2月12日)。“幫助你實時分析Twitter聊天記錄的初創公司”。《連線》雜誌。2015年3月4日檢索。^史蒂夫·洛爾(2014年6月27日)。“美國-德國通過社交媒體鏡頭比賽。《紐約時報》。2015年3月4日檢索。^“文字分析工具箱”。www.mathworks.com。檢索2019-07-10。^“文字分析與素描引擎”。素描引擎。詞彙計算CZ s.r.o檢索於2018年1月17日。^ tm包簡介:R語言文字挖掘^ CRAN任務檢視:自然語言處理^“目錄:文字挖掘”。PLOS。外部連結PLOMashape上的文字挖掘api[永久死連結]可程式設計Web上的文字挖掘api用於研究的文字分析門戶中的文字挖掘api

原文:https://en.wikipedia.org/wiki/List_of_text_mining_software

本文:https://pub.intelligentx.net/wikipedia-list-text-mining-software

最新評論
  • BSA-TRITC(10mg/ml) TRITC-BSA 牛血清白蛋白改性標記羅丹明
  • 帶你入門SpringCloud服務發現,Eurka搭建和使用