-
1 # 自由程式設計
-
2 # 解讀未來科技
做資料探勘的話只靠工具實現不太現實,主要是不夠靈活,我最近正在研究python,有什麼專案和想法的話可以一起合作啊,想做一件事情不一定自己要掌握所有的技術的。
-
3 # 大資料傅一航
可以用工具,比如Excel,power BI,tableau,SPSS等等,沒有說一定要學開發寫程式碼的。只有當這些工具滿足不了你的業務需求的時候,才考慮是否學python之類的。可以參考我寫的大資料職業技能相關文件,弄明白大資料分析師和大資料工程師的區別。
-
4 # 傳智播客
不會程式語言如何做資料探勘:
今天就給大家帶來不需要程式碼的資料探勘方法,有需要的小夥伴請準備好筆和小本本哦。
JMP:這個是SAS公司推出的一款互動式的視覺化統計發現軟體
下邊是一個網路上的同學用了三門資料結果大概給大家演示一下。接下來的圖片都是動圖,大家需要點看來看哦。
由於資料的話都有序號,因此可以直接調整資料的起始列:
分佈擬合:
資料探勘:
互動分析
多元分析
因為資料是完全線性相關的,所以,我們可以用鳶尾花資料集 Iris,可以從而體驗一下多元分析。馬上就可以看出紅色的差異:
-
5 # 超級架構師
如果熟悉程式設計,小批次資料可以使用R,Python等,大批次資料可以使用Spark,Flink等.
Python 有一些庫如下:
如果不會寫程式碼,也有很多工具可以選擇.
收費的:SAS
SPSS
JMP
Knime
rapidminer
免費的WEKA
Orange
當然 Excel也可以
-
6 # 博愛周易
過來學姐給你建議:女生,大四,資訊管理與資訊系統,不會寫程式碼,找工作中。1.首先來說一下你覺得找不到工作的問題。這個專業找得到工作,你這種情況可以向需求分析師方面發展,恩前提是你要有發現問題研究問題給出解決方案的能力。其次,銀行、公務員、專業要求管理學的工作都可以嘗試,就看你興趣點在哪了。2.我自己的詳細情況:大三修了金融學雙學位,對經濟金融感興趣,參加過實習(掛職鍛鍊),做過軟體開發專案(主要做需求分析、ps、美工這種),組隊參加過比賽(沒什麼技術含量),幫老師做過資料探勘的工作,最有含金量的就是一個國家勵志獎學金,專業排名前30%,沒過六級,四級很低(建議刷四級啊不要像我一樣一直考六級就差幾分但是四級沒刷過一次,網申時就悲劇了啊啊啊啊!!),題主你自己比較一下看是不是比我好一丟丟?為什麼我一定會認為你比我好一丟丟,因為你現在大三,不像我知道該怎麼做的時候已經晚了。我這種情況,找工作不難,但是找到與自己預期相近的工作實在太難,簡單的就是:高不成低不就。3.題主應該怎麼做:a:想進銀行就考幾個證,會從、銀從、證從 來一打。b:提高績點,平時多看看書期末好好複習,大學績點真的很好提高,並且很多評獎只看一學年的成績而不是大學四年的成績,爭取拿到國家級的獎學金。不強求,有最好。c:參加比賽,本創、國創、數學建模,你不會寫程式碼資料探勘總做的好吧,前面幾個比賽只要##用心+創意+資料探勘+會寫文會展示的隊員##基本上很容易做成功;如果你覺得逼格太高那你自己找找學校啊或者某些公司企業贊助的活動,拿個獎很容易,至少簡歷有得寫。d:如果你覺得以上都沒興趣,那就去實習,我說的是寒假實習,暑期實習是必須的。你要真想找到好工作,現在立刻馬上去各種網站找實習,先剖析自己適合哪方面的工作,找個實習鍛鍊一下,下學期開始找3個月以上的長期實習,實習期間多學多做,提高很快。一定要找有含金量的實習,基層公務員行業不要去,一定要找企業的,有經驗之後找500強,恩就是這樣。很多實習也是要筆試面試的,多找找多碰壁就知道是怎麼回事了。很多企業刷簡歷基本上都是看實習經歷的,如果能在500強實習半年以上,那基本上很快就能找到好工作!!!恩總結一下:過不了六級就去刷四級最好500分以上;考試、比賽選一樣;實習很重要,500強長期實習最重要。找工作時會發現:專業沒啥用,最主要看你自己學到了什麼。想做管理,那麼管理學基本理論得知道吧,當HR問你哪種情況該採取什麼方法時你得有理論支援吧,多讀書多看行業新聞很有用,真的會在無形中提升你的水平。
-
7 # RabbitTail
1.
Heritrix 是一個由 java 開發的、開源的網路爬蟲,使用者可以使用它來從網上抓取想要的資源。其最出色之處在於它良好的可擴充套件性,方便使用者實現自己的抓取邏輯。本文詳細介紹了 Heritrix 在 Eclipse 中的配置、執行,最後以抓取北京林業大學網站為例,介紹如何對其進行擴充套件,實現只抓取特定網站的頁面。
2.
前嗅的爬蟲,不僅操作簡單,不會技術的人都可以使用,而且採集的資料非常全面,我應該是網上有的都可以採集嚴格的反爬蟲網站,都能被他們破解採集資料。。
3.
可以從網上⏬(github等)下載針對不同網站爬蟲的程式包,懂一點點python 我覺得也許你是可以用噠,加油油~
-
8 # 統計學的世界
如果實在不會寫程式碼,也不想寫程式碼,但是想做資料探勘。那至少要學兩個東西:
1.對常規的演算法還是要有了解:線性迴歸、logistic迴歸、cart、chaid、k-means
adboosting等等
2.最好學一個比較簡單的資料探勘軟體,比如SPSS Clementine,這個是之前業界比較流行的比較簡單的資料探勘軟體,只需要動手點點,配置一些簡單的引數就能實現資料探勘的過程的資料清洗、變數轉化、演算法執行、模型評估,預測等等。
當然用比較簡單的資料探勘軟體對自己在資料探勘這個職位上的發展限制也是很明顯的:多半隻能做離線的模型,不能做連續線上的預測。只能做相對比較簡單死板的模型演算法,無法根據自身資料的特徵和需要做各種演算法和模型的組合。
搞資料探勘,一定要會寫程式碼才能做嗎?除了Python,R,這些程式語言之外,還有哪些資料探勘工具?最好不用寫程式碼的,有統計學基礎,但就是不懂程式設計,英語書寫,真的太差了,完全看不懂程式碼。之前有學過Python,對於程式設計零基礎且英語非常差的我來說,學程式語言真的是太痛苦了!
回覆列表
大部分挖掘工作其實都可以透過寫sql查詢語句來實現。
可以瞭解一下hadoop和hive,透過簡單的查詢語句,可以做各種複雜的資料加工。
希望可以幫到你。