這兩個概念完全不同啊。量化交易是具體的工作內容,資料探勘是一種工作方法。
——量化交易不是隻會資料探勘就可以的,至少你還要懂基本的投資知識和交易規則。
——資料探勘作為一種工作方法,不僅可以用於量化交易,比如製造業可以用來做自動控制,金融業可以用來做反洗錢或風險評測,市場營銷人員可以用來做銷售預測,運營人員可以用來做客戶精準分析等等。
大資料嚒,我覺得是一個被濫用的概念,我作為資料工作人員,我都不知道大資料的準確定義是啥。事實上我也不關心,究竟多少維度多少容量的資料才是大資料,這個問題沒有意義。只是在資料量和資料型別不同的情況下,你需要不同的技術方法和資料架構去實現。
舉個例子,如果你想用客戶的交易資料來做CRM(客戶關係管理),你的資料量可能只有幾萬行,也都是結構化資料,那麼excel足夠了;如果資料量到百萬行,開源的mysql簡單用用也可以;如果到千萬級,mysql需要優化了,或者直接用sql server及oracle;如果資料量再大,建議上所謂大資料平臺,如hadoop等方案;如果你的資料還包括音訊、影片、圖片等,那麼你需要更豐富的non sql 方案。
做量化的話,以A股為例,算2000家好了,每年250交易日,每天4*60=240分鐘。如果你要做分鐘級的分析,資料總量1.2億條,再加上你可能還關注財務報表、基準利率、新聞、政策等資訊,處理這些資料還是需要一定技術的。
我猜測題主是不是想做量化投資,在評估各方面的資源和條件。
量化投資肯定需要資料探勘技術,但未必需要“大資料”技術(我預設資料探勘人員具備處理大資料的能力),交易規則和投資知識肯定是需要的。我大概列一下吧:
1、交易員(提出交易規則)
2、資料建模人員(實現並分析交易規則)
3、機房、硬體等管理人員(基礎設施)
4、資料架構師(底層資料儲存、計算框架的搭建)
5、開發人員(資料平臺的開發、與證券、銀行介面對接等)
如果是個人興趣,我覺得會爬蟲和資料分析就可以入門了。
推薦python
這兩個概念完全不同啊。量化交易是具體的工作內容,資料探勘是一種工作方法。
——量化交易不是隻會資料探勘就可以的,至少你還要懂基本的投資知識和交易規則。
——資料探勘作為一種工作方法,不僅可以用於量化交易,比如製造業可以用來做自動控制,金融業可以用來做反洗錢或風險評測,市場營銷人員可以用來做銷售預測,運營人員可以用來做客戶精準分析等等。
大資料嚒,我覺得是一個被濫用的概念,我作為資料工作人員,我都不知道大資料的準確定義是啥。事實上我也不關心,究竟多少維度多少容量的資料才是大資料,這個問題沒有意義。只是在資料量和資料型別不同的情況下,你需要不同的技術方法和資料架構去實現。
舉個例子,如果你想用客戶的交易資料來做CRM(客戶關係管理),你的資料量可能只有幾萬行,也都是結構化資料,那麼excel足夠了;如果資料量到百萬行,開源的mysql簡單用用也可以;如果到千萬級,mysql需要優化了,或者直接用sql server及oracle;如果資料量再大,建議上所謂大資料平臺,如hadoop等方案;如果你的資料還包括音訊、影片、圖片等,那麼你需要更豐富的non sql 方案。
做量化的話,以A股為例,算2000家好了,每年250交易日,每天4*60=240分鐘。如果你要做分鐘級的分析,資料總量1.2億條,再加上你可能還關注財務報表、基準利率、新聞、政策等資訊,處理這些資料還是需要一定技術的。
我猜測題主是不是想做量化投資,在評估各方面的資源和條件。
量化投資肯定需要資料探勘技術,但未必需要“大資料”技術(我預設資料探勘人員具備處理大資料的能力),交易規則和投資知識肯定是需要的。我大概列一下吧:
1、交易員(提出交易規則)
2、資料建模人員(實現並分析交易規則)
3、機房、硬體等管理人員(基礎設施)
4、資料架構師(底層資料儲存、計算框架的搭建)
5、開發人員(資料平臺的開發、與證券、銀行介面對接等)
如果是個人興趣,我覺得會爬蟲和資料分析就可以入門了。
推薦python