Friday, January 2, 2015

哪個資料分析工具最受歡迎?

上星期看到一篇有趣的分析,從各種數據來看資料分析工具(Data Analytics tools,也就是俗稱的「統計軟體」)在過去 20 年間,受歡迎程度的消長。

因為這個分析的作者是 R 的愛好者,所以這張圖當然是看起來最能說服讀者:「R 就是讚!」的一張。

事實上這個數據是從各大網路論壇的文章當中,計算各種統計軟體「被討論的次數」,所以應該偏向最多「開發者」在使用,而不是所有的人。

RS-PLUSSASSPSSStata,Statistica,都是相當受歡迎的統計軟體,由圖中可以看到,R 是 Open Source 軟體,近年來越來越受到開發者的青睞。另外,從網路搜尋量、討論的部落格數量、業界實際使用在專案上的數量來看,R 的支持度都有不斷向上攀高的趨勢。附帶一提,S-PLUS 是 R 的近親,兩者都是 S-Language,不同的是 S-PLUS 是商用版本,包含了一些需要付費的演算法。

但是如果從其他指標來看,R 就沒那麼風光了。

學術論文中使用的次數來說,整體趨勢與上圖相似,但是 R 的曲線整個下降到最下方,跟 S-PLUS 差不多的位置,雖然還是向上提升,但是總量卻遠遠小於其他工具。另外,SPSS 的曲線整個高過 SAS,作者說這是由於「生命科學領域愛用」的緣故。

另外,該文作者也統計了美國知名人力資源網站 Monsters.com 的職缺中註明需要的軟體技能,結果 SAS 跟 SPSS 都有 1000 筆以上,其他的通通都在 200 以下。但是若以 KDnuggets 網站在 2010 年所刊登的職缺來計算,則是SAS:41%,SPSS:15%, R:14%出處),所以R還算是蠻有一點市場競爭力的一門技術。(附註:我上104人力銀行查了一下,台灣目前需要 R 的職缺不到 5 筆,其中只有兩筆是企業,其餘為研究單位。)

這兩年商用 Data Analytics 越來越熱門,從 SPSS 被 IBM 併購,到最近無論到哪個網站都看到 SAS 的廣告,看來這是新的戰場了。

http://esse_tsyo.blogspot.ca/2011/03/blog-post_31.html

No comments: