時代的變遷,大家是有目共睹,世界正在一步步、並非常快速的踏入數據的時代,甚至會有人說,我們早就已經身處數位世界中了。現在,資訊就是力量,有了資料,能做到的事情非常的多:從市場分析到使用者分析,到AI化的服務,再到元宇宙的開發,有太多的可能性!這也是之所以為什麼許多企業、公司都在積極的蒐集資料,讓自己在競爭者中掌握最多資料,成為該產業的龍頭老大。

釐清了資料有多重要這一點之後,這篇文章要介紹的就是曾經在2008年被票選為最性感的工作 – 資料科學家!


資料科學家是什麼?

想要了解資料科學家就要先懂得資料科學本身的定義是什麼。

資料科學其實是一個橫跨多領域的學術知識,其中包括統計學、數據探勘、科學方法、人工智慧 (AI) 和資料分析等,主要的目的是從資料中發掘價值。「準備資料再進行分析」也是資料科學的重要的環節之一,過程包含了清理、彙總及處理資料。但在規模較大的企業會有所謂的資料工程師完成此任務。最後,資料科學便是檢閱分析結果,幫助企業、學術、或是任何有關資料方面的項目取得明智的見解。

所謂資料科學家就是對以上事情瞭如指掌的專業人士。他們的工作內容主要搭配運用一系列的技能,分析各式各樣的資料:從網路、到智慧型手機、感應器和其他來源,並從中獲取可行的見解。資料科學家就是要發現問題,提出問題然後設計方法,並且對可取得的資料進行分析。一個完整的數據團隊基本上會包含資料科學家、資料分析師以及資料工程師。資料分析師進行統計方面的工作,如實驗設計,數據分析等:資料工程師程式實作方面的工作,如大數據的收集與整理,演算法的部署等。


資料科學家的8大技能

data scientist line of work

對資料科學家有了初步的了解後,這邊要帶大家來看資料科學家在職涯上,最常被要求以及用到的6個硬技能以及2個軟技能。

硬技能:

1. Python與R程式語言(Python Coding/R Programming)

寫程式雖然不是資料科學家最主要的工作內容,但是因為統計的運算不運用工具會相對的花時間,再加上通常數據量都會很大,沒有使用Python或R來協助整理,基本上是沒有辦法使用的。

3. SQL資料庫管理系統(Database/Coding)

說到資料收集,就必須要做到清理與管理,資料科學家在這方面必須要有非常高的技術,最主要的原因一樣是回到數據的量與質,想要將資料運用的好,就一定要先會整理並管理資料。

3. 機器學習與人工智慧(Machine Learning and AI)

資料科學家必須要對機器學習與人工智慧有一定的掌握度,原因是它們資料撇不開關係。沒有數據就無法做到機器學習,或是開發人工智慧。

4. 數據處理與數據分析(Data analysis)

稍早有提到資料科學家需要利用SQL資料庫管理系統,主要就是為了儲存並有效的處理數據,進而達到利用儲存的數據來做分析。而資料科學家當然也需要非常的熟悉數據分析,又能夠從數據中發現價值,並加以利用。

5. 資料視覺化呈現能力(Data Visualization)

資料科學家除了要懂得如何分析數據,還要能夠將其視覺化,以便解讀。資料科學家需要面對的利害關係人包括老闆、管理者、C-levels、高層經理等公司重要的角色,但這些人並不一定對資料的觀察如此的精通,所以將資料視覺化的呈現成為了資料科學重要的一部分。

6. 高級數學與統計能力(Mathematics and statistics)

數學與統計是資料科學家必備的能力,在資料科學家的工作中,每天都要面對複雜的數學以及統計學的問題,計算風險、計算可能性、預測等等,都需要對數學與統計有相當的學術理解。

軟技能:

1. 部門交流與溝通能力(Communication skills and Teamwork)

溝通與交流的能力是團隊合作不可或缺的,對資料科學家來說更是如此,在一個資料或是數據的團隊中,除了科學家以外,還有資料分析師與資料工程師,加上他們要面對其他團隊(有利害關係之團隊),所以優越的溝通能力與部門交流會格外重要。

2. 行銷理論與實務經驗(Marketing theory and practical experience)

資料科學家也同時需要有行銷的知識與實務經驗,原因是他們的分析與推算往往對公司營運與行銷的層面有著直接性的影響,了解行銷對於判斷資料的價值也有相當大的幫助。

想要近一步了解資料科學家在做什麼的人,可以看以下文章:【揭開資料科學家的神祕面紗】

資料科學家的趨勢與產業

data scientist trend and industry

資料科學的理念是在1997年初一場叫做「統計=資料科學?」的講座中,C.F.Jeff Wu教授所提出的。時間快轉到2008年,DJ Patil和Jeff Hammerbacher第一次用資料科學家(Data Scientists)這個詞來描述他們的團隊。 兩年後大家也見證了資料科學以及資料科學家的發展,最主要的原因是企業開始在交易中應用到相關技術。以下跟大家簡單說明資料科學家的趨勢:

大數據分析(Big Data Analytics):

數據分析的發展得益於大數據的發展。大數據這個概念的建立於「3V」,數量(volume)、速率(velocity)以及真實(veracity)的理念。換言之,在大數據的時代中,最重要的三個需求就是要大量的,快速的,真實的資料。 儘管儲存大量的資料是一直以來都沒有問題,但分析和處理這些資料的方法卻相對有限。

資料科學自動化(Data Science Automation):

在不知不覺中資料科學自動化已經慢慢成為了我們生活中的一部分,根據業內專業人士的預估,資料科學自動化將會很短的時間內有更加突破性的發展。現在世界處於一個資料科學模型自動化的階段。靠著資料科學,模型自動化將會越來越被廣泛使用。

雲端和資料科學(Cloud and Data Science):

雲端計算除了大量的減少了裝置上,軟體上和平臺上的成本;同時,這也極大減少了在數據分析中的運用和維護成本。以雲端為基礎的資料科學和機器學習平臺,提供了資料科學家一個理想的環境,而環境就是能夠從雲端中的處理資料、分析資料。

自然語言處理(Natural Language Processing):

深度學習在過去的10年內已經成為資料科學中最受歡迎的領域之一了。而深度學習之所以備受矚目是因為它擁有可以學習複雜的非線性關係的能力。Tensorflow和H2O兩框架提供了一個實用的平臺去實踐深度學習演算法,利用了許多資料科學的知識。

物聯網(Internet of Things):

資料科學是物聯網的核心,能從被連線的物體中獲取資訊,透過機器與網際網路的連線達成資料的傳遞(比如說感應器,促動器和掃地機器人),到現在的自動駕駛,基本上都有一定程度的採用資料科學的技術。


資料科學家的薪水待遇

資料科學家的薪資在台灣堪比軟體工程師,以沒有經驗的社會新鮮人來說,起薪大約也能達到44K,一至兩年經驗的資料科學家的薪水就能翻倍,達到80K左右。年資在更久一點的人,年薪沒有破百萬都奇怪。若是身處在外商公司,一位資料科學家的薪資還有機會在達到更高的境界。

在美國,一位初階的資料科學家薪水大約是每年7萬美元(193萬台幣),而一位相對資深的資料科學家年薪能平均落在12-15萬美元(300-400萬台幣)。

不管在台灣還是美國,資料科學家的薪水都比大部分的職位高出許多,而在這個數據的時代,資料科學這個技術會越來越被需要,也許還會到供不應求的情況,所以我們也能預見更高的薪水成長。


結論

看完這篇文章後,大家對資料科學家也一定有了更多的了解。這個職位不管在現在還是未來,只要有數據存在,就是一個不可或缺的位子。也不管是在什麼產業、什麼商業模式、什麼產品,在這個什麼事情都數位化的時代,資料科學家一定是一個重要的角色。

如果你希望可以得到更多資訊,可以追蹤Glints的臉書粉絲頁,每個星期都可以看到熱門職缺與職涯資訊 。

你也可以到Glints – Taiwan去了解更多!或是註冊帳號,收到職缺通知!

延伸閱讀:

對軟體工程師求職有興趣的人,可以看看Glints的其他精選文章

About Author

Passionate writer, who love to tell stories that are both informative and impactful!

Leave A Comment

Your email address will not be published. Required fields are marked *