「資料探勘」早在十幾年前唸書時就有耳聞,但資料科學倒是近五年來才知道有這門學科。
就我的理解來說,資料探勘就是如何從大量資料中找出有用的資訊,而「資料科學」就是利用這些有用的資訊來做分析,從而達到預測的目的。
網際網路每天都在產生大量的資料,要用人為收集並篩選毫無效率,因此誕生了「網路爬蟲」來自動抓資料,這應該也是早期 Google 在建立搜尋演算法時跟其它公司有所差異的地方,它們的爬蟲跟建立索引的效率比其它搜尋引擎好上不少 (個人猜測)。
話說好幾年前在上「行銷課」時,有位老師超愛講網路爬蟲,然後再用以分析資料擬訂行銷策略;這樣看來資料探勘跟資料科學已經是「現代行銷學」的一環,作為行銷的工具被使用。
就是聽到這位老師一直講網路爬蟲,當年有位同學跟我還跑去中研院上 Python 網路爬蟲的實作課程。
因此,我覺得有志走「數位行銷」的人,未來除了「消費心理學」、「市場分析」與「產品定位策略 ( STP 分析)」的學習與應用外,也要了解資料探勘與資料科學,至少該知道怎麼在行銷的過程中使用它們,就算自己不會,還能找會的人來協助。
S是市場區隔 (Segmentation)、T是市場目標 (Targeting)、P是市場定位 (Positioning)。
最怕的不是自己不會,而是連這項工具都不知道,那就更別提找人來協助了。
就創業家來說,初期的「 STP 分析」很重要,至於要不要做「數位行銷」就看所屬產業是否適合。
怎麼講著講著就從資料探勘跟資料科學講到數位行銷了,但在這個領域它們確實有很大的施展空間,一門學科能蓬勃發展那肯定是有了適合生長的土壤。
在數據爆炸的時代,能妥善應用的人就會脫穎而出。
說到雲端運算,從十幾年前就已經有人提出相關概念,當時也有廠商提出相關產品;但多年前的基礎設施還不完善,網路速度也不夠快,也缺乏基於「雲端應用軟體」;再加上人們的使用習慣一時間無法轉換過來,導致早期推出產品的廠商都死在沙灘上。
來到智慧型手機的時代,人們慢慢習慣透過網際網路處理各種事務,這也給予「雲端服務」成長的動能,不管是 Google 推出的各式免費雲端服務 (包含電子信箱、行事曆、地圖導覽等),或是把線下服務搬到線上的網路銀行、電商及外送等,加上日漸普及的「電子支付」,都象徵著「雲端服務的輝煌時代」到來。
這也代表要一直新增「雲端伺服器」,相關產業都能分到一杯羹;現在由於生成式 AI 的崛起,「AI 伺服器」的相關產業更是受惠的一方。
本章節重點摘要如下:
「資料探勘 (Data Mining)」是從大數據中尋求與萃取出潛在寶貴資訊與洞察的過程。
「資料科學 (Data Science)」是應用統計學、機器學習或深度學習,及其他方法與技巧來試圖了解資料,從中萃取意義,並據以做出預測的一門學科。
搜尋引擎的大部分工作是為查詢做好準備,把頁面資訊儲存及整理在伺服器上:使用「網路爬蟲 (web crawler) 」掃瞄網頁,把重要內容儲存於一資料庫中,以便能夠快速回應後續的查詢。
搜尋結果是根據一個「預先運算」的快取頁面資訊索引,不是即時的網際網路頁面搜尋。
以瀏覽器為基礎 (Browser-based) 的系統的反應速度可以媲美以個人電腦為基礎 (Desktop-based)的系統,並且讓你可以從任何地方存取資料。
「雲端運算」的優點很多,它們供應的軟體總是最新的,資訊儲存於專業管理有大容量的伺服器上,客戶資料隨時都有備份;一份文件只有一個版本,不會發生同一份文件在不同的電腦上可能有不一致版本的情形。
沒有留言:
張貼留言