2022年11月19日 星期六

『普林斯頓最熱門的電腦通識課』資料與資訊

資料探勘」早在十幾年前唸書時就有耳聞,但資料科學倒是近五年來才知道有這門學科。

就我的理解來說,資料探勘就是如何從大量資料中找出有用的資訊,而「資料科學」就是利用這些有用的資訊來做分析,從而達到預測的目的。

網際網路每天都在產生大量的資料,要用人為收集並篩選毫無效率,因此誕生了「網路爬蟲」來自動抓資料,這應該也是早期 Google 在建立搜尋演算法時跟其它公司有所差異的地方,它們的爬蟲跟建立索引的效率比其它搜尋引擎好上不少 (個人猜測)。

話說好幾年前在上「行銷課」時,有位老師超愛講網路爬蟲,然後再用以分析資料擬訂行銷策略;這樣看來資料探勘跟資料科學已經是「現代行銷學」的一環,作為行銷的工具被使用。

就是聽到這位老師一直講網路爬蟲,當年有位同學跟我還跑去中研院上 Python 網路爬蟲的實作課程。

因此,我覺得有志走「數位行銷」的人,未來除了「消費心理學」、「市場分析」與「產品定位策略 STP 分析)」的學習與應用外,也要了解資料探勘與資料科學,至少該知道怎麼在行銷的過程中使用它們,就算自己不會,還能找會的人來協助。

S是市場區隔 (Segmentation)、T是市場目標 (Targeting)、P是市場定位 (Positioning)。

最怕的不是自己不會,而是連這項工具都不知道,那就更別提找人來協助了。 

就創業家來說,初期的「 STP 分析」很重要,至於要不要做「數位行銷」就看所屬產業是否適合。

怎麼講著講著就從資料探勘跟資料科學講到數位行銷了,但在這個領域它們確實有很大的施展空間,一門學科能蓬勃發展那肯定是有了適合生長的土壤。

在數據爆炸的時代,能妥善應用的人就會脫穎而出

說到雲端運算,從十幾年前就已經有人提出相關概念,當時也有廠商提出相關產品;但多年前的基礎設施還不完善,網路速度也不夠快,也缺乏基於「雲端應用軟體」;再加上人們的使用習慣一時間無法轉換過來,導致早期推出產品的廠商都死在沙灘上。

來到智慧型手機的時代,人們慢慢習慣透過網際網路處理各種事務,這也給予「雲端服務」成長的動能,不管是 Google 推出的各式免費雲端服務 (包含電子信箱、行事曆、地圖導覽等),或是把線下服務搬到線上的網路銀行、電商及外送等,加上日漸普及的「電子支付」,都象徵著「雲端服務的輝煌時代」到來。

這也代表要一直新增「雲端伺服器」,相關產業都能分到一杯羹;現在由於生成式 AI 的崛起,「AI 伺服器」的相關產業更是受惠的一方。


本章節重點摘要如下:

資料探勘 (Data Mining)」是從大數據中尋求與萃取出潛在寶貴資訊與洞察的過程。

資料科學 (Data Science)是應用統計學、機器學習或深度學習,及其他方法與技巧來試圖了解資料,從中萃取意義,並據以做出預測的一門學科。

搜尋引擎的大部分工作是為查詢做好準備,把頁面資訊儲存及整理在伺服器上:使用「網路爬蟲 (web crawler) 」掃瞄網頁,把重要內容儲存於一資料庫中,以便能夠快速回應後續的查詢。

搜尋結果是根據一個「預先運算」的快取頁面資訊索引,不是即時的網際網路頁面搜尋。

以瀏覽器為基礎 (Browser-based) 的系統的反應速度可以媲美以個人電腦為基礎 (Desktop-based)的系統,並且讓你可以從任何地方存取資料。

雲端運算」的優點很多,它們供應的軟體總是最新的,資訊儲存於專業管理有大容量的伺服器上,客戶資料隨時都有備份;一份文件只有一個版本,不會發生同一份文件在不同的電腦上可能有不一致版本的情形。

沒有留言:

張貼留言

我的創業筆記 (十二) 合資公司是不是試水溫的好方法?

今天這篇又要聊到我老婆的工作內容了,她今年有關創業方面的內容特別多,所以一再被提及,但就她自己的說法,她並不想創業、她比較想躺平耍廢。 自從健身工作室的經營上軌道後,老婆就沒花費太多額外的精神,反倒是那間進出口公司的老闆非常活躍,衝勁跟野心十足,每天似乎都有新的想法,也搞死她們這...