主页 > T吃生活 >《云端时代的杀手级应用:Big Data 海量资料分析》:海 >

精选文章


随机推荐


《云端时代的杀手级应用:Big Data 海量资料分析》:海


2020-06-10


《云端时代的杀手级应用:Big Data 海量资料分析》:海

Photo from Flickr CC by MIKI Yoshihito
试读连结

你知道我们每天使用的Facebook、YouTube、Twitter,可以产生多少的资料量吗?根据联合国「全球脉动」(UN Global Pulse)研究计划,社群媒体网站每天产生2.5艾位元组(EB)的资料。也许你无法想像资料量的庞大,简单用DVD容量来解释,1EB约等于2亿5400万张的DVD光碟的容量,如此就能够了解,其实我们已进入资讯爆炸的时代。

《云端时代的杀手级应用:Big Data 海量资料分析》这本书讲述得是在资讯爆炸的时代里,以往那些无法处理的半结构或非结构化资料,如何被分析成有用的资讯,并进一步应用。这不是一本讲述技术的书,而更着重在各产业的应用层面。

有程式设计概念的读者,想必对于结构化资料与非结构化资料应很熟悉,简言之,结构化资料就是那些能被放进资料库栏位里的固定格式,大多是数字、英文字母等。非结构化资料,就好比部落格里的文章、与客户来往的e-mail、YouTube上的影音档等,没有固定格式的资料。如此一来,便能很快速简单的理解,其实大部分产生出来的资料是非结构化的。

也许你仍感觉不到自己每天其实是海量资料的製造者之一,举几个本书中的数据也许能较明白。「一分钟之内,Facebook可以产生超过68万条内容、一分钟之内,全球有超过27万美元的网路购物交易、一分钟之内,Flickr用户分享了3125张照片……」。依照这些数据,我开始回想自己一天的开始,到底产生的多少资料量?包括在公车上看「脸书」按个讚、透过App订电影票、进办公室前打开电脑收发电子邮件、在MSN上回覆客户的讯息、到Twitter祝贺好友生日。原来,这些看似日常生活的琐事,其实每一个动作都在不断的产生新的资料量。

我们不断的製造大量的资料,而这些资料能为我们做什幺?能帮助我们什幺?作者胡世忠在这本书里收集了各式各样产业应用层面,例如:有效挖掘资料、分析资料可以降低美国纽约市的犯罪率?透过分析手机SIM卡讯号,可以提高救灾难的援效率?这些都是分析庞大资料所带来的效益。

举例来说,书中提到,美国纽约市警局透过收集在全纽约76个警区电话和传真的数据资料,进行系统分析后,将最新案件标示在各辖区地图上的位置与代表的意义,再发布给全纽约的警局指挥官,去进行未来因应对策及警力的调配模拟,如此隔年就使得兇杀案下降了25%,车辆窃盗案下降了24%。

澳洲老牌维吉酱为了能再创品牌新生命,透过分析10.5亿条社群媒体的讯息、以及47.9万条在论坛与讨论区的资讯,找到使用者最爱的新吃法,而成功让销量大增,还促使澳洲妈妈一次购买2罐维吉酱。

分析海量数据不但能找到目标客户群,还能精準行销。甚至帮助即时救援,书中提及,在2010年海地大地震,联合国就追蹤海地人所持手机内部的SIM卡,分析出60万名海地人逃离太子港之后的目的地,以达到即时救援,后来也是再次透过SIM卡追蹤,把药品投放到正确地点,成功的阻止了疫情的蔓延。

原来我们每天按讚、PO照片、贴文等行为,都可以被拿来分析。其实写到这里,不禁让我想起《全民公敌》的电影情节,在资讯时代里,我们的一举一动都不断因产生资料而被记录着,举凡信用卡刷卡金额、购物的品项、浏览网页的记录、朋友分享的照片等。也正如书中最终提出的反思,海量资料是否如乔治欧威尔在《一九八四》科幻小说里所描述的「老大哥」那样,监控着人们、毫无隐私可言?

虽然作者在书中坦言,政府或企业若运用海量资料不当,稍一不慎的确与老大哥只有一步之差,但也不能因此而忽略了海量资料可能为医疗、公共安全领域带来的社会益处。即使可能会产生「数位监控」的疑虑,作者仍勇敢的提出其观点,作者无非是要主张,科技在人类文明演化过程里的助益,海量资料其实是帮助国家、社会、企业寻找新价值,并以「科技中立」的论调作为本书之结尾。

本文同步刊登于《数位时代》週末书介专栏



上一篇:
下一篇: