在IT領(lǐng)域,炒作越大,誤解越多,數(shù)據(jù)分析也不例外。分析是當(dāng)今信息技術(shù)最熱門的方面之一,可以帶來巨大的商業(yè)收益,但錯(cuò)誤的觀念可能會(huì)阻礙分析能力順利和及時(shí)的流轉(zhuǎn),從而使商業(yè)用戶和最終客戶受益。當(dāng)企業(yè)創(chuàng)建或擴(kuò)大他們的分析戰(zhàn)略時(shí),以下是他們可能要記住的誤區(qū)。
誤區(qū)1:數(shù)據(jù)分析需要重大投資
這些天來,似乎每一項(xiàng)技術(shù)努力都必須經(jīng)過健全性財(cái)務(wù)的過濾。當(dāng)IT和業(yè)務(wù)經(jīng)理提議啟動(dòng)一個(gè)項(xiàng)目或部署一個(gè)新的工具時(shí),"它將花費(fèi)多少錢?"是他們首先得到的問題之一。
有些人認(rèn)為,數(shù)據(jù)分析本質(zhì)上是一項(xiàng)昂貴的工作,因此只限于擁有大額預(yù)算或大量?jī)?nèi)部資源的組織。但并不是所有的數(shù)據(jù)分析工作都需要重大投資,移動(dòng)和在線房地產(chǎn)服務(wù)提供商Trulia的工程副總裁Deep Varma說。
"現(xiàn)在市場(chǎng)上有很多開源以及其他工具,可以幫助你開始展示數(shù)據(jù)分析的價(jià)值,"Varma說。"你需要對(duì)你的內(nèi)部數(shù)據(jù)存儲(chǔ)以及你要解決的問題有一個(gè)很好的了解。云計(jì)算也讓你很容易嘗試分析解決一個(gè)商業(yè)問題"。
現(xiàn)代分析"基于云系統(tǒng)和大數(shù)據(jù)架構(gòu),顧名思義,比傳統(tǒng)的數(shù)據(jù)倉庫系統(tǒng)要便宜不少,"咨詢公司EY的分析學(xué)全球領(lǐng)導(dǎo)人Beatriz Sanz Saiz補(bǔ)充說。
"另外,數(shù)據(jù)和分析的應(yīng)用通常是為了實(shí)現(xiàn)三個(gè)結(jié)果:提高流程效率、收入增長(zhǎng)和主動(dòng)風(fēng)險(xiǎn)管理,"Saiz說。"所以總的來說,數(shù)據(jù)和分析的應(yīng)用給任何公司都帶來了巨大的成本效益。"
誤區(qū)2:您需要大數(shù)據(jù)來執(zhí)行分析
對(duì)許多人來說,大數(shù)據(jù)和分析的概念是相輔相成的。他們的想法是,企業(yè)在進(jìn)行分析之前需要收集大量的數(shù)據(jù),以產(chǎn)生商業(yè)洞察力,改善決策等。
當(dāng)然,大數(shù)據(jù)分析的好處已經(jīng)被充分證實(shí),擁有資源的公司確實(shí)可以通過利用其數(shù)據(jù)存儲(chǔ)作為分析工作的一部分來獲得巨大的競(jìng)爭(zhēng)優(yōu)勢(shì)。但認(rèn)為大數(shù)據(jù)是分析工作的必要條件的想法并不正確。
"很多時(shí)候,人們?cè)噲D捕捉盡可能多的數(shù)據(jù);他們聽到'大數(shù)據(jù)'就會(huì)感到興奮,"人事公司Allegis Global Solutions的商業(yè)智能執(zhí)行總監(jiān)Tim Johnson說。"人們的誤解是,數(shù)據(jù)越多越好,機(jī)器會(huì)把它全部整理出來。"
然而,分析師需要的不是更多的數(shù)據(jù),而是具體的數(shù)據(jù)。"約翰遜說:"95%的用戶正在尋找與他們的工作相關(guān)的信息,并支持決策和改善績(jī)效。與其關(guān)注更多的數(shù)據(jù),企業(yè)必須考慮業(yè)務(wù)用戶,不僅要確定他們需要訪問什么數(shù)據(jù),還要確定數(shù)據(jù)的呈現(xiàn)方式。"
約翰遜說:"以多種格式提供對(duì)每一點(diǎn)信息的訪問可能會(huì)讓人不知所措,而且實(shí)際上會(huì)扼殺采用。"相反,要找出什么對(duì)他們來說是重要的,以及你如何以最簡(jiǎn)單的格式向他們展示這些信息"。
誤區(qū)3:分析消除了人為偏見
自動(dòng)化系統(tǒng)的執(zhí)行方式不應(yīng)該是有偏見的。但技術(shù)是由人類建立的,所以消除所有偏見幾乎是不可能的。有些人認(rèn)為分析和機(jī)器學(xué)習(xí)消除了人類的偏見。
"不幸的是,這完全不是事實(shí),"全球技術(shù)咨詢公司ThoughtWorks的技術(shù)主管邁克-梅森說。"算法和分析是使用'訓(xùn)練數(shù)據(jù)'進(jìn)行調(diào)整的,并且會(huì)重現(xiàn)訓(xùn)練數(shù)據(jù)所具有的任何特征。"
梅森說,在某些情況下,這將給分析結(jié)果帶來良性偏差;在其他情況下,則會(huì)出現(xiàn)更嚴(yán)重的偏差。"他說:"僅僅因?yàn)?算法這么說'并不意味著答案是公平或有用的。
誤區(qū)4:好的算法總是贏家
實(shí)際上,事實(shí)證明,只要有足夠的數(shù)據(jù),"有時(shí)算法并不重要",梅森說。在他引用的一篇IEEE文章"數(shù)據(jù)的不合理的有效性"中,谷歌工程師認(rèn)為,簡(jiǎn)單的統(tǒng)計(jì)模型,加上極其大量的數(shù)據(jù),比包含大量特征和總結(jié)的"智力超群"的模型取得更好的結(jié)果。
"在某些情況下,只要壓縮更大的數(shù)據(jù)堆就能取得好的結(jié)果,"梅森說。
誤區(qū)5:算法是故障安全的
約翰遜說,人們固有的對(duì)統(tǒng)計(jì)模型和算法的信任程度很高,而且隨著企業(yè)建立他們的分析項(xiàng)目,他們?cè)絹碓揭蕾噺?fù)雜的模型來支持決策。
"因?yàn)槿藗儾涣私饽P?、算法和其他先進(jìn)的數(shù)據(jù)科學(xué)實(shí)踐,所以他們對(duì)它們信任,"約翰遜說。用戶不覺得他們有知識(shí)來挑戰(zhàn)這些模型,所以他們必須相信建立這些模型的"聰明人",他說。
"在過去的50到60年里,我們聽說人工智能將在20年內(nèi)接管這一切,而且我們將繼續(xù)聽到人們這樣說,"約翰遜說。"在我們可以公然相信機(jī)器學(xué)習(xí)和結(jié)果之前,還有很多地方需要覆蓋。在此之前,我們需要挑戰(zhàn)那些建立算法和模型的人,讓他們解釋答案是如何得出的。這并不是說我們不能依賴結(jié)果;而是說我們需要透明度,以便我們能夠信任和驗(yàn)證分析結(jié)果。
誤區(qū)6:數(shù)據(jù)科學(xué)是一門神秘的"黑色藝術(shù)"
近年來,數(shù)據(jù)科學(xué)這門學(xué)科受到了很多關(guān)注,有時(shí)會(huì)讓人對(duì)它到底是什么產(chǎn)生混淆。基本上,它涉及使用算法來尋找數(shù)據(jù)中的模式。
"數(shù)據(jù)科學(xué)似乎很神秘,因?yàn)檫@些算法能夠分析更多的變量和更大的數(shù)據(jù)集,而不是人的大腦所能理解的,"數(shù)據(jù)存儲(chǔ)公司美光的首席信息官Trevor Schulze說。
"Schulze說:"隨著近年來計(jì)算能力和內(nèi)存的擴(kuò)展,我們現(xiàn)在能夠快速解決那些在10年前用任何技術(shù)都無法解決的問題。"數(shù)據(jù)科學(xué)是統(tǒng)計(jì)推理技術(shù)的自然演變,這些技術(shù)幾十年來一直被人們所熟知。一旦你理解了數(shù)學(xué),數(shù)據(jù)科學(xué)就沒有什么神秘的。
誤區(qū)7:要做更多的數(shù)據(jù)科學(xué),你需要更多的數(shù)據(jù)科學(xué)家
數(shù)據(jù)科學(xué)家是如今所有技術(shù)專業(yè)人員中需求量大的。如果他們重新指導(dǎo)他們的工作內(nèi)容,也許組織可以用更少的這些專業(yè)人員。
"梅森說:"很多數(shù)據(jù)科學(xué)家的時(shí)間都花在了非增值活動(dòng)上,比如尋找數(shù)據(jù)集,把數(shù)據(jù)帶到可以工作的地方,以及轉(zhuǎn)換和清理數(shù)據(jù)。"鑒于雇用數(shù)據(jù)科學(xué)家有多難,這些低價(jià)值的任務(wù)并不是你希望他們從事的。
"Uber的米開朗基羅平臺(tái)允許數(shù)據(jù)科學(xué)家專注于特征工程、提取和分析,而不是到處搬運(yùn)數(shù)據(jù),因此允許他們大規(guī)模地提高生產(chǎn)力,"梅森說。
誤區(qū)8:分析時(shí)間太長(zhǎng)
如今,快速完成工作——無論是將產(chǎn)品或服務(wù)推向市場(chǎng),還是近乎實(shí)時(shí)地回應(yīng)客戶的詢問,都是公司的一個(gè)重要競(jìng)爭(zhēng)考慮。分析聽起來像是需要很長(zhǎng)時(shí)間才能完成的事情,與實(shí)現(xiàn)速度和敏捷性的目標(biāo)相悖。
Saiz說:"仍然存在這樣的神話,即這些類型的項(xiàng)目需要太長(zhǎng)的時(shí)間,而且相當(dāng)復(fù)雜。"在一天結(jié)束時(shí),你會(huì)發(fā)現(xiàn)這一切都與人才有關(guān)。有了正確的技能組合和敏捷方法的應(yīng)用,大問題可以在幾天或幾周內(nèi)得到解答,而不是幾個(gè)月。"
誤區(qū)9:技術(shù)是困難的部分
隨著當(dāng)今可用技術(shù)數(shù)量的不斷增加,選擇正確的工具組合來部署和集成以從分析團(tuán)隊(duì)獲得所需的結(jié)果并不是一件容易的事,咨詢公司ISG的IT采購和數(shù)字咨詢服務(wù)總監(jiān)James Burke說。
然而,真正困難的部分是"將組織結(jié)構(gòu)和運(yùn)營(yíng)模式放在一起,將人員,流程,技術(shù)角度所需的所有內(nèi)容放在一起,"Burke說。"此外,你如何在現(xiàn)有組織內(nèi)部或'旁邊'做到這一點(diǎn),對(duì)于組織來說似乎是最困難的。
同樣重要的是,不要假設(shè)分析工具將完成所有工作。"僅靠技術(shù)永遠(yuǎn)無法解決任何業(yè)務(wù)問題,"咨詢公司W(wǎng)est Monroe技術(shù)實(shí)踐的高級(jí)主管Greg Layok說。"在急于創(chuàng)建數(shù)據(jù)湖的過程中,組織反而陷入了沼澤,或者這可能是任何人都難以弄清楚的信息泥沼。
技術(shù)并不能解決分析問題,Layok說。"首先,確定一個(gè)業(yè)務(wù)問題,然后問,'我需要什么數(shù)據(jù)來解決這個(gè)問題?'"他說。"這將幫助您識(shí)別組織內(nèi)的數(shù)據(jù)差距。"
誤區(qū)10:數(shù)據(jù)分析應(yīng)該是一個(gè)獨(dú)立的部門
咨詢和數(shù)據(jù)收集公司Delvinia的總裁兼首席創(chuàng)新官Steven Mast說,在一些組織中,數(shù)據(jù)分析作為一個(gè)部門獨(dú)立運(yùn)作,而在其他組織中,它被深深嵌入到一個(gè)跨職能的團(tuán)隊(duì)中。
"馬斯特說:"然而,鑒于所有業(yè)務(wù)領(lǐng)域的數(shù)據(jù)爆炸和變化的速度,部門模式是行不通的。"隨著組織變得更加以客戶為中心,數(shù)據(jù)驅(qū)動(dòng)的分析專家應(yīng)該是一個(gè)業(yè)務(wù)部門的核心,而不是作為一個(gè)你打電話尋求支持的部門來運(yùn)作。"
馬斯特說,今天組織面臨的許多復(fù)雜問題都在業(yè)務(wù)部門內(nèi),而這些問題的許多解決方案都隱藏在數(shù)據(jù)中。"數(shù)據(jù)科學(xué)家和專家,與這些業(yè)務(wù)部門密切合作,并使用大型數(shù)據(jù)集和人工智能,將是孵化下一代產(chǎn)品、服務(wù)和客戶體驗(yàn)的關(guān)鍵。"
誤區(qū)11:分析只適合博士
分析團(tuán)隊(duì)中有很多受過良好教育的人是很好的,但這并不是成功的要求。
"公司傾向于認(rèn)為,如果沒有博士加入,他們將無法進(jìn)行一流的分析,"Saiz說。"現(xiàn)代分析需要融合各種技能——那些對(duì)新興技術(shù)和開源軟件很精通的人。建立具有不同技能的'豆莢'包括大數(shù)據(jù)架構(gòu)師、數(shù)據(jù)工程師、數(shù)據(jù)科學(xué)家、數(shù)據(jù)可視化專家等等,這才是最重要的。"
誤區(qū)12:人工智能將摧毀就業(yè),破壞經(jīng)濟(jì)
歷史上,新技術(shù)的引入擾亂了許多工作和行業(yè),人們擔(dān)心人工智能將消除對(duì)人執(zhí)行某些任務(wù)的需求。
"人工智能解決方案在解決某些種類的問題方面比人要好得多,"舒爾茨說。"人工智能可以讀得更快,記得更多,計(jì)算復(fù)雜的數(shù)學(xué)關(guān)系比任何一個(gè)人都好。然而,人工智能沒有能力處理真正新穎的情況,而這正是人類擅長(zhǎng)的地方。"
舒爾茨說,可以肯定的是,某些工作已經(jīng)因人工智能的發(fā)展而失去或減少,其他工作也將隨之而來。"他說:"但是,我們?nèi)祟惱斫夂吞幚硗耆豢深A(yù)見的情況的能力不會(huì)被任何目前理解的人工智能技術(shù)所取代。"在可預(yù)見的未來,對(duì)人工智能最有效的方法將是用人工智能系統(tǒng)增強(qiáng)人類的能力,執(zhí)行一些算法優(yōu)于人的'重活'。雖然許多工作將因人工智能而改變,但人將繼續(xù)是這個(gè)商業(yè)生態(tài)系統(tǒng)的關(guān)鍵部分。"