什么是大數(shù)據(jù)?
大數(shù)據(jù)是指以不斷增長的速度增長的龐大而多樣化的信息集。它包括信息量,創(chuàng)建和收集信息的速度或速度,以及所涵蓋的數(shù)據(jù)點的種類或范圍(稱為大數(shù)據(jù)的“三個v”)。大數(shù)據(jù)通常來自數(shù)據(jù)挖掘,并以多種格式到達。
關(guān)鍵要點
大數(shù)據(jù)是大量多樣化的信息,其到達量越來越大,速度越來越快。
大數(shù)據(jù)可以是結(jié)構(gòu)化的(通常是數(shù)字的,易于格式化和存儲)或非結(jié)構(gòu)化的(更自由的形式,更難量化)。
公司中幾乎每個部門都可以利用大數(shù)據(jù)分析的結(jié)果,但處理其混亂和噪音可能會帶來問題。
大數(shù)據(jù)可以從社交網(wǎng)絡(luò)和網(wǎng)站上的公開共享評論中收集,從個人電子產(chǎn)品和應(yīng)用程序中自愿收集,通過問卷調(diào)查、產(chǎn)品購買和電子簽到。
大數(shù)據(jù)通常存儲在計算機數(shù)據(jù)庫中,并使用專門設(shè)計用于處理大型復(fù)雜數(shù)據(jù)集的軟件進行分析。1
大數(shù)據(jù)的工作原理
大數(shù)據(jù)可以分為非結(jié)構(gòu)化或結(jié)構(gòu)化。結(jié)構(gòu)化數(shù)據(jù)由組織已在數(shù)據(jù)庫和電子表格中管理的信息組成;它通常是數(shù)字性質(zhì)的。非結(jié)構(gòu)化數(shù)據(jù)是無組織的,不屬于預(yù)定模型或格式的信息。它包括從社交媒體來源收集的數(shù)據(jù),這些數(shù)據(jù)有助于機構(gòu)收集有關(guān)客戶需求的信息。
大數(shù)據(jù)可以從社交網(wǎng)絡(luò)和網(wǎng)站上的公開共享評論中收集,從個人電子產(chǎn)品和應(yīng)用程序中自愿收集,通過問卷調(diào)查、產(chǎn)品購買和電子簽到。智能設(shè)備中傳感器和其他輸入的存在允許在廣泛的情況和情況下收集數(shù)據(jù)。
大數(shù)據(jù)通常存儲在計算機數(shù)據(jù)庫中,并使用專門設(shè)計用于處理大型復(fù)雜數(shù)據(jù)集的軟件進行分析。許多軟件即服務(wù) (SaaS) 公司專門管理此類復(fù)雜數(shù)據(jù)。
大數(shù)據(jù)的類型
大數(shù)據(jù)基本上分為三種類型:
結(jié)構(gòu)化數(shù)據(jù)
非結(jié)構(gòu)化數(shù)據(jù)
半結(jié)構(gòu)化數(shù)據(jù)
大數(shù)據(jù)的用途
數(shù)據(jù)分析師查看不同類型的數(shù)據(jù)(如人口統(tǒng)計數(shù)據(jù)和購買歷史記錄)之間的關(guān)系,以確定是否存在相關(guān)性。此類評估可以在內(nèi)部或外部由第三方完成,該第三方專注于將大數(shù)據(jù)處理成可消化的格式。企業(yè)經(jīng)常使用此類專家對大數(shù)據(jù)的評估將其轉(zhuǎn)化為可操作的信息。
許多公司,如Alphabet和Meta(前身為Facebook),使用大數(shù)據(jù)通過向社交媒體上的用戶和網(wǎng)上沖浪的用戶投放有針對性的廣告來產(chǎn)生廣告收入。
公司幾乎每個部門都可以利用數(shù)據(jù)分析的結(jié)果,從人力資源和技術(shù)到營銷和銷售。大數(shù)據(jù)的目標是提高產(chǎn)品進入市場的速度,減少獲得市場采用、目標受眾所需的時間和資源,并確??蛻舯3譂M意。
大數(shù)據(jù)的優(yōu)缺點
可用數(shù)據(jù)量的增加既帶來了機遇,也帶來了問題。一般來說,擁有更多關(guān)于客戶(和潛在客戶)的數(shù)據(jù)應(yīng)該可以讓公司更好地定制產(chǎn)品和營銷工作,以創(chuàng)造最高水平的滿意度和回頭客。收集大量數(shù)據(jù)的公司有機會進行更深入、更豐富的分析,以造福所有利益相關(guān)者。
隨著當今個人可用的個人數(shù)據(jù)量增加,公司采取措施保護這些數(shù)據(jù)至關(guān)重要;這個話題已成為當今網(wǎng)絡(luò)世界的熱門爭論,尤其是在過去幾年中公司經(jīng)歷了許多數(shù)據(jù)泄露的情況下。
雖然更好的分析是積極的,但大數(shù)據(jù)也會產(chǎn)生過載和噪音,降低其實用性。公司必須處理更多的數(shù)據(jù),并確定哪些數(shù)據(jù)代表信號而不是噪聲。決定什么使數(shù)據(jù)相關(guān)成為一個關(guān)鍵因素。
此外,在對數(shù)據(jù)采取行動之前,可能需要對數(shù)據(jù)的性質(zhì)和格式進行特殊處理。由數(shù)值組成的結(jié)構(gòu)化數(shù)據(jù)可以輕松存儲和排序。非結(jié)構(gòu)化數(shù)據(jù)(如電子郵件、視頻和文本文檔)可能需要應(yīng)用更復(fù)雜的技術(shù)才能發(fā)揮作用。
大數(shù)據(jù)的重要性
大數(shù)據(jù)很重要,因為人們可以從任何來源獲取數(shù)據(jù),并對其進行分析以找到答案,從而降低成本,減少時間,新產(chǎn)品開發(fā)和優(yōu)化產(chǎn)品以及明智的決策。
一些企業(yè)使用其系統(tǒng)中收集的大數(shù)據(jù)技術(shù)來改善運營,提供更好的客戶服務(wù),提高盈利能力,并根據(jù)特定的客戶偏好創(chuàng)建修改后的營銷活動。而且,當將大數(shù)據(jù)分析與高性能分析相結(jié)合時,您可以完成與業(yè)務(wù)相關(guān)的任務(wù),如下所示:
近乎實時地定義故障、爭議和缺陷的根本原因。
根據(jù)客戶的購買習慣在銷售點創(chuàng)建門票或代金券。
在幾分鐘內(nèi)評估整個風險組合。
在虛假績效影響您的組織之前識別它。