返回首頁
|
經參·財智
|
經參·思想
|
經參·讀書
設為首頁
|
加入收藏
經濟參考網讀書頻道
大數據,大挑戰
大數據的核心代表著我們分析信息時的三個轉變。這些轉變將改變我們理解和組建社會的方法。 第一個轉變就是,在大數據時代,我們可以分析更多的數據,有時候甚至可以處理和某個特別現象相關的所有數據,而不再依賴于隨機采樣。這部分內容將在第1 章闡述。19 世紀以來,當面臨大量數據時,社會都依賴于采樣分析。但是采樣分析是信息缺乏時代和信息流通受限制的模擬數據時代的產物。以前我們通常把這看成了理所當然的限制,但高性能數字技術的流行讓我們意識到,這其實是一種人為的限制。與局限在小數據范圍相比,使用一切數據為我們帶來了更高的精確性,也讓我們看到了一些以前無法發現的細節——大數據讓我們更清楚地看到了樣本無法揭示的細節信息。第二個改變就是,研究數據如此之多,以至于我們不再熱衷于追求精確度。這部分內容將在第2 章闡述。當我們測量事物的能力受限時,關注最重要的事情和獲取最精確的結果是可取的。如果購買者不知道牛群里有80 頭牛還是100 頭牛,那么交易就無法進行。直到今天,我們的數字技術依然建立在精準的基礎上。我們假設只要電子數據表格把數據排序,數據庫引擎就可以找出和我們檢索的內容完全一致的檢索記錄。 這種思維方式適用于掌握“小數據量”的情況,因為需要分析的數據很少,所以我們必須盡可能精準地量化我們的記錄。在某些方面,我們已經意識到了差別。例如,一個小商店在晚上打烊的時候要把收銀臺里的每分錢都數清楚,但是我們不會、也不可能用“分”這個單位去精確計算國民生產總值。隨著規模的擴大,對精確度的癡迷將減弱。 達到精確需要有專業的數據庫。針對小數據量和特定事情,追求精確性依然是可行的,比如一個人的銀行賬戶上是否有足夠的錢開具支票。但是,在這個大數據時代,在很多時候,追求精確度已經變得不可行,甚至不受歡迎了。當我們擁有海量即時數據時,絕對的精準不再是我們追求的主要目標。大數據紛繁多樣,優劣摻雜,分布在全球多個服務器上。擁有了大數據,我們不再需要對一個現象刨根究底,只要掌握大體的發展方向即可。當然,我們也不是完全放棄了精確度,只是不再沉迷于此。適當忽略微觀層面上的精確度會讓我們在宏觀層面擁有更好的洞察力。 第三個轉變因前兩個轉變而促成,即我們不再熱衷于尋找因果關系。這部分內容將在第3 章闡述。尋找因果關系是人類長久以來的習慣。即使確定因果關系很困難而且用途不大,人類還是習慣性地尋找緣由。相反,在大數據時代,我們無須再緊盯事物之間的因果關系,而應該尋找事物之間的相關關系,這會給我們提供非常新穎且有價值的觀點。相關關系也許不能準確地告知我們某件事情為何會發生,但是它會提醒我們這件事情正在發生。在許多情況下,這種提醒的幫助已經足夠大了。 如果電子醫療記錄顯示橙汁和阿司匹林的特定組合可以治療癌癥,那么找出具體的致病原因就沒有這種治療方法本身來得重要。同樣,只要我們知道什么時候是買機票的最佳時機,就算不知道機票價格瘋狂變動的原因也無所謂了。大數據告訴我們“是什么”而不是“為什么”。在大數據時代,我們不必知道現象背后的原因,我們只要讓數據自己發聲。 我們不再需要在還沒有收集數據之前,就把我們的分析建立在早已設立的少量假設的基礎之上。讓數據發聲,我們會注意到很多以前從來沒有意識到的聯系的存在。 當然,人類從數千年前就開始分析數據。古代美索不達米亞平原的記賬人員為了有效地跟蹤記錄信息發明了書寫。自從圣經時代開始,政府就通過進行人口普查來建立大型的國民數據庫。兩百多年來,精算師們也一直通過搜集大量的數據來進行風險規避。 模擬時代的數據收集和分析極其耗時耗力,新問題的出現通常要求我們重新收集和分析數據。數字化的到來使得數據管理效率又向前邁出了重要的一步。數字化將模擬數據轉換成計算機可以讀取的數字數據,使得存儲和處理這些數據變得既便宜又容易,從而大大提高了數據管理效率。過去需要幾年時間才能完成的數據搜集,現在只要幾天就能完成。但是,光有改變還遠遠不夠。數據分析者太沉浸于模擬數據時代的設想,即數據庫只有單一的用途和價值,而正是我們使用的技術和方法加深了這種偏見。雖然數字化是促成向大數據轉變的重要原因,但僅有計算機的存在卻不足以實現大數據。 我們沒有辦法準確描述現在正在發生的一切,但是在第4 章即將提到的“數據化”概念可以幫助我們大致了解這次變革。數據化意味著我們把一切都透明化,甚至包括很多我們以前認為和“信息”根本搭不上邊的事情。比方說,一個人所在的位置、引擎的振動、橋梁的承重等。我們要通過量化的方法把這些內容轉化為數據。這就使得我們可以嘗試許多以前無法做到的事情,如根據引擎的散熱和振動來預測引擎是否會出現故障。這樣,我們就激發出了這些數據此前未被挖掘的潛在價值。 大數據時代開啟了一場尋寶游戲,而人們對于數據的看法以及對于由因果關系向相關關系轉化時釋放出的潛在價值的態度,正是主宰這場游戲的關鍵。新興技術工具的使用使這一切成為可能。寶貝不止一件,每個數據集內部都隱藏著某些未被發掘的價值。這場發掘和利用數據價值的競賽正開始在全球上演。 第5 章和第6 章將講述大數據如何改變了商業、市場和社會的本質。20世紀,價值已經從實體基建轉變為無形財產,從土地和工廠轉變為品牌和產權。如今,一個新的轉變正在進行,那就是電腦存儲和分析數據的方法取代電腦硬件成為了價值的源泉。數據成為了有價值的公司資產、重要的經濟投入和新型商業模式的基石。雖然數據還沒有被列入企業的資產負債表,但這只是一個時間問題。 雖然有些數據處理技術已經出現了一段時間, 但是它們只為調查局、研究所和世界上的一些巨頭公司所掌握。沃爾瑪和美國第一資本銀行(CapitalOne)率先將大數據運用在了零售業和銀行業,因此改變了整個行業。如今這種技術大多都實現了大眾化。大數據對個人的影響是最驚人的。在一個可能性和相關性占主導地位的世界里,專業性變得不那么重要了。行業專家不會消失,但是他們必須與數據表達的信息進行博弈。如同在電影《點球成金》(Moneyball)里,棒球星探們在統計學家面前相形見拙——直覺的判斷被迫讓位于精準的數據分析。這將迫使人們調整在管理、決策、人力資源和教育方面的傳統理念。 我們大部分的習俗和慣例都建立在一個預設好的立場上,那就是我們用來進行決策的信息必須是少量、精確并且至關重要的。但是,當數據量變大、數據處理速度加快,而且數據變得不那么精確時,之前的那些預設立場就不復存在了。此外,因為數據量極為龐大,最后做出決策的將是機器而不是人類自己。第7 章將會討論大數據的負面影響。 在了解和監視人類的行為方面,社會已經有了數千年的經驗。但是,如何來監管一個算法系統呢?在信息化時代的早期,有一些政策專家就看到了信息化給人們的隱私權帶來的威脅,社會也已經建立起了龐大的規則體系來保障個人的信息安全。但是在大數據時代,這些規則都成了無用的馬其諾防線。人們自愿在網絡上分享信息,而這種分享的能力成為了網絡服務的一個中心特征,而不再是一個需要規避的薄弱點了。 對我們而言,危險不再是隱私的泄露,而是被預知的可能性——這些能預測我們可能生病、拖欠還款和犯罪的算法會讓我們無法購買保險、無法貸款、甚至在實施犯罪前就被預先逮捕。顯然,統計把大數據放在了首位,但即便如此,個人意志是否應該凌駕于大數據之上呢?就像出版印刷行業的發展推動國家立法保護言論自由(在此之前沒有出臺類似法律的必要,因為沒有太多的言論需要保護),大數據時代也需要新的規章制度來保衛權勢面前的個人權利。 政府機構和社會在控制和處理數據的方法上必須有多方位的改變。不可否認,我們進入了一個用數據進行預測的時代,雖然我們可能無法解釋其背后的原因。如果一個醫生只要求病人遵從醫囑,卻沒法說明醫學干預的合理性的話,情況會怎么樣呢?實際上,這是依靠大數據取得病理分析的醫生們一定會做的事情。還有司法系統的“合理證據”是不是應該改為“可能證據”呢?如果真是這樣,會對人類自由和尊嚴產生什么影響呢? 我們在大數據時代倡導的一系列規范將在第8 章進行介紹。這些規范建立在我們很熟悉的“小數據”時代發展并保留下來的規范的基礎之上。新環境要求舊規范與時俱進。 大數據標志著人類在尋求量化和認識世界的道路上前進了一大步。過去不可計量、存儲、分析和共享的很多東西都被數據化了。擁有大量的數據和更多不那么精確的數據為我們理解世界打開了一扇新的大門。社會因此放棄了尋找因果關系的傳統偏好,開始挖掘相關關系的好處。 尋找原因是一種現代社會的一神論,大數據推翻了這個論斷。但我們又陷入了一個歷史的困境,那就是我們活在一個“上帝已死”的時代。也就是說,我們曾經堅守的信念動搖了。諷刺的是,這些信念正在被“更好”的證據所取代。那么,從經驗中得來的與證據相矛盾的直覺、信念和迷惘應該充當什么角色呢?當世界由探求因果關系變成挖掘相關關系,我們怎樣才能既不損壞建立在因果推理基礎之上的社會繁榮和人類進步的基石,又取得實際的進步呢?本書意在解釋我們身在何處,我們從何而來,并且提供當下亟需的指導,以應對橫在我們眼前的利益和危險。
第
1
2
3
4
5
6
7
8
頁
關于我們
|
版面設置
| 聯系我們 |
媒體刊例
|
友情鏈接
国产精品一区二区三区日韩_欧美一级a爱片免费观看一级_亚洲国产精品久久综合网_人妻中文字幕在线视频二区
亚洲图片中文字幕
|
日本久久精品一区二区三区
|
日本精品一区二区视频
|
午夜性福利网站
|
思思热免费在线视频观看
|
中日韩国内精品视频
|