1995年冬天的一個傍晚,閑來無事的加州理工學院教授斯科特·E·佩吉(Scott E. Page),建立了一個電腦模型,嘗試用“人工代理”來解決難題,“人工代理”是根據設定的代碼命令互動的小型電腦程序。這樣的電腦模擬對經濟學家來說很有價值,因為這些模擬提供了一個可控環境,用于測試人類——這種最難預測的種族——如何在諸如金融市場這樣的復雜系統中互動。
佩吉用兩組人工代理進行模擬。一組代表最完美,最聰明的解決問題者;我們叫它“高智商組”;另外一組代表各種各樣的人,他們解決問題的能力各不相同,有的很有才干,但絕大部分不是這樣。實驗的結果讓佩吉大感驚訝,就好像在某所中等大學的教師休息室里,人們會對“穿棕色襪子”①的人不屑一顧。但實驗結果卻是,“棕色襪子”的表現勝過高智商代理。按理說,一批隨機挑選的數學家怎么會超過高智商中最高智商的人?佩吉決定修改一下他的模擬,改變代理的互動規則,然而,他得到了同樣的結果。對這個結果,佩吉仍持有懷疑態度,他用另一種計算機語言重寫了程序,結果“棕色襪子”還是贏了,一次又一次。
佩吉想知道這是為什么。
就這樣,從一個研究突破開始,佩吉開始了長達十多年的專項研究,這一切在2007年開花結果,他出版了一本書,名為《差異性:多樣性如何塑造更好的組織、公司、學校和社會》。在書中,佩吉運用邏輯句法和數學精度分析了迅速成長的“集體智能”這一領域。據此,佩吉創造了一個理論框架,解釋了為什么群體常常勝過專家。為什么“棕色襪子”能夠持續擊敗高智商代理——“棕色襪子”不如高智商成員那么有才干,但他們有更好的東西:多樣性。
這樣的一些試驗結果奠定了“多樣性勝于能力學說”的理論基礎。在一定的條件下, “一些隨機挑選的解決問題者勝過一群最好的解決問題者!迸寮碚摰暮诵氖牵焊吣芰Φ娜耸
一群同質化的群體,他們當中很多人在同樣的機構里接受培訓,可能擁有相似的觀點,在解
①西方國家認為穿西服配棕色襪子的人很沒有品味,代指在某些方面表現差強人意的人。
決問題時采用同樣的技能或者同樣的研究方法。總體來說,他們的確比大眾優秀,但僅限于某些方面。而許多問題無法僅靠一種思路解決,即使是一組類似的方法也不行。解決這些問題需要“棕色襪子”去嘗試一種“精英”絕對想不到的方法。這種理論不僅是種比喻,也不是那種十年后對錯未定的有趣發現,它是在邏輯上經得住推敲的真理。
理解“集體智能”最重要的是理解認識的多樣化。為了解決問題,預測結果,或者幫助公司制定戰略,需要將大眾的知識利用起來,這類嘗試是眾包最主要的應用之一,集體智能則是其中不可缺少的組成部分。
集體智能是團體認知的一種形式,蟻群行動起來就像是一個器官里的各個細胞,在蟻群中發揮作用的就是團體認知。這點我們還能在人類的選舉中看到:上百萬人的選擇產生一個結果。從20世紀初期開始,社會學,行為心理學,乃至計算機科學的學者們,都開始研究這一現象。但在互聯網出現后,集體智能有了新的用處,原因很簡單,在推動集體智能的發展方面,互聯網居功至偉。
眾包應用“集體智能”主要是通過三種形式,第一是預測市場,或者說信息市場。在這里,投資者根據自己期待的結果,比如總統競選勝出者或者奧斯卡最佳影片的獲勝者,購買某種“期貨”。它的功能很像股票市場:人們開戶后,以現行的市場價格買賣股票。
如果投資者低買(也許“最佳影片”有黑馬入圍),一旦他猜對了,就能大撈一筆。比如,判斷2008年美國大選占上風的黨派,最好的方法不是根據票數,也不是威望,而是《Slate》雜志上的圖表,它反映的是候選人在預測網站Intrade的期貨市場上的相對價格。(Intrade顯示,在2008年2月,首輪投票選舉的星期二后,巴拉克·奧巴馬領先于希拉里·克林頓,全國投票幾周前,奧巴馬的財富有所增加)。
第二種形式,是解決問題,或者叫眾播①。需要幫助的人將問題在網絡上公開,這樣問題就會被一些身份無法確定,但可能幫得上忙的人看到!皠撔轮行摹本褪且粋這樣的例子,它擁有分散在各地的14萬名科學家,為世界500強公司解決棘手的研發問題。
第三類是“點子匯”,基本上類似于網上的集體討論會,只不過要花幾周時間而非幾個小時!包c子匯”和眾包很像,只是前者對提交內容的要求更為開放。這些點子不是為了解決某個特定的問題,而是用于創新。有人指出,這就像互聯網上的建議箱,僅此而已。但并不是互聯網實現了眾包——它只是極大的改善了眾包的效果。
集體智能在實踐中的應用勝過理論,比如人們常提到的維基百科,雖然它的結果看上去①以競賽的方式,處理現實中的公司問題,設計出產品與服務。大公司正在接受這種競賽,用它收集未來商界領袖的創意,以保持競爭優勢。
是違背直覺的,有悖于我們一直認為的世界運轉的方式——比如說,一般來講高智商的人應該總是勝過“棕色襪子”,其他事情同理。但互聯網提供了一個機會,讓我們能重新思考人類對自我行為的理解。因此,在了解集體智能在眾包中的應用之前,我們先試著用理論來解釋一下為什么它能行得通。
眾包植根于一個平等主義原則:每個人都擁有在別人看來很有價值的知識或才華。廣義來說,是眾包作為橋梁將兩者聯系起來。也就是說,每個人都擁有自己的特質,每個人都站在眾包的中心,這也是違背人類慣性思維的。
我們的特點在于,人人都是環境的天然產物:出生地,家庭,地理環境,經歷,以及其他無數在奇怪的熔爐中結合在一起的變量,這些制造出獨一無二的個體。這種獨特性存在于一大群人中時,就叫多樣化。在近20多年的同一性政治(Identity Politics)中,這個詞被強加了很多令人遺憾的精神負擔。但就眾包而言,將概念上的多樣化和政治中的多樣化區分開是很重要的。學者和企業家們發現,我們的差異之和是一種無限強大的力量,可以用來解決問題,開發新產品,或者僅僅讓網絡和現實世界都變得更加有趣。17世紀的哲學家邁克爾·蒙田(Michel de Montaigne)曾寫到,“世界上沒有兩個人的意見完全相同,正如兩根頭發,兩個谷粒都不盡相同。差異性是他們最普遍的特性!泵商锏囊馑际,我們唯一的共同之處就是我們全然不同。在網絡時代,這是件很棒的事。
小改動帶來的大不同
奈得·格利(Ned Gulley)正在從事關于群體智能(Group Intelligence)的實驗和研究。格利是邁斯沃克軟件有限公司的軟件設計師,著名的MATLAB軟件就是這個公司研發的,該軟件被數學家和工程師們用于解決極為復雜的計算問題,其復雜程度讓大多數人瞠目結舌。1999年,公司決定舉辦一個程序設計競賽。之前的競賽都是通過郵件進行的,但評選獲勝的參賽程序是一項繁雜而乏味的工作。因此格利建議,再舉辦一個網上競賽,對這些程序進行實時評級。
公司的目標是:“為MATLAB用戶提供一些娛樂活動,同時鼓勵大家相互交流優秀的程序!睆娜藗冮_始使用電腦之日起,編程競賽已經成為黑客文化的一部分,原因是:競賽讓技術的提高過程變得像游戲。早在20世紀70年代,大學的計算機系就開始舉辦各種各樣的競賽,而一些日常生活中的比賽出現的更早。
邁斯沃克公司正在重新發揚這種令人尊敬的傳統。乍看之下,格利的建議和傳統的方式如出一轍。選手要解決的問題是被稱作“銷售員路線的問題!边@是一個經典問題:假設一個銷售員要走過N座城市,選手要找出一個包含所有給定城市的最短路程的環路。參與者可以提交算法,或者計算機代碼,通過一些步驟來引導銷售員。比賽在十天后結束,誰的代碼最有效率,誰就是獲勝者。
但是,格利加了一點小小的改動:為了創造出更好的方案,比賽允許參賽者“借鑒”他人的代碼——每個方案在提交后,會很快被打分,排名,然后公布在網頁上,其他選手都能看到全部的程序代碼。他們可以把最好的代碼剪切粘貼,然后加入一些改動重新提交,即使這類改動很小也沒問題。如果這種微調能讓代碼變得更好,那么即使這位選手只改動了幾行,也能上升到第一位。
格利說,結果和實際的軟件研發過程像極了。“在一個辦公室,很多研發人員聚在一起,如果一個人解決了某個問題,大家會圍攏在一起看看他是怎么做的,然后恍然大悟的發出一聲感嘆,再把這個加入他們自己的代碼中。”他說!霸谖覀兊奈幕,有一個流傳很廣的謬誤,是關于托馬斯·愛迪生的,人們認為這個聰明的人會帶我們走出困境,當他走進房間,出來后就有了一個絕妙的點子。”實際上,他的大多數突破都是集體努力的成果。格利說“我想要舉辦一個競賽,更好的模擬人們的創意遍布全球的真正方式!
有一點要說明,與其說MATLAB的競賽是一個眾包的例子,不如說它證明了眾包如此有效的原理。在這個例子中,它更接近于佩吉的人工代理試驗,而不是TopCoder的軟件研發方法。后者還利用眾包創造出了有別于學術界的產品。
這種對抄襲的鼓勵不但沒有離間MATLAB的用戶,反而讓他們前所未有的著迷于自己的工作。來自愛爾蘭的選手內森寫信給格利說,在最后準備提交代碼之前,他激動的渾身顫抖,他為這種情況感到苦惱。
那些最投入的選手們,為了拔得頭籌推遲了假期,有的還逃課,甚至抱病參加比賽。格利稱MATLAB的競賽為“上癮的合作”,這正好呼應了杰克·休斯對TopCoder的描述:“競爭性合作”。
“某個程序員為了修改一個目前獲勝的優秀代碼,會花一整晚的時間!比缓竽硞人跟上,再做些微調,接著,他們成了第一。而當初那個程序員也許會想‘這個混蛋!他不過是通過復制我的代碼把我踢出局而已!裕谝粋程序員為了奪回第一的寶座,繼續在這個已經改進過的程序上再加入一些改動。” 格利說,“比賽的最終目標不是獲勝,而是想出一個讓其他所有選手大開眼界的絕妙改動,這就像是一個以聲譽為基礎的追分系統!
然而,MATLAB的不同凡響之處,不在于它激發了這股熱潮,而是在這十天里,所有人的知識產權被公眾隨意的反復使用,結果這十天的喧囂被證明是一種解決問題極其有效的方法。
從1999年開始,公司每年都要舉辦兩次這樣的競賽。格利說,在競賽快結束的時候,最好的代碼比第一天的代碼強一千倍。這就是為什么實踐讓理論奄奄一息。我們如何解釋這樣讓人驚訝的進步?很顯然,一切都是因為大眾的出現。一群很聰明的程序員合作,最終創造出的方案肯定比他們各自能拿出的最好方案更好。還有一點也很清楚,想法的自由交換促成了整個過程,幫助孕育了一個合作的環境,在這個環境里,好的想法可以變得更好。但這些都無法解釋,為什么更有效率的算法相繼出現,走勢形成一個指數弧線。
有一點很引人注目,最好的程序員做出的貢獻并不一定是最有價值的,新手常常給出一些至關重要的改進,帶來突破;蛘咭酶窭脑捳f:“有時候,一個腳本少年(黑客行話,指那些沒經驗,剛出道的黑客。)想出的改動,會令愛迪生都不得不擦亮眼睛說‘哇!’”
換言之,“棕色襪子”再一次打敗了高智商組。這可能又不符合慣性思維,但實際上,在佩吉進行電腦代理競爭試驗前50年,解決問題的分布式網絡力量已經有所體現了。
多樣化與市場
經濟學家F.A.海耶克(F. A. Hayek)最著名的成就是,構筑了瑪格麗特·撒切爾和羅納德·里根的自由市場政策,當然,也有人因此對他不滿。
海耶克在世紀之交出生于維也納,希特勒和斯大林執政之時,他已經是享有盛譽的經濟學家了。在倫敦經濟政治學院,海耶克對計劃經濟的弊端大加指責,而當時納粹和蘇聯政府采用的都是這種經濟模式。海耶克認為,市場是一個高效率的機構,它有能力協調經濟活動,任何個人或專家嘗試干涉它的行為都會帶來負面影響。和其他同時代的經濟學家一樣,海耶克也支持亞當·史密斯關于市場“無形的手”的說法,并為此做了很多事。1974年,因為這個課題的部分研究,他獲得了諾貝爾經濟學獎。撒切爾夫人和里根都是海耶克的朋友,他從來不想樹敵,但爭議甚囂塵上,逐漸掩蓋了他的諸多貢獻。
在1945年的論文“社會中知識的使用”中,海耶克評論道,那些既不存在于學術界也不存在于公司會議室的知識,那些“某個特殊時空環境下的知識,”社會是無法對這樣的知識做出恰當評價的。這樣的“局部知識”,現在一般叫“私人信息”,讓幾乎每個人都擁有自己的獨特優勢,因為他擁有獨一無二的信息,這樣的信息可能會創造出有益的用途。” 但如何獲取這些分散信息的研究尚未完成。海耶克寫到:
“社會的每個成員只能擁有全部知識中的一小部分,因此,對于社會上其余的大部分工作,人們都無從得知……文明之所以存在是因為我們都能從不知道的知識中受益。文明可以幫助我們戰勝個人知識的局限,方法之一是改變無知,但并不是通過掌握更多的知識,而是通過利用那些已經存在并將繼續廣泛分布在大眾當中的知識!
這是在互聯網出現之前寫的,互聯網在匯聚和利用離散信息的能力上,超出了海耶克的想象。MATLAB競賽是一個很好的實踐,試著證明了海耶克的中心論點:對于我們最棘手的問題,大家可能有自己的方法,但擺在我們面前的計劃是,將所有的知識匯聚到一個中央倉庫。當格利將MATLAB競賽的開放式設計說成是“逗弄對方,讓他說出自己的私人信息”,正是借用了海耶克經濟學理論,而這并不是巧合。
格利煞費苦心的搜集了大量的研究資料,從這些資料中他得出結論,為什么這種“上癮的合作”會如此有效果。
通過線性分析,格利斷定,在一段較長時間的微調后,事物會發生質的飛躍。“人們會從代碼中找出漏洞,就像鬣狗對動物殘骸感到不安,他們會想盡辦法折騰,直到某人出現將殘骸移走,它才能恢復常態!
格利創造的圖表大概也很容易描述動物的進化過程;虻耐蛔儾⒉蛔裱@個線性圖,但它的特點也是小的改變和大的飛躍——這是一個由進化生物學家斯蒂芬·杰·古爾德和奈爾斯·艾垂奇發現的“間斷平衡學說”的理論核心。
在一些令人信服的證據基礎上,格利必然會對這些相似之處有所察覺,并且相信,他掌握的關于MATLAB競賽的這些資料,很可能會揭示出在社會學和生物學中,事物是如何發展進步的,以及相關的一些更深入的真相。
“在歷史課上我們了解到,那些偉人,比如拿破侖,都是獨行俠。然而現實生活比這亂得多,在這些導致飛躍和改變的事實之間,涉及到某種復雜的相互作用!睔v史需要“腳本少年”——也就是“棕色襪子”的出現,用他們獨特的洞察力來重新教育每個人,賦予他們一個全新的視角。
“我們有一些確實很聰明的參賽選手,在一個守舊的競賽中,他們當中的某個人將獲得突破性的發現,這可能是最好的解決方法,僅僅因為他們優秀。但在MATLAB競賽中,人們會立刻出現,聚在一起對程序進行不斷的修改。這不是一個人能做到的。而是一大群人,我們有使用這個超級大的集體大腦的權利。如果我們可以開發這個大腦來治療癌癥,才是真正讓人驚嘆的事。”
此大眾非彼大眾
在MATLAB這類競賽中出現的集體智能,其核心是多樣性,但僅僅存在多樣性還不夠,它也需要維護。
當足夠多的人聚在一起,比如在一個酒吧或者聊天室,一種神秘的力量就開始發揮作用。人們或者突出他們的差異,分化成對立的陣營,或者為了達成共識而淡化各自的不同。兩種現象有同樣的網絡效果——大眾中的多樣化減少了。
人類進化了幾千年,才成為高度社會化的群體。在許多情況下,人類和平達成共識的能力攸關生死,比如“一只猛犸象沖過來了,我們要沖上去用魚叉戳它嗎?”但當集體智能發揮作用的時候,共識適得其反,比如在眾包模型——信息市場和解決問題的網絡中。
2004年,詹姆斯·索羅斯基(James Surowiecki)出版了一本書,叫《群眾的智慧》。這本書的書名是對查爾斯·麥凱在1841年出版的經典書籍《群眾非同尋常的幻想與癲狂》一書的戲謔,這也是對一哄而起的行為進行嚴厲的控訴,正是這種盲目跟風導致了17世紀30年代荷蘭“郁金香熱”那樣的災難 (不必說了,“眾包”這個詞是借用這兩位作家的)。然而,群體智能的理論比索羅斯基的書提前了數十年,事實上,近年來這本書又在迥然不同的領域重新流行起來,比如在社會學和商業管理領域。
《群眾的智慧》迎合了當下流行的創造力潮流,這是其他涉及該主題的作品沒有過的。這本書列舉了一批很有說服力的例子,在這些例子中,大眾證明了“三個臭皮匠,賽過諸葛亮”。
一群英格蘭農村的采購員是怎么猜中獲獎的小公牛不足一磅的?一個班的學生們是怎么猜到糖果罐里有多少顆軟糖的?游戲節目“誰想成為百萬富翁”的觀眾為什么一直能擊敗專家?
——都是依靠群眾的力量。這樣的軼聞趣事散發著神奇的光澤,再加上集體的想象力,常常成為雞尾酒會和辦公間冷水機邊的談資。不幸的是,因為索羅斯基的保守分析,這些都被刪掉了。
事實上,大眾的智慧并沒有魔法,而且這個表述本身有種誤導。In fact there’s no magic to the wisdom
of crowds, and the expression itself is a bit misleading.在上述例子中,大眾表現出的智慧和“一群人”并不一樣,發揮的作用也不一樣!耙蝗喝恕卑幸唤M人像一個單元一樣行動的意思,比如說“一群人沖破障礙,帶著一點歇斯底里的感覺,突然來找作者!焙冒,作者們很少引起那樣瘋狂的愛慕,但請領會精神。
群體的定義是“一群因共同特點結合在一起的人”。而共同特點太多,會削弱集體智能,它的活躍程度和一群人中多樣化的程度,以及他們表達個人意見的能力成正比。為了表現出色,大眾根本不能像一群人那樣。
多樣化要想戰勝能力,還有很多必須滿足的限定條件。
首先,這個問題必須真的很難解決。沒有人需要一群各式各樣的人幫他們系鞋帶。
其次,大眾必須具備隨時解決問題的一些能力。如果要設計一個更高效的核反應堆,隨機挑選幾個坐地鐵上下班的人,肯定很難超過一組核能工程師。即使佩吉的“棕色襪子”也是從大學的教師休息室中挑出來的,而不是從電話本上隨便挑的。還必須有一些方法,將每個人的貢獻匯合在一起,并加以處理,比如MATLAB競賽的記分和排名引擎。
最后,參與者必須來自一個足夠大的人才庫,以確保各種各樣的方法都有。另外,他們表達自我個性(也就是他們“局部知識”)的能力必須沒有受損。
記住所有這些后,讓我們重新來看一下那些乍看不符合慣性思維的例子。比如“糖果罐”:隨機挑選更多或更少的學生,都會帶來不同,他們會采用一系列策略來解決問題。在這個案例中,聚集機制就是老師收集大家的答案,計算出平均數的能力。但關鍵是要求學生不參考同桌的答案,獨立寫下自己的猜測。(MATLAB參賽選手在盜取別人的代碼時,不會參考太多意見,彼此隔離保留了他們的多樣化。)
現在讓我們再來看一下,在游戲節目中,觀眾答對超過90%的問題的能力。
在“誰想成為百萬富翁”這個節目中,選手需要回答15個難度遞增的問題。如果全答對了,就會贏得100萬美元。問題是多選題,有4個備選項。當他們被難住的時候,可以選擇“救生索”,也就是打電話給朋友——估計是比較博學,類似百科全書的那種;或者求助觀眾。前者的表現讓人驚訝,答對的幾率是65%;而觀眾遠勝于此,他們的正確率是91%,最優秀的一名選手都強得多,實在令人印象深刻。
這似乎是一個充分的證據,證明群體的智慧勝過其中最聰明的人。但這只是一個例子罷了,它實際是一個簡單的算數題:即使一小部分人擁有正確答案,這組人也會準確的將結果預測出來。因為,佩吉寫道“錯誤互相抵消了,正確的答案像奶油一樣浮了上來。”這點也很容易解釋,比如節目里曾有這樣一個問題,雪爾帕人和廓爾喀族是哪個地方的人?A.尼泊爾B.摩洛哥C.厄瓜多爾D.俄羅斯。如果只有4%的觀眾知道正確答案是A.尼泊爾,剩下的觀眾可能會從在四個答案中隨意猜測,結果是24%的觀眾猜摩洛哥,24%猜厄瓜多爾,24%猜俄羅斯。但有28%的觀眾會猜尼泊爾。
當然,猜測這些零碎的問題和改進一個比這上千倍的編碼有著巨大的差異。后者不僅讓人終身難忘,而且挑戰了信仰。但同樣的環境——也就是說多樣化和合適的條件——對兩個例子都適用。
表面上,MATLAB大概能吸引到大部分高智商的程序員。換言之,這是一個根據解決問題的能力而自我篩選的群體,毋庸置疑,最有才華的MATLAB程序員中,有很多人都參與過這個競賽。
但在多年使用MATLAB計算機語言的過程中,最好的編程員們學到的是相似的技巧和捷徑;而缺乏經驗的編程員——那些外行——不得不自己想出一些捷徑,這便帶來了認知上的巨大飛躍,讓最終獲勝的方法比最初的方法強一千倍。
如果英雄所見略同——在很多場合確實如此——那么其實它只反映了一種思維。或者像佩吉說的,“兩個人也不比一個人好,假如他們倆想的一樣的話!币粋多樣化的群體會為問題帶來很多不同的解決方法。他們是如何將這些方法應用到現實問題中的?——這比帶領一個銷售員通過幾個城市要復雜的多——這是我們下一章的主題。 |