神魂顛倒論壇logo

icon
首頁軟硬體網路綜合應用區軟體教學與介紹 → [網路與創業]資料驅動背後的謊言與欺騙

雷射溶脂 | 瘦小腹 | 植髮 | 眼袋 | 玻尿酸 | 電波拉皮 | Flash | 購物車 | Flash Player 11.2 | 豐胸 |

下一主題 上一主題


[網路與創業]資料驅動背後的謊言與欺騙


[網路與創業]資料驅動背後的謊言與欺騙 簡版






[網路與創業]資料驅動背後的謊言與欺騙

類型:
網路與創業



在新視窗檢視

每天早晨我都在謊言中開啟新的一天。

起床後我走進廁所,稱了一下自己的體重。這個資料會從中國製造的體重秤上同步到我手機中的 App 裡面,並且最終進入蘋果的資料庫,我的體重資料將永久地存放在雲端。

我進行這個稱量體重的儀式是因為感覺它能迫使我對於自己的體重保持誠實。它會阻止我找借口欺騙自己,比如說衣服不合身是因為洗的縮水了,而不是因為吃下去太多啤酒與奶酪。這些體重資料是真實無誤的,它們不是出自於我的主觀判斷,因此體重秤是不會說謊的。

當然了,我們都相信體重秤顯示的數位從技術層面上來看不應有假,這個數位就是當下我的真事例重,它就如同蛋糕菜譜上的配方表裡的數位一樣是可靠的。

但是在一次次的稱體重中你會發現,那個決定了一個人是標準還是臃腫,是瘦削還是肥胖的體重數位,其實是很容易被操縱的。

如果我想讓自己輕一些,我就會在上稱之前出去跑步流一身大汗,排出多餘水分。如果我擔心自己減的太猛已經超出了健身方案制定的標準,那麼我就需要重新回到健康飲食當中,推遲稱重的時間,補充食物與充足的水,這樣子就可以看到體重數位又有所回升。

當然了,你所使用的這些干預體重的方法只會帶來增減 5 磅(約為 4.5 斤)左右的差別,但是對於某些和我一樣對於體重無比看重的人來說,這些小小的體重數位波動已經足以讓我感覺自己確實有所轉變,從這個人

在新視窗檢視

變成了這個人

在新視窗檢視

你也許覺得這只是個人生活方面的數位欺詐,世界上的其它資料,比如說發表在公開學術期刊上的資料總沒那麼容易被人為操縱吧。

不過如果你看到了最近刊登在美國權威學術期刊《科學》上面的一項研究,或許就不會這麼認為了。該專案的研究人員對於已發表的 100 篇高品質心理學論文中進行的實驗進行了複製,看看是不是能夠得出相同的資料,而實驗結果是只有只有有 36% 的資料可以重現。換句話說,就算是換了另一批小心翼翼且專業的研究人員,也有三分之二的論文結果是不能被重現出來的。

「這個研究專案為我們提供了不少證據,了解到在很多心理學研究論文中發現的結論仍然需要細緻的工作去反覆檢驗,看看這些結果到底是不是像我們知道的那樣確定。」

在如今的很多研究領域當中,科學家們會一直收集資料,直到資料呈現出一種在統計學上顯著的樣式,然後他們會使用這些經過嚴格挑選的資料去發表論文。在學術圈裡這種做法被稱作是「P 值篡改」(p-hacking),只要掌握一些資料作業的技巧,就可以讓資料虛高,得出一個在統計學上顯著且有意義的結果。在論文中常用的篡改資料的手法如下:

[u]通過中途的實驗分析決定是否要繼續收集資料

記錄下許多因變數,並決定要選取報哪一個寫入報告

擅自決定是否要新增或是刪除極端值

對於實驗群體重新進行排除、組合或是是分離作業

當分析結果已經呈現出 P 值顯著時就立刻停止資料擷取

把上述所有加在一起,你就會發現知識產出的程序當中存在?如此明顯的問題。



當這些有問題的研究結論進入到 Facebook 驅動的社交媒體世界當中時,即便是一個小小的「P 值篡改」的研究也會迅速傳遍世界,而且不會有多少人表示懷疑。當一個普通人在快速瀏覽新聞的時候不會意識到那些「科學實驗得出」、「研究表明」其實就是扯淡,其研究結果根本經不起檢驗,尤其是當這些說法出現在學術期刊上,就更不會引發懷疑了。

這就是所謂專業的科學研究!如果在學術研究領域當中都存在?資料作假,那麼就更別提在資料驅動的商業領域情況會是如何了。

在令人嘖嘖稱奇的《國家的視角》(Seeing Like a State)一書中,展現了各國政府與其它大型機構如何試圖減少世界當中存在的極端複雜性,將其歸為統計資料可以解釋的範疇里,並使得其國家或是組織的領導人能夠理解到底發生了什麼。

作者 James C. Scott 在全書開頭使用了一則歷史當中真實的故事作為引子。在 18 世紀下半葉,普魯士的統治者們想要知道在自己森林茂密的國家中到底擁有多少「自然資源」。因此他們就開始?手計算了,他們在自己國家的版圖上畫出了一個巨大的表格,這樣就可以算出來在一個劃定的森林範圍當中可以產出多少板尺(譯者註:硬木板材的計量單位)的木材。至於森林的其它價值,比如說為人類和動物提供庇護,以及自身擁有的生態環境價值都被忽略不計。

真實的世界並不那麼守規矩,普魯士統治者們得到的資料總是不完美。因此他們開始自己創造新的森林,在相同時間種下單一品種的樹木,這樣在森林當中就不會存在無法貨幣化的樹木了。「事實就是在這種幾何圖形的森林規劃背後有?國家力量的支撐,這種力量將原生的、真實的、包含多個物種且略顯混亂的森林變成了新型大一統森林,並且將森林劃分成網格狀進行統一管理。」Scott 在書中如此寫道。

在新視窗檢視

普魯士的森林全都變成了網格!這些人甚至把樹木按照嚴格的網格形狀種成整齊的一排。

德國的林務員們對於如何施肥以及管理樹木有?非常科學的認識。普魯士的植樹造林排程確實奏效,至少在接下來的 100 年裡沒有出現什麼問題。在全世界各地有很多人採用了普魯士這種統一管理森林的方法。

之後森林就開始大片的死去。

「在德國的這一植樹造林排程中,那些無法形成最終商業價值的樹木品種被拋棄,以至於造成了後來樹木大片死亡的令人痛心的結果,這一局面只有在裸子植物被種下去之後才有可能得到扭轉。」

樹木生長需要依靠複雜的生態系統作為支撐,而這種系統的形成需要經過數代微生物與物種內部的相互作用培養而成,所有的這一切物種關係都被普魯士嚴格的植樹排程給破壞殆盡。植物與微生物的營養周期被打斷,物種之間微妙的平衡一去不復返,在真實世界裡隱藏?的執行規則只有在它消失時才會慢慢顯露出來。德國人發明了一個新詞彙去描述發生的這一切:Waldsterben,意思為森林的消逝。

有時候當我看看現在的世界,在很多情況下,人們只有憑得到的有限資料就去試圖掌控人類與其它生物之間無比複雜的關係。我很想知道是否我們也已經步上了曾經的普魯士的後塵,等待?下一個 Waldsterben 的時刻。

在新視窗檢視

由廣告支撐的網路生態系統就是一個好例子。這種運作方式非常聰明:通過整個網路取得人們的資料,然後根據已知的訊息向他們展示想要看的廣告。不只有如此,由於和傳統的廣播媒體與印刷媒體相比,人們的網上活動程序是可以追蹤的,因此廣告主能夠越來越精確地掌握人們想要買些啥。顯然,在資料挖掘技術的支援下,線上廣告市場佔有率在不斷增長,已經奪取了大部分其它傳統媒體所擁有的市場佔有率。很多新媒體公司不斷增長的估值都是建立在數位廣告市場將不斷增長的預期基礎上。

不過如果撕開這一層光鮮亮麗的外皮,就會發現其中顯而易見的問題。在那些數位廣告與宣傳影片龐大流量的背後其實並非是真實的消費者,絕大部分都是軟體偽造出來的虛假點選。

「這是一種讓虛假流量以假亂真的藝術,它們會通過足夠的訊息將自己偽造成一個看上去真實的使用者。由程式控制的廣告計費系統無法分辨點選是來自真實的使用者還是機械人,也無法辨識出那些擁有新鮮、原創內容的站台與只會複製粘貼別人的文章與圖片的假站台。」

當然了,高階的媒體不需要做這種事情。但是便宜且由程式控制的計費廣告被虛假流量給蒙蔽了,虛假流量也拉低了整個線上媒體行業的廣告價格,這使得那些真心做新聞的站台依靠廣告費很難支撐自己的執行。同時,很多站台的使用者都非常反感這種商業樣式,並且開始安裝廣告攔截器來對抗線上廣告。

廣告商與廣告技術公司只想要抓取使用者的資料去向他們投放精準符合的廣告,他們唯一想做的事情就是讓自己投放的廣告更加具有針對性。但是從實際出發,這種伴隨?廣告商不斷增長的慾望而發展出來的廣告樣式勢必會以難以預料的方式去重塑網路媒體的價值觀。

我們欺騙自己說資料不過是一個鏡頭,只有只有反映出我們的生活圖景,然而資料實際上已經成為了線上廣告商業樣式的引擎。廣告商取得的使用者資料已經改變了線上媒體業的運作方式。單以收集資料這種行為本身來看,它就不是一個中性的舉動,它是一種重塑線上媒體的方式。

也就是說我每天上稱量體重並不是為了獲知自己真實的體重,而是為了改變對於自己胖瘦的認知。這個謊言通常都是奏效的。

文章來源:FUSION,本文由 TECH2IPO/創見 陳錚編譯,首發於TECH2IPO/創見(http://*/)?轉載請保留此訊息



對 TECH2IPO 或本文有任何想法,可以新增我們的編輯部個人微訊號進行交流:T2IPO001

TECH2IPO/創見已將成立以來的創業知識輯錄成書,是新時代創業者學習提高自身素質的良師益友。書名《創業百道》,感興趣的讀者可點選這裡線上購買。



最新最 hit 的藝術設計圖片,盡在PicGap

在新視窗檢視







原文站台: Tech2IPO











在新視窗檢視

分享到Facebook





雷射溶脂 | 回到頂部
下一主題 上一主題