分享

閱讀∣ 數據、謊言與真相

大數據 讀書心得

圖片來源: 博客來

  

Google Trends: https://trends.google.com/trends/

作者透過 Google 的大數據,進行一些特定資料分析;書裡有大量的實例分析。舉例來說,當年川普最後會勝過希拉蕊,在大數據的資料中得出來嗎?他們就有注意到搜尋川普的人們有12%也會一併搜尋希拉蕊,反之搜尋希拉蕊的人有25%以上也會搜尋川普。在觀注度上就有顯著的差異。另外,他也從搜者的位置分佈和特定歧視的字彙推定支持者不想識大眾知道的隱藏特質。
可以這麼做完全是因為使用者不會對 Google 說謊。使用者為了查詢特定資料而使用搜尋引擎,所輸入的查詢資料自然是在意的東西也因此可以從這個地方看出實際關心的內容和在問卷或其他民調上的實際差距。這邊也有個有趣的實例 NETFLIX 提供了使用者建置想看的清單,實際上的結果就是絕大多數的人就只是把這些片保留在想看而已和實際點擊、收看的影片大不相同。當他們發現了這個真相之後於是改由使用者實際的點擊、收看類型去發送提醒果然業績高度成長。用這個例子來說明使用者會說謊也許不是刻意只是為了呈現比較符合給外界的形象。也因此作者並不相信 Facebook 呈現的數據,因為那就是個人想對外呈現表像的資料,資料的可信度就…
A/B 資料測試,在分析資料後,為了更細部的資料準確度常常會使用A/B 資料測試,這項功能已經被大量的使用透過這個方式企業可以更正確的判定那些內容是比較為顧客接受進而強化要達成的效果。
本書的最後一個章節提到了大數據的限制,它都是過去的資料分析面對未知的內容做預測有它的限制存在。所以其實不太適合拿來做股市的未來分析。另外一項限制是維度的詛咒變因太多造成的分析錯誤。還有可以做但是有道德疑慮的分析內容。
  • 也從大量的數據中發中了人們不會說出口的秘密
  • 不要相信人們告訴你什麼,要相信他們做了什麼。
  • 人們一直在對自己說謊。
  • 演算法比你更了解自己。
  • 人們對朋友說謊、對調查說謊、對自己說謊,為的是讓自己看起來更好。
#大數據  #讀書心得 
分類:藝文

「我們都無法成為自己想成為的大人」

評論
上一篇
  • Python∣ 學習書單
  • 下一篇
  • iOS 14| UIDatePicker 使用舊樣式
  • 更多文章
    載入中... 沒有更多了