分享

芬蘭國民AI-4.2The nearest neighbor classifier

 
簡單說,用the nearest neighbor method的the nearest neighbor classifier,就是把測試資料裡的某一點,跟訓練資料裡最靠近的一點分到同一組,就分類完了。
在平面上,只有兩個維度,上下左右動一動就能找到最靠近的點了,不過,真的用起來的時候維度就會變多,譬如想要診斷病人時,想要包含的維度會有年紀、血糖值等等等,不能被限制在兩個維度內。
(Emma:真人醫生往往也無法只憑兩個項目就診斷出結論,醫生表示感到心累可以多給點線索嗎)
到底怎樣是最近(nearest)?
這時出現了「the Euclidean distance」(尤拉距離或歐幾里德距離),想像這個測試資料點落在一個平面上,我們可以測量訓練資料中某點到這個平面的最近距離。
(Emma補充:距離有這麼多種,我真是太沒見過世面了!)
https://tiredapple.pixnet.net/blog/post/4757594
用nearest neighbor來預測使用者行為
典型例子是推薦系統。概念上,有相似過去的使用者,很可能有相似未來。舉例來說,某個音樂服務供應商發現你是一個80年代迪斯可音樂愛好者,一旦它得到一個新專輯是80年代迪斯可音樂的精選,它就會把這個精選推薦給你,不過,這類資訊還嫌少,而且也只能用來做出很粗糙的預測。
目前的推薦系統是collaborative filtering,還會參考其他使用的偏好來給你推薦,現在同為80年代迪斯可音樂愛好者,音樂服務供應商不只會給你80年代迪斯可音樂,還會參考其他80年代迪斯可音樂現在也喜歡什麼、後來喜歡了什麼,來推薦給你。
Filter bubbles
這就是同溫層的概念,利用個人資訊不斷推薦與你傾向相似的資訊給你,我們會比較難得到不同的想法,如果只是音樂服務或購物車的推薦,頂多是消費或娛樂的種類少一點,比較令人擔心的是新聞、訊息、重大議題的面相受限。
分類:科技

評論
上一篇
  • 下一篇
  • 更多文章
    載入中... 沒有更多了