分享

艾瑪學習週記2020W53:無法分手

2020/12/28-2021/01/03
本週就要展開2021年,我計畫新的年度,透過閱讀AI領域的newsletter,要分享更多AI領域的動態,一開始也許多少有點不順暢,但我想,腳既然已經擱在舒適圈之外,也就不怕站到圈外了。

讀書會:

最近一個週日,和任職於AI領域中高精尖公司的牛人學長,有機會聊聊,對我來說,意義很大:聊到近期的模型廠商初報之前,要注意的事項,以及我下一個年度學習方向的調整,給我的個人學習,指引了更明確的方向。
我在人工智慧學校結業後,對python要學多少本來就非常有疑問,剛開始我聽到這樣的說法:
「想coding花錢找人做就是了,不用自己學。」
這樣的說法來自金融業、以前拜訪公司認識的人,財大氣粗的口吻討人厭,我不認為可以請別人做的事情,自己就不應該捲起袖子來做,於是我問牛人學長:
「學習Python能幫助我了解工程師或研發團隊的思考方式嗎?」
「其實不需要了解,在現實的運作中,更有價值的是橋樑的角色,考慮到你的背景和專長,能發揮的價值遠大於coding的工程師,而且,在給你看過一個AI模型落地要做多少事的區塊圖中,你看到模型本身只是很小的一塊,如何落地才是其他其他很多塊任務都要能實現才做得到的事,你別花太多時間在學Python。」
如果模型本身只是很小的一塊,coding就更小了。
牛人學長的話幫我下定決心,重新調整學習方向,將對我接下來安排2021年的時間產生很大的影響,目前我有週日和週二兩個讀書會,我很痛心地計畫捨去週日讀書會。很痛心因為,我每次參加讀書會,都是懷著很感恩的心情,週日讀書會是是台灣人工智慧學校的學長姐自發舉辦,由很會的學長當老師、熱心有紀律的學姊當助教,目前看來是無限期,每週訂主題、給大家出作業,三次不交作業就退群的規矩,我非常喜歡這種有秩序的運作方式。你能想像嗎?我工作的場合中,即使有皇城內的和諧,但與和諧共存的是緩慢、習慣、忽略,突然讓我遇到了劍及履及、對學習新事物有高度熱情的學長姊和同學們,我該是如何地驚喜並且感激,並且盡其所能地與他們互動,每次想不出來到在床上滾來滾去苦思(重點是苦思不是床上),才對得起老師和助教的用心,今天助教學姊發出統計作業的乖寶寶名單,乖寶寶(我)要去跟學姊說一個適當的退群告別,不要等沒交作業被退群。
週日讀書會的重點是coding,不是AI,而我已知,不論是現在或未來,我並沒有想成為工程師,我的學習應該往對AI產業的動態多了解、如何把正確或是較好的觀念分享出去,而不是解一題班上60個人、一週後寫得出作業的不到5人的資料清理,後來我參考了同學的作業的交出那次作業,相關的下次作業,我也還蠻早做完交出去,但心裡始終覺得不對勁,心裡的大問號,是打在我自己的學習方向上頭。
週間某一天,原本是A Proper Goodbye變成See You Next Year—
我私訊學姊,告訴她我想調整自己學習方向,等等我就自己去退群,我不想等我三次沒交作業,變成被退群的壞寶寶,學姊偷偷先跟我說(被我寫在這裡就無法偷偷了)轉為FB社群方式,除了目前累計兩次未交的人之外,應該不會再踢人了,這樣的調整是因為,目前大家的討論不太熱烈,cisco的會議室又有時間限制,所以想說用FB的方式,貼文討論的互動性會比較高一點,基本的coding其實已經講得差不多了,接下來主要會針對大家實用方面的需求,做一些範例給大家自己玩。我告訴學姊我計劃讀的素材,學姊分心了:
「WOW!這看起來也很有趣耶。」
學姐說之後再找我到FB社團裡分享閱讀心得,我答應學姊先讓我讀幾個月,看消化的狀況,如果我讀到吐血在半路上,也會讓學姊知道。她說:
「沒問題啊,按照你自己的步調來,到時候可以開一個專區給你。」
我從來沒有想分手或離職、卻被挽留成功的經驗,難以忘懷自己心裡的驚喜和感激,導致去意不堅定,就這樣被學姊挽留了,時間還是會重新分配,但心裡捨不得,無法決絕地不回頭。 (以為在演七匹狼嗎)
週二的讀書會還會繼續,因為計畫一起讀的三本書,涵蓋了Python、Data Science、深度學習,我認為這裡很明確地往AI領域前進,約在明年上半年會結束,我發現,有明確期間的讀書會,焦點可以更集中,此將作為未來選擇讀書會的考慮點之一。

講座:牛人學長的黃金90分鐘

2020年10月底,我開始幫公司找價格預估模型的廠商,這次是高層對AI應用開始發生興趣,CEO請新的IT主管了解是否有廠商能幫公司做這樣的模型,之前我所屬的團隊,曾經兩次試著以模型預測來解決原料價格趨勢的問題,但那兩次,或因為內部各部門無法取得共識、或因為AI並沒有一個一次性解決的辦法,不是找個大學生寫程式就能用,這樣工具並沒有持續被採用,近兩年,我們仍舊用著與過去四五十年類似的方法,不是人工智慧,而是工人智慧。
2021年1月即將進入模型廠商初選的期間,雖然我設好一些廠商在初報中必須提供的項目,如回測方法的合理性、後續維護、費用結構等,不過,由於把資料給廠商試做時,無法確認廠商願意投入多少,我只把正確率只能當做選擇性的項目。
學長講了不少客戶成見、誤解以及犯過的錯誤讓我知道,在這種大家(我)對選這類廠商選擇標準都沒什麼經驗的情況下,我認為避錯是很重要的,學長提示的重點如下:
  1. 數據結果太好很可能是吹牛的,不能看正確率決定廠商。
沒有一個方法是永遠正確的,部署好一個模型才是使用AI的開始,重點是讓公司內部的人,了解模型如何運作、遇到重大事件時是否有轉換模型或機制的設計、如何需要新的參數或模型取代、如何教育訓練  要有一個小團隊去做這件事,這樣的投資會很長期的事,不可能用一個專案一勞永逸地解決。 (說可以用一次解決的都是AI騙子)
不能接受廠商給的黑盒子,要讓自己的公司能夠「自我造血」(中國用語),公司內部要有小型團隊,讓公司裡的有一小組人,能夠接收模型廠商教的知識和方法,牛人學長特別強調,他們遇到過AI較為成功的案例(實際上真的在導入後持續使用的公司),都是牛人學長的公司手把手的教會他們,他說不是因為他們特別慷慨、樂意分know-how,而是那樣才能真正落地、真的有用,而非做了POC(Proof of concept 概念驗證)就認為完工,但後來並沒有繼續使用,現在大部分公司都只做到POC就以為能用,實際應用上並不是這樣。
  1. 要把管理階層的預期給設定正確。
在公司內導入AI是一個長期投資,並不是能夠很快地減少人力或降低成本,很多老闆以為用了AI,工廠裡都不用人了,但其實可能只是,換一批人即時監測變化,以電商為例,想利用AI做一套比較聰明的推薦系統,並不是做了一套系統後,從此知道何時該找誰推薦什麼,很有可能是更需要一群人,監測business metrics的變化,系統或模型必須隨時訓練的,並不是因此不用雇人做事。
很多老闆都以為自己的公司累積了很多資料,摩拳擦掌地想要導入AI模型中、從裡面挖出金礦,他們根本不清楚自己的資料有多髒(所以資料集才需要清理),往往都要等到AI顧問公司POC之後,才揭開這些資料到底有多無用的窘境(缺失的、亂填的)。在一個AI模型中,模型本身是很小的一部分,重要性更大以及將花費更更多去做的,反而是其他像是定義問題、蒐集、清理、標記資料等。
在價格預測模型的方面,預測是很難的問題(不然就靠預測金融市場上公開交易的標的把錢放進去然後等著收錢),目前比較能預測的是中長期的趨勢,要非常短時的預測,不太容易。其實不應該挑公司最痛(通常也是最難)的問題做為一剛開始使用AI的主題,像是Google,在AI領域中先做的是語音,做好或做壞影響不大,再做地圖和街景,也能行得通,才去對獲利影響很大的廣告。(問題是不夠痛的痛點,一般公司還不願意花錢,真的只有大型公司大到像Google,才能這樣試水溫)
有趣的是,我把這些分享給IT主管,他告訴我大家對AI的反應往往兩極:要不就是嗤之以鼻地、不認為有機會改變什麼,要不就是當成萬靈丹、什麼都想丟進去。不論是哪一邊,都不是中肯的認識,我們還需要知道更多。

其他:想像AI落到納粹手裡

近兩週我充分把握一個人在公車上的時間,讀著《美因河畔思索德國》,德國在二戰後也經歷過不同時期的沉默、壓迫、動盪、反抗,許多國家都在相近的時間裡,也有穿著不同的外衣的「運動」風起雲湧,這些使多數人曾生活在恐怖中的運動,以及延續至今的面對,到底是更加撕裂呢還是開創了和諧的可能性?到底有沒有讓我們這代人更有反省與批判的能力呢?這真是本讓人非常感慨的書:我們人類,極其相似,但個人選擇,也可以有如此大的差距。
任何工具都是中性—網路、AI、火車與焚化爐—用這些的是人,是人使它們美好、也是人使它們高效地殘忍。我突然想起在網路或AI中對倫理、隱私、人權的討論,戒慎恐懼的討論,能在醫學上更早辨識出病變,提高病人的存活率,也能在大城市的機場與車站中,用監視鏡頭與人臉辨識找到特定的人,據說露臉的7分鐘內可以抓到,可以抓到危險的刑事罪犯,也可以抓到「危險」的異議分子,後者危及的,並不是老百姓的生命財產。
讀到《美因河畔思索德國》中間的一則小故事,內容是回憶錄《反叛與瘋狂》的作者許奈德提及50年代時他如何欲見父母輩的陰暗過往:在某次到父親朋友家作客的機會,父親的朋友是一位精神醫學教授,閒聊中想起了一件往事,他說,戰後物資缺乏,他便在散步時撿拾掉在地上的蘋果,有次他滿手蘋果時被一個婦女叫住,她向這位精神醫學教授介紹,自己是他在納粹時期的醫院病人,要不是教授在診斷書上註明「正常」,恐怕依納粹反同性戀、反精神病、反殘障等清理標準,她已被「安樂死」,教授感嘆他完全不記得這位婦女,但被喚住的那時,居然是在他滿手蘋果的當下,使他在多年後仍記得這件事,許奈德問:
「你寫下『非正常』的人數有多少?」
想像AI落到納粹手裡,這位教授即使想盡量對得起自己的良知,不用多久,也會因為診斷「正常」的病人數量高於平均被逮到了,也許還用不到智能化,光是可即時傳輸的網路(電報可以嗎?我沒用過)、快速匯總資料的試算表,也許就綽綽有餘了。
分類:學習

評論
上一篇
  • 下一篇
  • 更多文章
    載入中... 沒有更多了