分享

艾瑪人肉學習週記(Week07):令我心跳加速的黑色安裝畫面


這週上課前,我把上上週憶當年沒憶完的部分,我們想脫離靠靈感或血輪眼做價格預測的歷程,我去找出當時比較關鍵的確切數字,避免我僅憑印象,讓我可以更清楚地定位目前的狀況。主要有三個部分:
近幾年正確率對應節省金額
SAP
大學生暑期實習
1.近幾年正確率對應節省金額正確率定義為預測較上月漲或跌,2015-19年之間,2016年和2017年的正確率都是42%(5年內正確率最低的兩年),也就是說12個月均價的預估中,預估漲跌對不到一半,然而,2016年採購成本較市價節省的幅度最高(很可能是2015年底建立低價庫存,一個對的動作,到2016年經常性地猜不準都還是省下5年內最多),2017年和2019年的正確率分別是42%和58%,節省幅度是最低的兩個年度,在相同正確率下的2016年和2017年,節省幅度相差5個%(到底是差多少錢就先不提了),我真不知道預估漲跌的正確率為何與節省幅度有什麼的關係,但5筆資料也不用跑相關性了,我的問題是,正確率較高的年度就能幫公司節省比較多錢嗎?用這五年的資料似乎是得不到肯定的答案。
2.SAP2018年初,SAP向我們推薦價格預估的模型,整個試做期間約是6個月。在這段期間內,上面預估的漲跌正確率平均約50%,經過幾個來回,正確率由50%先上升到63%,至試做結束前達77%。資料期間是2015年4月至2017年10月、訓練資料筆數132筆、變數數量216,而我提出的要求是因為原料的lead time是1-2個月,希望可以生出未來六週的價格預測值,模型保留了9個重要的預測因子,模型穩定度接近98%,那時也擬定了一個採購策略,的確可以計算出一年超過1,000萬美元較市價節省的金額,不過,買這項服務的費用是每年小幾百萬台幣(即使買了程式碼也不分享),我們沒有買。
3.大學生暑期實習2018年夏天,來了一個資料科學系的大學生,到2019年上半年還不時會來,他用Python幫我們做了一個模型,正確率和穩定度都比SAP更高(不知道SAP的模型,只能猜是資料筆數更多導致),至今我每月都在更新。程式碼中第一個cell裡的import約看過一半(還有一半很陌生),由第一行出現RandomForestRegressor,猜是一個月前「機器學習與演算法概論」和「手把手機器學習」的隨機森林內容,不過上課用的是分類不是迴歸,在價格預估中用迴歸也合理。
從SAP和大學生實習中選出的重要因子,已經可以看到交集,他們都用機器學習選出的相似的因子,只是在他結束實習後的大小型討論中,我沒有印象我們曾對這些因子再做更深入的討論,而且我也不好再去別人管區裡指手畫腳了。
本週進度:兩位老師丰采依舊
蔡炎龍老師的自學課程七週課程「成為python數據分析達人的第一課」已經上完六週的內容,這週看到的已經開始長得比較像先前買的課本中的引言了,下週做個結束就要再進入另一個七週自學課程「成為 Python AI 深度學習達人的第一堂課」,用中午午休的時間邊聽邊試寫在Jupyter Notebook裡,本週還自己找到的CMS(?那種黑色畫面?),輸入老師教的指令後安裝好pandas-datareader,在安裝的黑色畫面前心跳加速,並且不擔心電腦會爆炸,看到Done出現了才意識到:安裝成功!
李宏毅老師並沒有被置入冷宮,只是講的東西需要比較長、比較完整的時間看,但也還是被我分成兩次或三次看完,聽到老師上課講正在修課的大學生都已秒做作業並超前進度,真是懷念大學(青春)只需要盡情上課盡情讀書盡情寫作業的美好時光啊!
明天上課的主題是電腦視覺(彷彿與我本週回憶較無關),相當於把之前有學過的東西,拿來看用在圖像辨識的樣子,不過,加起來幾百頁的簡報,我想老師是把簡報當動畫了吧! 
分類:學習

評論
上一篇
  • 下一篇
  • 更多文章
    載入中... 沒有更多了