資源描述:
《Python數(shù)據(jù)挖掘與機器學習實戰(zhàn) - 選題.doc》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在教育資源-天天文庫。
1、Python數(shù)據(jù)挖掘與機器學習實戰(zhàn)—選題大綱(一組一章,第一章除外)第一章:Python機器學習入學指南1.1、機器學習要解決的任務1.2、有監(jiān)督與無監(jiān)督問題1.3、線性回歸算法原理推導1.4、Python語言基礎1.5、Python數(shù)據(jù)結構(列表,字典,元組)1.6、科學計算庫Numpy基礎1.7、Numpy數(shù)組操作1.8、Numpy矩陣基本操作1.9、Numpy矩陣初始化與創(chuàng)建1.10、Numpy排序與索引第二章:邏輯回歸與數(shù)據(jù)分析處理庫Pandas2.1、Pandas數(shù)據(jù)讀取與現(xiàn)實2.2、Pandas樣本數(shù)值計算與排序2.3、Pandas數(shù)據(jù)預處理與透視表2.4、Pandas自定義
2、函數(shù)2.5、Pandas核心數(shù)據(jù)結構Series詳解2.6、Pandas數(shù)據(jù)索引2.7、邏輯回歸-sigmoid函數(shù)2.8、邏輯回歸原理推導2.9、最優(yōu)化問題2.10、實戰(zhàn)梯度下降算法案例實戰(zhàn):(自己定)第三章:案例實戰(zhàn)(自己定)3.1、數(shù)據(jù)與算法簡介3.2、樣本不平衡問題解決思路3.3、下采樣解決方案3.4、正則化參數(shù)選擇3.5、邏輯回歸建模3.6、過采樣與SMOTE算法3.7、Matplotlib繪制第一個折線圖3.8、Matplotlib條形圖,直方圖,四分圖繪制3.9、Matplotlib數(shù)據(jù)可視化分析第四章:決策樹與隨機森林4.1、熵原理,信息增益4.2、決策樹構造原理推導4.
3、3、ID3,C4.5算法4.4、決策樹剪枝策略4.5、隨機森林算法原理4.6、基于隨機森林的特征重要性選擇案例實戰(zhàn):(自己定)第五章:Kaggle機器學習案例實戰(zhàn)5.1、泰坦尼克船員獲救預測(可自己定)5.2、使用pandas庫進行數(shù)據(jù)讀取與缺失值預處理5.3、使用scikit-learn庫對比回歸模型與隨機森林模型5.4、GBDT構造原理5.5、特征的選擇與重要性衡量指標5.6、機器學習中的級聯(lián)模型5.7、使用級聯(lián)模型再戰(zhàn)泰坦尼克第六章:支持向量機算法6.1、SVM要解決的問題6.2、線性SVM原理推導6.3、SVM對偶問題與核變換6.4、soft支持向量機問題6.5、多類別分類問題解
4、決方案案例實戰(zhàn):SVM中參數(shù)對結果的影響(可自己定)第七章:神經(jīng)網(wǎng)絡模型7.1、前向傳播與反向傳播結構7.2、激活函數(shù)7.3、神經(jīng)網(wǎng)絡結構7.4、深入神經(jīng)網(wǎng)絡細節(jié)7.5、神經(jīng)網(wǎng)絡表現(xiàn)效果案例實戰(zhàn):神經(jīng)網(wǎng)絡處理圖像分類任務(可自己定)第八章:mnist手寫字體識別8.1、Tensorflow框架8.2、CNN網(wǎng)絡結構8.3、構造CNN網(wǎng)絡結構8.4、基于tensorflow的網(wǎng)絡框架8.5、迭代優(yōu)化訓練第九章:經(jīng)典案例實戰(zhàn)9.1、鳶尾花數(shù)據(jù)集分析9.2、基于NLP的股價預測9.3、員工離職預測(根據(jù)自己情況確定)9.4、新聞分類任務9.5、詞向量模型與LSTM情感分析第十章:聚類與集成算法
5、10.1、k-means,DBSCAN等經(jīng)典聚類算法原理10.2、python實現(xiàn)k-means算法10.3、聚類算法應用場景與特征工程10.4、Adaboost集成算法原理案例實戰(zhàn):聚類算法可視化演示(可自己定)第十一章:其他機器學習算法11.1在線學習11.2遷移學習11.3增強學習11.4LSTM11.5GAN最新機器學習算法(可自己定)案例實戰(zhàn):(可自己定)或從下列選題中選擇:(除第1講)選題名稱內(nèi)容結構內(nèi)容要求??????第1講機器學習與Python庫(該講不可選)解釋器Python3.6與IDE:Anaconda/Pycharm1.Python基礎:列表/元組/字典/類/文件
6、2.numpy/scipy/matplotlib/panda的介紹和典型使用3.多元高斯分布4.典型圖像處理5.scikit-learn的介紹和典型使用6.多種數(shù)學曲線7.多項式擬合8.快速傅里葉變換FFT9.奇異值分解SVD10.Soble/Prewitt/Laplacian算子與卷積網(wǎng)絡代碼和案例實踐1.卷積與(指數(shù))移動平均線2.股票數(shù)據(jù)分析3.實際生產(chǎn)問題中算法和特征的關系4.缺失數(shù)據(jù)的處理5.環(huán)境數(shù)據(jù)異常檢測和分析?????第2講回歸?線性回歸1.Logistic/Softmax回歸2.廣義線性回歸3.L1/L2正則化4.Ridge與LASSO5.ElasticNet6.梯度下
7、降算法:BGD與SGD7.特征選擇與過擬合8.Softmax回歸的概念源頭9.最大熵模型10.K-L散度代碼和案例實踐1.股票數(shù)據(jù)的特征提取和應用2.泰坦尼克號乘客缺失數(shù)據(jù)處理和存活率預測3.環(huán)境檢測數(shù)據(jù)異常分析和預測4.模糊數(shù)據(jù)查詢和數(shù)據(jù)校正方法5.PCA與鳶尾花數(shù)據(jù)分類6.二手車數(shù)據(jù)特征選擇與算法模型比較7.廣告投入與銷售額回歸分析8.鳶尾花數(shù)據(jù)集的分類??第3講決策樹和隨機森林?熵、聯(lián)合熵、條件熵、KL散度、互信息1.最大似然