【算法】2020年的学习总结

By 张怀义 at 2020-07-15

分类算法:

  1. 决策树

  2. 因子分解机

  3. 梯度提升决策树

  4. LinearSVC 线性支持向量分类

  5. 逻辑回归

  6. 多层感知器

  7. 朴素贝叶斯

  8. 随机森林

  9. 支持向量机

回归算法:

  1. 加速失效时间模型

  2. 广义线性回归

  3. 线性回归

聚类算法

  1. K-Means

数据挖掘

  1. 协同过滤

1.1 交替最小二乘法

2020, 算法, 总结, 学习


聚类补充

局部二分K-Means算法

高斯混合模型

隐含狄利克雷分布

特征工程


数据挖掘

  1. FP-growth

  2. PrefixSpan

统计算法

  1. 方差分析

  2. 卡方检验

  3. F检验

  4. KS-检验

  5. 相似度检验

5.1 欧几里得距离相似度

5.2 汉明距离(Hamming distance)

5.3 杰卡德相似系数(Jaccard similarity coefficient)

5.4 标准化欧氏距离 (Standardized Euclidean distance )

5.5 余弦相似度

5.6 皮尔逊相关系数(Pearson product-moment correlation coefficient)

5.7 切比雪夫距离(Chebyshev Distance)

5.8 闵可夫斯基距离(Minkowski Distance)

张怀义 at 2020-07-15
1

明天过来补充下 特征工程~

张怀义 at 2020-07-15
2

PCA 主成分分析

LSH 局部敏感哈希

  1. MinHashLSH 【杰卡德相似系数】

  2. BucketedRandomProjectionLSH【欧几里得距离】

IDF 逆文本频率

DCT 离散余弦变换

张怀义 at 2020-07-15
3