博客
关于我
《百面机器学习》读书笔记(一)-特征工程
阅读量:319 次
发布时间:2019-03-04

本文共 2246 字,大约阅读时间需要 7 分钟。

???????????????????????????????????????????????????????????????????????????????????????????????????????

???????

???????????????????????????????????????????????????????????????????????????????????????

??????????????????

?????????????????????????????????????????????????????????Min-Max Scaling?????????Z-Score Normalization??

  • ??????????????????????????????????????????0?1??????

    \boxed{X_{norm} = \frac{X - X_{min}}{X_{max} - X_{min}}}

  • ????????????????????????????0?????1?

    \boxed{z = \frac{x - \mu}{\sigma}}

?????????????????????????????????????????????????????????????????????????????????????????????????????


???????

?????????????????????????????????????????????????????????????????

??????????

?????????????????

  • ??????????????????????????????????
  • ?????One-Hot Coding??????????????????????????????????
  • ??????????????????ID??????????????????????????????
  • ????????????????????????????????????????????????????????????????????????????????????


    ???????????

    ??????????????????????????????????????

    ???????????????????

    ????????????????????????????????????????????

  • ??????PCA?t-SNE??????????????
  • ????????L1/L2????????????????????
  • ????????????????????????????????????????
  • ???????????????????????????????????????????????????????????????


    ????????

    ??????????????????????????????????

    ????????????????????

    ???????????

  • ?????N-gram???

    • ???????????????????
    • N-gram??????????n-gram???
  • ??????Latent Dirichlet Allocation?LDA??????-?????????????

  • ????????????Word2Vec?GloVe?BERT???????????????

  • ?????????

    • ????????????????
    • LDA??????????????????
    • Word2Vec?BERT???????????????????????

    ??Word2Vec

    Word2Vec????2013????????????????????????

    Word2Vec?????????LDA?????????

    Word2Vec?????????????????CBOW?Skip-gram?????

    • CBOW????????????
    • Skip-gram????????????

    ???????????????????????CBOW????????????Skip-gram????????????

    ?LDA???Word2Vec????????????LDA???????????????????????????


    ??????????????

    ????????????????????????

    ??????????????????????????????????????

    ????????????????????????????

  • ???????L1/L2?????????????????
  • ????????????????????????????????
  • ?????????????????????????
  • ??????GAN???????????????????
  • ???????????????????????????????????????????????????????


    ??

    ???????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????

    转载地址:http://avpq.baihongyu.com/

    你可能感兴趣的文章
    Patching Array
    查看>>
    Spring源码学习(二):Spring容器之prepareContext和BeanFactoryPostProcessor的介绍
    查看>>
    PatchMatchStereo可能会需要的Rectification
    查看>>
    Path does not chain with any of the trust anchors
    查看>>
    Path形状获取字符串型变量数据
    查看>>
    PAT甲级——1001 A+B Format (20分)
    查看>>
    Skywalking原理
    查看>>
    PAT甲级——1006 Sign In and Sign Out (25分)
    查看>>
    PAT甲级——1007 Maximum Subsequence Sum (25分)
    查看>>
    PAT甲级——1009 Product of Polynomials (25分)(最后一个测试点段错误)
    查看>>
    Spring对jdbc的支持
    查看>>
    vagrant 的安装
    查看>>
    PayPal网站付款标准版(for PHP)
    查看>>
    Paystack Android SDK 集成与使用指南
    查看>>
    pbf格式详解,javascript加载导出pbf文件示例
    查看>>
    PBOC2.0与3.0的区别
    查看>>
    PbootCMS entrance.php SQL注入漏洞复现
    查看>>
    PbootCMS 前台RCE漏洞复现
    查看>>
    PBT
    查看>>
    PB级分析型数据库ClickHouse的应用场景和特性
    查看>>