数据科学中的预处理(第3部分):扩展合成数据
在之前的两篇文章中, 我探讨了预处理数据在机器学习管道中的作用。特别是, 我检查了k最近邻(k-NN)和逻辑回归算法, 并发现缩放数值数据如何强烈影响前者的性能, 而不是后者的性能, 例如通过准确性来衡量(参见以下词汇表或以前的文章中有关缩...
在之前的两篇文章中, 我探讨了预处理数据在机器学习管道中的作用。特别是, 我检查了k最近邻(k-NN)和逻辑回归算法, 并发现缩放数值数据如何强烈影响前者的性能, 而不是后者的性能, 例如通过准确性来衡量(参见以下词汇表或以前的文章中有关缩...