R中的双变量分布热图
本文概述 教程目标 自行车共享数据集 功能选择 直方图 将双变量分布拟合到你的数据 热图 总结 作为数据科学家, 你将必须分析数据集中要素的分布。通常, 这是通过使用直方图完成的, 这对于显示值的可变范围, 其偏差以及值集中的位置非常有用。...
本文概述 教程目标 自行车共享数据集 功能选择 直方图 将双变量分布拟合到你的数据 热图 总结 作为数据科学家, 你将必须分析数据集中要素的分布。通常, 这是通过使用直方图完成的, 这对于显示值的可变范围, 其偏差以及值集中的位置非常有用。...
本文概述 PCA简介 一个简单的PCA 绘制PCA 解释结果 ggbiplot的图形参数 自定义ggbiplot 添加新样品 将新样品投影到原始PCA上 包起来 主成分分析(PCA)是一种用于探索性数据分析的有用技术, 可让你更好地可视化包...
我认为数据可视化是显示任何数据块上任何描述性和分析性报告的最佳技术。我是喜欢数据可视化的人。你可以在一个屏幕上很好地显示整个故事, 这也取决于数据的复杂性。如果你正在阅读本教程, 那么我认为你必须了解R中的Ggplot2软件包, 该软件包用...
本文概述 介绍 环境设置先决条件 数据库设置(仅本教程需要) 定义要发送到SQL Server的函数 将执行发送到SQL 学到更多 本文了解如何从Jupyter Notebook远程发送R和Python执行到SQL服务器。 介绍 你是否知道...
本文概述 支持向量机算法 非线性数据 R中的支持向量机 总结 在机器学习中, 支持向量机是带有相关学习算法的监督学习模型, 该算法分析用于分类和回归分析的数据。但是, 它们主要用于分类问题。在本教程中, 我们将尝试深入了解SVM的工作原理,...
本文概述 时间序列分解 检测剩余部分的异常 上下限异常转换 调整分解参数 调整参数以进行异常检测 当我们谈论异常时, 我们考虑的是异常值或异常事件的数据点。在小数据集中, 识别这些事件很容易, 并且可以通过一些简单的分析图(例如箱线图)来完...
本文概述 什么是马尔可夫链? 什么是吸收马尔可夫链? 销售速度分析 总结 什么是马尔可夫链? 马尔可夫链是一个数学系统, 它根据给定的概率规则经历从一种状态到另一种状态的转变。马尔可夫链是随机过程, 但是它们的区别在于它们必须缺少任何...
当我们谈论R中的调试时, 在python和其他编程IDE上工作的人会感到有些负面。 R本身有一些有用的功能, 例如traceback()和browser()以及RStudio中的交互式工具, 但是不知何故, 内置功能无法解决一些限制。在这种...
本文概述 循环矢量 R中For循环的概述视频 遍历数据帧行 遍历矩阵元素 如果你想参加我们的金融中级R课程, 请点击这里。 循环矢量 当你知道要重复几次操作时, for循环是个不错的选择。 for循环的想法是, 你逐步执行一个序列, 一次执...
本文概述 建立清单 创建一个命名列表 创建一个命名列表(2) 如果你想免费学习R入门课程, 请点击这里。 建立清单 让我们创建第一个列表!要构建列表, 请使用函数list(): 列表函数的参数是列表组件。请记住, 这些成分可以是矩阵, 向量...