生物导体概论
本文概述 简要概述 Bioconductor R包装 生物导体利用 本文总结 在本教程中, 你将熟悉生物导体领域。这样, 你就可以对生物学实验的结果进行计算和统计分析, 因为任何研究人员都必须证明其结论的重要性。换句话说, 通过使用该项目,...
本文概述 简要概述 Bioconductor R包装 生物导体利用 本文总结 在本教程中, 你将熟悉生物导体领域。这样, 你就可以对生物学实验的结果进行计算和统计分析, 因为任何研究人员都必须证明其结论的重要性。换句话说, 通过使用该项目,...
本文概述 时间序列分解 检测剩余部分的异常 上下限异常转换 调整分解参数 调整参数以进行异常检测 当我们谈论异常时, 我们考虑的是异常值或异常事件的数据点。在小数据集中, 识别这些事件很容易, 并且可以通过一些简单的分析图(例如箱线图)来完...
本文概述 介绍 1.设置一个皮尤账户 2.将数据加载到R中 3.使用整洁的工具进行探索性数据分析 4.使用推断包进行整洁的假设检验 总结 本文我们学习如何访问来自皮尤研究中心的数据,将其加载到R &然后如何使用Tidyverse生态...
本文概述 当苏格兰足球遇上tidyverse 整理时间 在本教程中,我们将使用tidyr、dplyr和ggplot2来可视化一个赛季的足球比分,并研究进球和失球时间的趋势。 当苏格兰足球遇上tidyverse 我整理了当地足球队的一些数据,...
本文概述 Python:核心部分 通过pip管理项目依赖项 虚拟环境:隔离你的项目设置 项目脚手架:使用Cookiecutter很容易! 将它们放在一起:项目开发生命周期 对于开发人员而言, 正确配置其工作站可以简化开发体验。其中包括最佳工...
就像数学中一样, Python之类的编程语言也具有运算符。你可以将它们视为基于计算机科学的极其简单的功能。这些是可以简化计算机程序的最简单的操作。对于任何有抱负的数据科学家或软件工程师来说, 它们都是必不可少的知识。 在本教程中, 你将学习...
本文概述 什么是过度适合机器学习? 什么是正则化? 总结 在机器学习中, 你一定遇到过”过度拟合”一词。过度拟合是一种现象, 机器学习模型对训练数据建模得很好, 但是对测试数据的表现却不佳。对测试数据执行足够好的性能...
本文概述 什么是马尔可夫链? 什么是吸收马尔可夫链? 销售速度分析 总结 什么是马尔可夫链? 马尔可夫链是一个数学系统, 它根据给定的概率规则经历从一种状态到另一种状态的转变。马尔可夫链是随机过程, 但是它们的区别在于它们必须缺少任何...
本文概述 介绍 基本设定 $ L ^ 2 $平方的平方的导数 $ L ^ 2 $范数的导数 其他注意事项 介绍 线性代数是我们在数据科学中需要的基本数学工具之一。对这些概念有所了解可以增加你对各种算法的理解。这确实是数据科学/机器学习道路的...
本文概述 数据机制缺失 数据清理 聚合图 自旋图和自旋图 马赛克图 平行箱线图 平行坐标图 矩阵图 结论 最后的想法 数据丢失在每个数据科学家的日常工作中都会造成问题。我们应该归咎于他们吗?如果可以, 哪种方法合适?还是可以简单地删除缺少数...