个性化阅读
专注于IT技术分析

R中的数据帧

本文概述

如果你想免费学习R入门课程, 请点击这里。

访问和细分数据帧(1)

与向量相比, 更常见的是, 你将想要对数据帧进行子集化或访问某些列。同样, 执行此操作的方法之一是使用[]。表示法就像矩阵!这里有些例子:

选择第一行:cash [1, ]

选择第一列:Cash [, 1]

按名称选择第一列:cash [, ” company”]

使用说明

  • 选择现金的第三行和第二列。
  • 选择现金的”年”列的第五行。

如果这有意义, 请继续进行下一个练习!如果没有, 这是一个概述视频。

数据帧概述视频

访问和设置数据帧(2)

就像你想象的那样, 从数据框中选择特定的列是一种常见的操作。实际上, 它是如此普遍, 以至于它有自己的捷径, 即$。以下返回相同的答案:

cash$cash_flow

[1] 1000 4000  550 1500 1100  750 6000

cash[, "cash_flow"]

[1] 1000 4000  550 1500 1100  750 6000

有用吗?试试看!

使用说明

  • 使用$从现金中选择”年份”列。
  • 使用$从现金中选择” cash_flow”列, 并将其乘以2。
  • 你可以通过为列分配NULL来删除它。运行删除”公司”的代码。
  • 现在再次打印出现金。

访问和设置数据帧(3)

通常, 仅从数据框中选择一列并不是你要做的全部。如果你仅对公司A的现金流量感兴趣, 该怎么办?为了获得更大的灵活性, 请尝试使用subset()!

subset(cash, company == "A")

  company cash_flow year
1       A      1000    1
2       A      4000    3
3       A       550    4

这里发生了一些重要的事情:

  • 传递给subset()的第一个参数是数据框的名称cash。
  • 请注意, 你不应该在公司中加引号!
  • ==是相等运算符。它进行测试以找出两个事物相等的地方, 并返回一个逻辑向量。有关这些关系运算符的知识还有很多, 你可以在第二门金融课程”金融中级R”中学习所有有关它们的知识!

使用说明

  • 使用subset()仅选择与公司B对应的现金行
  • 现在具有在一年内到期的现金流的subset()行。

添加新列

在一个理想的世界中, 你可以100%确定你将收到所有现金流量。但是, 由于这些都是对未来的预测, 因此总会有人无法支付!你决定对最坏的情况进行一些分析, 在这种情况下, 你只会收到预期现金流量的一半。为了保存最坏的情况以供以后分析, 你决定将其作为新列添加到数据框中!

cash$half_cash <- cash$cash_flow * .5

cash

  company cash_flow year half_cash
1       A      1000    1       500
2       A      4000    3      2000
3       A       550    4       275
4       B      1500    1       750
5       B      1100    2       550
6       B       750    4       375
7       B      6000    5      3000

就是这样!在数据框中创建新列就像将新信息分配给data_frame $ new_column一样简单。通常, 新创建的列是对现有列的某种转换, 因此$运算符在这里确实派上用场!

使用说明

  • 创建一个新的最坏情况, 即你只收到预期现金流量的25%, 并将其添加到数据框中, 作为Quarter_cash。
  • 如果花了两倍的时间(按年计算)会怎样呢?在这种情况下添加一个新列double_year。

如果你想从本课程中学习更多信息, 请点击这里。

赞(0)
未经允许不得转载:srcmini » R中的数据帧

评论 抢沙发

评论前必须登录!