r - 添加一列,其中包含具有最大频率的对象的值

我有这个矩阵:

mat=matrix(c(1,1,1,2,2,2,3,4,
             4,4,4,4,4,3,5,6,
             3,3,5,5,6,8,0,9,
             1,1,1,1,1,4,5,6),nrow=4,byrow=TRUE)
print(mat)
     [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8]
[1,]    1    1    1    2    2    2    3    4
[2,]    4    4    4    4    4    3    5    6
[3,]    3    3    5    5    6    8    0    9
[4,]    1    1    1    1    1    4    5    6

和一个子集,其中包含我要应用我的函数的行的索引:

subset=c(2,4)

我想在矩阵“mat”中添加一个新列,其中仅包含我指定的子集,该行中具有最大频率的对象的值。

在这种情况下:

  • 对于第 1 行,我希望在新列中有一个空单元格,
  • 对于第 2 行,我想在新列中使用值“4”,
  • 对于第 3 行,我希望在新列中有一个空单元格,
  • 对于第 4 行,我想在新列中使用值“1”。

编辑: 感谢答案中的代码! 现在我应该用其他值替换 NA 值: 我有另一个矩阵:

mat2=matrix(c(24,1,3,2, 4,4,4,4, 3,2,2,5, 1,3,5,1),nrow=4,byrow =TRUE)

     [,1] [,2] [,3] [,4]
[1,]   24    1    3    2
[2,]    4    4    4    4
[3,]    3    2    2    5
[4,]    1    3    5    1

和子集:

subset=c(1,3)

我想用具有最大值的行的值的列名替换矩阵的 NA(第一个子集的剩余行)。

在这种情况下,第一行为“1”,第三行为“4”。

最佳答案

您正在寻找模式。不幸的是,R 不提供内置模式功能。但是自己写一个并不难:

## create mode function
modeValue <- function(x) {
  ux <- unique(x)
  ux[which.max(tabulate(match(x, ux)))]
}

## add new column with NA
smat <- cbind(mat, NA)

## calculate mode for subset
smat[subset, ncol(smat)] <- apply(smat[subset, , drop=FALSE], 1, modeValue)
smat
#      [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9]
# [1,]    1    1    1    2    2    2    3    4   NA
# [2,]    4    4    4    4    4    3    5    6    4
# [3,]    3    3    5    5    6    8    0    9   NA
# [4,]    1    1    1    1    1    4    5    6    1

https://stackoverflow.com/questions/38461584/

相关文章:

shortcode - 如何获取联系表 7 的列表

google-chrome-extension - 卸载 Chrome 扩展时打开新窗口

gcc - ARM ;内联汇编;使用暂存器;

c - 解释为什么 j 得出 150?

solr - Sitecore 和 SolrCloud 开启重建

grails - 如何在grails中自定义spring security插件登录页面

xslt-2.0 - XSL :FO avoid Space between Table Cells

asp.net-mvc - EF 核心和 Azure

angularjs - 工厂方法总是在 AngularJs 中返回 undefined

amazon-web-services - CloudFormation 模板中元数据部分的用途是什