• 使用逻辑运算符检测r中的多个模式?

    我正在尝试检测检测数据帧中一个变量中是否存在某些模式组合。 有一些相似的问题,但是我找不到一个能完全回答我要达到的目标的问题。 我试图找到: 如果存在模式 使用逻辑运算符(和或,不= $,|,!)定义多个模式 忽略大小写 将输出作为另一列返回true / false 我仍然找不到修复程序,但我将分享到目前为止的操作,以获取您的指导: 创建一个样本数据框 x=structure(list(Sources = structure(c(1L, 7L, 6L, 8L, 9L, 4L, 3L, 5L, 2L),...
  • R中具有多个变量的重组聚集

    这是mydata的一部分 mydat=structure(list(channel_id = c(219038L, 1755L, 1755L, 219038L, 1755L, 1755L, 1755L, 1755L, 219038L, 1755L, 1755L, 1755L, 219038L, 1755L, 1755L, 1755L), multifr_type = c(0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L), o...
  • 遍历数据而不是在R中建立索引

    我正在尝试使用Rmarkdown将数据转换为html文档,并且目前依靠转换为矢量和索引来解决我的问题。 尽管我的样本数据有4个观测值,但我的实际数据集却有30多个记录,因此索引似乎很麻烦且不自然。 是否有更好的方法按顺序提取这些元素?任何建议都很好。 -- title: "Rmarkdown report" output: html_document --- ```{r echo = FALSE} mydata <- data.frame(First = c("John", "Hui"...
  • 有条件地添加行并更新随后的行

    我想在数据框中的某些条件之前添加一行。在这种情况下,每当“天”列大于等于3时,我想在前面插入一行。 问题涉及到从一个城市到另一个城市的旅行,因此,如果两次旅行之间的天数大于等于3,我希望该团队返回其故乡,然后从那里开始下一次旅行。因此,新的行应反映本国城市的正确坐标,并应更新下一次行程的坐标(下一行),因为团队将从不同的城市出发。 以下是数据集的示例 Date <- c("2017-10-20", "2017-10-22", "2017-10-25", "2017-10-26", "2017-10-27",...
  • 将相同的值分散到多列中

    这是我的首发df test <- data.frame(ident = c(1,2,3,4,5), cult1 = c("CER", "CER", "CER", "INF", "INF"), cult2 = c("GEX", "GEX", "GEX", "GEX", "GEX"), cult3 = c(NA, "ORG", "ORG", NA, NA), ...
  • 调用函数抛出错误/手动运行行不会

    好的,我正在努力寻找合适的方式来描述我的问题。抱歉,这是一个愚蠢的问题,我仍在学习。 我有一系列小的data.frame,它们的名称定期为“ CountX_YYYY”(X代表特定情况,YYYY代表给定的年份)。我编写了一个函数,该函数首先获取它们的某种类型(X),然后将它们全部绑定并清除id(年份),如下所示: library(dplyr) analysis <- function(case_pattern){ cases <- mget(ls(pattern = case_pattern)) %>...
  • 计算新列作为R数据框中所选列的平均值

    我有一个很大的(ish)数据框,并且我想使用dplyr mutate函数(或合适的替代方法)来计算所选列的平均值。 例如,假设我有一个数据框,如下所示: colnames(dall) [1] "Code" "LA.Name" "LA_Name" "Jan.20" "Feb.20" "Mar.20" "Apr.20" "May.20" "Jun.20" [10] "Jul.20" "Aug.20" "Sep.20" "Oct.20" "Nov.20" "Dec.20" "Jan....
  • 使用权重进行采样并替换为sample_n()函数

    所有, I have a dplyr sample_n() question. I'm trying to sample with replacement while using the weight option and I seem to be hitting a snag. Namely, sampling with replacement is consistently oversampling a group. It's not a problem I'm getting when samplin...
  • 如何合并多个变量并创建新的数据集?

    https://www.kaggle.com/nowke9/ipldata ----- Contains the IPL Data. 这是对IPL数据集进行的探索性研究。 (上面链接的数据链接)将文件“ id”和“ match_id”合并后,我又创建了四个变量,分别是total_extras,total_runs_scored,total_fours_hit和total_sixes_hit。现在,我希望将这些新创建的变量组合到一个数据框中。当我将这些变量分配给单个变量batsman_aggregate并仅选...
  • 如何使用dplyr基于另一个值创建列,而不必写下每个值?

    有什么办法可以更有效地做到这一点?我想创建一个项目类型的列。每个参与者都有不同数量的项目,所以这确实很棘手。这是我的数据的一个玩具示例 structure(list(id = c(1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, ...
  • 用R生成全面的报告格式

    我已经从MySQL服务器中获取了一些信息到R中,这在我的R数据帧中如下所示: barcode_no Inspection_date current_profile score Tag_log prod_log 12345678 2020-01-15 14:34:13 Large 10 C1 WIP 12345678 2020-01-15 18:33:11 Medium ...
公告

欢迎访问 goshare  点击这里设置您的邮箱  可以接收站内跟帖、回复邮件提醒,不错过任何一条消息。

关注公众号订阅更多技术干货! 码农俱乐部