• 熊猫重新采样不会更改时间增量

    我有一本字典,其中包含代表不同农作物(玉米,大豆,冬小麦和春小麦)的4个不同的键。每个键都有10个不同的数据数组作为字典中的值(温度,24小时温度变化等)。然后,我想根据数据创建两个新字典,从24小时变化值中分离出实际值(例如温度,降水量)。数据为6小时一次。 corn=glob.glob('/Users/eli/Documents/Python_data/plotly_practice/20200812_00/20200812_00_ec_ens_*'+'corn'+'_timeseries.nc') s...
  • 在Python数据帧中有效地运行行以建立交易信号

    我有一个数据框,我正在尝试建立指标并根据某个信号跟踪我的头寸/交易。信号是第一列(分数)。假设交易规则是: 如果得分> 1.则卖出。 如果得分<-1,则购买 如果头寸为负且得分低于0.5,则回购 如果我们有正面的位置并且得分高于-0.5,则回售 因此,我们只有在持仓或持仓时才可以卖出(因此,在第3行中,我们不会再卖出) 数据示例在第1列中,而我想在第2/3列中构建所需的输出: score trade position 0.9 0 0 1.1...
  • 如何在Python中的DataFrame列的数字或字符串中移动位置点?

    我正在尝试从具有股票价格的csv中读取数据,但是从某一行开始,而不是在csv上显示9.70,它说970.00,这是不正确的,因为时间流逝,股票价格上涨了在csv上显示12.28的结果显示为1228.00,因此我需要将小数点从一个地方移到另一个地方,即数据框的关闭列中。我已经尝试了几种方法,但是我一直做不到,这是我在论坛上的第一篇帖子,如果有人可以帮助我,我将不胜感激,在此先感谢您。 Open High Low Close ...
  • 小数据帧导致R崩溃

    我有一个(分组的)data.frames列表,它们都具有1或2行,并且都具有相同的列。其中两个数据帧按预期工作正常。但是,向控制台表达第三个数据帧或以任何方式操作它都会导致R崩溃。在某些R studio环境中,我什至无法使用readRDS()加载数据。第三数据是否有可能包含某些嵌入数据?如果可以,我该如何检查?确实不可能重现一个示例,因此我在此处将小数据集上传到了filedropper: https://www.filedropper.com/filemanager/public.php?service=f...
  • 根据内容合并数据帧单元

    我有一个继承的丑陋的数据框,如下所示: data.bad <- data.frame( 'NameId' = c('350-8D6A','BC2-85E2','426-C0FA','615-8E09','651-8D6F','DE8-3D0F','2B6-D039','5E9-EE00','38F-75E4','B02-FBBC','B7A-821E','95A-B349','A8C-4A7B','3F6-90A1'), 'Tribe' = c('Heliantheae','Heliantheae','Ci...
  • 从函数返回值的python问题

    我想使用函数时遇到问题。我有此错误信息: 2020-10-29 15:58:34,238 - freqtrade - ERROR - Fatal exception! Traceback (most recent call last): File "pandas/_libs/index_class_helper.pxi", line 36, in pandas._libs.index.Float64Engine._maybe_get_bool_indexer File "pandas/_libs/i...
  • 在R中读取一个csv文件

    我正在尝试从csv文件读取一些用R编写的数据,而不是使用数据框。 I used read.csv to extract the data from the file but I got always this error In read.table(file = file, header = header, sep = sep, quote = quote, : line 1 appears to contain embedded nulls . 这是R中使用数据帧的一部分代码: COL <- c("F...
  • 是否可以使用熊猫来过滤亿万行数据

    最近,我一直在处理包含近1亿行的大型数据集。 完全加载到内存后,该文件超过15GB。我将所有数据加载到内存中都没有问题,因为我有一台具有96GB内存的服务器。 这是info()的输出: <class 'modin.pandas.dataframe.DataFrame'> Int64Index: 97915924 entries, 0 to 117814626 Data columns (total 20 columns): # Column Non-Null Count ...
  • 根据条件在熊猫的帮助下删除行

    我创建了一些看起来像这样的数据: import pandas as pd d = {'Time': ['01.10.2019, 09:56:52', '01.10.2019, 09:57:15', '02.10.2019 09:57:23', '02.10.2019 10:02:58', '02.10.2019 13:11:58', '02.10.2019 13:22:55', '03.10.2019, 09:56:52', '03.10.2019, 09:57:15', '04.10.2019 09:57...
  • 将相同的值分散到多列中

    这是我的首发df test <- data.frame(ident = c(1,2,3,4,5), cult1 = c("CER", "CER", "CER", "INF", "INF"), cult2 = c("GEX", "GEX", "GEX", "GEX", "GEX"), cult3 = c(NA, "ORG", "ORG", NA, NA), ...
  • 为什么我的hdf5文件看起来这么大?

    我正在使用一个巨大的数据集(数百个GB),该数据集将4000万个标识符存储为32个字符的字符串,每个标识符包含数百或数千行数字数据。 为了节省空间并提高从磁盘读取数据的效率,似乎最好不要在数据集中重复识别符。例如,数据表看起来像 verylongstringidentifier1, 1.2 verylongstringidentifier1, 2.3 verylongstringidentifier1, 3.4 . . verylongstringidentifier2, 2.1 verylongstrin...
公告

欢迎访问 goshare  点击这里设置您的邮箱  可以接收站内跟帖、回复邮件提醒,不错过任何一条消息。

关注公众号订阅更多技术干货! 魅力技术资源分析