显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

Mobius-Band

 
 
 
 
 
 

R语言将不规则的数据框规范化

2016-7-28 22:03:59 阅读44 评论0 282016/07 July28

        有时为了将数据写入数据库,会有将几个数据写成一个字符串存在一个字段里的情况。如果遇到这种情况,从数据库里读出的数据其实不是标准的R语言data.frame结构,而实质上有点像list结构。如下图所示。
R语言将不规则的数据框规范化 - Mobius-Band - Mobius-Band
        这种结构显然不利用后续的分析,为此,我们需要将这种不规范的data.frame结构规范化。
        这里只是提供一种思路处理该类问题。
首先我们要做的是将y中的每个元素独立出来,这里我们使用stringr包中str_split_fixed(string, pattern, n)函数。这个函数有3个参数,第一个数需要拆分的字符串,第二个是一个正则表达式告诉函数在哪里拆分,第三个参数在解决这个问题上十分有用,它表示将这个字符串拆成多少个。如果不够,默认以""空字符串补至该个数。

作者  | 2016-7-28 22:03:59 | 阅读(44) |评论(0) | 阅读全文>>

R语言reshape2包笔记

2015-7-11 0:37:01 阅读148 评论0 112015/07 July11

reshape2包是reshape包的重写版,都是对数据进行清洗、整合、汇总。reshape2包的核心思想是创造一个“熔化”的数据集版本(通过melt函数),然后“投射”(用dcast或acast函数)到一个对象中。

默认的情况下,melt函数将因子和整数值变量当作编号变量来处理,把其余的变量作为分析变量。你也可以通过melt函数中的id.var=或measure.var=这两个参数自行设定编号变量和分析变量。

我们以R中自带的state.x77和state.region两个数据集合并起来形成的数据集为例:

states=data.frame(state.x77,state=row.names(state.x77),region=state.region,row.names = 1:50)

作者  | 2015-7-11 0:37:01 | 阅读(148) |评论(0) | 阅读全文>>

R语言数据出--文本处理(字符串的分离与合并)

2015-7-7 23:55:28 阅读58 评论0 72015/07 July7

利用R语言处理字符串的分离与合并主要运用的是:strsplite()(字符串的分离) 和paste()(字符串的合并)这两个函数。
这两函数的具体参数如下:

作者  | 2015-7-7 23:55:28 | 阅读(58) |评论(0) | 阅读全文>>

R语言数据处理--日期数据筛选

2015-7-4 21:11:45 阅读171 评论0 42015/07 July4

有时我们在处理时间数据时,需要对数据进行筛选,例如:需要筛选出某一年某一个月份的全部数据。这时就需要对日期进行筛选,以下介绍几种常用的日期数据筛选方法。
1、对DATE类和POSIX类的筛选

作者  | 2015-7-4 21:11:45 | 阅读(171) |评论(0) | 阅读全文>>

R语言数据处理--日期数据(利用as.Date函数)

2015-7-4 21:07:37 阅读51 评论0 42015/07 July4

数据是自2009-01-05至2011-02-22的证券交易回报率。

作者  | 2015-7-4 21:07:37 | 阅读(51) |评论(0) | 阅读全文>>

查看所有日志>>

 
 
 
 
 
 
 
 

湖北省 武汉市

 发消息  写留言

 
博客等级加载中...
今日访问加载中...
总访问量加载中...
最后登录加载中...
 
 
 
 
 
 
 
心情随笔列表加载中...
 
 
 
 
 
 
 
博友列表加载中...
 
 
 
 
 

发现好博客

 
 
列表加载中...
 
 
 
 
 
 
 
列表加载中...
 
 
 
 
 
 我要留言
 
 
 
留言列表加载中...
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2018

注册 登录  
 加关注