目录
- 通知内容
- 分析
-
- 1、[R语言入门——sqldf包 VS dplyr包](https://blog.csdn.net/weixin_46111814/article/details/112391788)
- 2、[R语言入门——批量读取文件](https://blog.csdn.net/weixin_46111814/article/details/112491345)
- 3、[数据可视化——一文入门ggplot2](https://blog.csdn.net/weixin_46111814/article/details/105555411)
- 4、[R语言入门——数据快速读取与查看](https://blog.csdn.net/weixin_46111814/article/details/103844575)
- 总结
通知内容
发布时间:2021年1月9号,下午6点51分。
分析
主要信息已经给出:美赛C题数据
比较大
,提前15天于2021年1月21号
发出,赛题正常时间给出。
那么唯一得信息量是数据量大。针对这个特点做如下分析:可是没说具体的规模。储存上是几百M
还是几个G
还是更大。不过庆幸的是大多数数据处理软件是没有数据规模限制的。我知道的除了excel
的存储上限是100万
行左右,但是超过50万
行就会运行卡顿,不过数据未必有这么大。其他的比较流行的python、R语言、matlab、PowerBI
都不会对数据有什么上限的要求,有也是很高的上限。其中PowerBi
是类似于excel
的作图思路。他的拖拉拽
相对其他编程软件简单易上手尤其是用过excel
的数据透视图的人来说。推荐大家抽时间突击一下。
我平时R语言用的比较多,接下来我会写几篇文章介绍一下R语言中处理大数据的一下工具和技巧。有兴趣的可以持续关注一下。记得是R语言、R语言、R语言。
在之前我也写过一些比较好的包的使用,虽然冰山一角,这里给大家总结列出几篇。
1、R语言入门——sqldf包 VS dplyr包
介绍了两个包一个是tidyverse
的核心包dplyr
,一个是调用sql语句的sqldf包
。分别从数据筛选、排序、分组汇总、选择变量
等角度做的实例。
2、R语言入门——批量读取文件
介绍了批量读取文件的一些技巧。
3、数据可视化——一文入门ggplot2
包ggplot2
也是tidyverse
的核心包。本文介绍了一些基本的语法。
4、R语言入门——数据快速读取与查看
介绍了一些常用数据的读取以及大型数据快速读取的一些参数。
总结
最后希望可以帮助大家学习R语言。水平有限发现错误还望及时评论区指正,您的意见和批评是我不断前进的动力。
转载:https://blog.csdn.net/weixin_46111814/article/details/112516322
查看评论