时间:2017-6-9来源:本站原创作者:佚名

前言:

应用背景兼吐槽

继续延续之前每个月至少一次更新博客,归纳总结学习心得好习惯。这次的主题是论R与excel的结合,又称论如何正确把EXCEL文件喂给R处理分为:1、xlsx包安装及注意事项2、用vba实现xlsx批量转化csv

以及,这个的对象,针对跟我一样那些从R开始接触编程的,一直以来都是用excel做数据分析的人……编程大牛请轻拍

之所以要研究这个,是因为最近工作上接了个活,要把原来在excel端的报表迁移到R端,自动输出可视化图形,并制作PDF或PPT。

这个活可以分为四个阶段:1)源数据整理与搭建需求分析2)依据需求,R语言数据处理及输出处理后数据+图表3)用markdown或者其他手段自动把图表复制到报告里4)报告使用人自己编辑整合数据。

全程要求除了数据准备不是自动化,其他都要是自动化,能省就省。。而R本身与xlsx的融合并不好。

而R读取xlsx数据,就是我遇到的第一道槛。这个活的数据都是人工从公司网页端数据库下载后储存在xlsx里的(用sql直连数据库的权限很难开)。尝试过直接从数据库端下载csv格式,但是一来格式时有错漏,二来直接下csv格式文件大小过大(单个文件从几兆变成几十兆),所以最终还是决定以xlsx格式储存,再另作打算。

相信对于那些从excel迁移到R工作的人,也会遇到同样的问题:

一、xlsx包

首先尝试用R包解决。即xlsx包。

xlsx包在加载时容易遇到问题。基本都是由于java环境未配置好,或者环境变量引用失败。因此要首先配置java环境,加载rJava包。

百度了一下,网上已有很多解决方案。我主要是参考这个帖子,操作步骤为:

1、安装最新版本的java。如果你用的R是64位的,请下载64位java。下载







































北京去哪个医院看白癜风好
北京白癜风治疗费用

转载请注明原文网址:http://www.gzdatangtv.com/bcyykf/7043.html

------分隔线----------------------------