转自:
1.数据管理
numeric:数值型向量
logical:逻辑型向量 character;字符型向量list:列表 data.frame:数据框 c:连接为向量或列表 √length:求长度subset:求子集 √seq,from:to,sequence:等差序列 √rep:重复 NA:缺失值 NULL:空对象 sort,order,unique,rev:排序 unlist:展平列表 attr,attributes:对象属性 mode,typeof:对象存储模式与类型 √names:对象的名字属性二、字符串处理
character:字符型向量
nchar:字符数 substr:取子串format,format C:把对象用格式转换为字符串paste,strsplit:连接或拆分charmatch,pmatch:字符串匹配 √grep,sub,gsub:模式匹配与替换 √三、复数
complex,Re,Im,Mod,Arg,Conj:复数函数四、因子
factor:因子codes:因子的编码 levels:因子的各水平的名字 nlevels:因子的水平个数 cut:把数值型对象分区间转换为因子 table:交叉频数表 split:按因子分组 aggregate:计算各数据子集的概括统计量 tapply:对“不规则”数组应用函数
五、计算
+, -, *, /, ^, %%, %/%:四则运算
ceiling,floor,round,signif,trunc,zapsmall:舍入 √max,min,pmax,pmin:最大最小值 range:最大值和最小值 √sum,prod:向量元素和积 cumsum,cumprod,cummax,cummin:累加、累乘 √sort:排序 approx和approx fun:插值diff:差分 √sign:符号函数六、数学函数
abs,sqrt:绝对值,平方根
log, exp, log10, log2:对数与指数函数 √sin,cos,tan,asin,acos,atan,atan2:三角函数 sinh,cosh,tanh,asinh,acosh,atanh:双曲函数beta,lbeta,gamma,lgamma,digamma,trigamma,tetragamma,pentagamma,choose ,lchoose:与贝塔函数、伽玛函数、组合数有关的特殊函数fft,mvfft,convolve:富利叶变换及卷积 polyroot:多项式求根 poly:正交多项式 spline,splinefun:样条差值 besselI,besselK,besselJ,besselY,gammaCody:Bessel函数 deriv:简单表达式的符号微分或算法微分七、数组
array:建立数组
matrix:生成矩阵 data.matrix:把数据框转换为数值型矩阵 √lower.tri:矩阵的下三角部分 mat.or.vec:生成矩阵或向量t:矩阵转置
cbind:把列合并为矩阵 √rbind:把行合并为矩阵 √diag:矩阵对角元素向量或生成对角矩阵 aperm:数组转置 nrow, ncol:计算数组的行数和列数 dim:对象的维向量 √dimnames:对象的维名row/colnames:行名或列名%*%:矩阵乘法 crossprod:矩阵交叉乘积(内积)outer:数组外积 kronecker:数组的Kronecker积 apply:对数组的某些维应用函数 √tapply:对“不规则”数组应用函数 √sweep:计算数组的概括统计量 aggregate:计算数据子集的概括统计量scale:矩阵标准化 √matplot:对矩阵各列绘图 cor:相关阵或协差阵contrast:对照矩阵 row:矩阵的行下标集col:求列下标集八、线性代数
solve:解线性方程组或求逆
eigen:矩阵的特征值分解 √svd:矩阵的奇异值分解backsolve:解上三角或下三角方程组chol:Choleski分解 qr:矩阵的QR分解 chol2inv:由Choleski分解求逆九、逻辑运算
<,>,<=,>=,==,!=:比较运算符
!,&,&&,|,||,xor():逻辑运算符 logical:生成逻辑向量 all,any:逻辑向量都为真或存在真ifelse():二者择一 match,%in%:查找 √unique:找出互不相同的元素 √which:找到真值下标集合 √duplicated:找到重复元素 √十、统计分布
每一种分布有四个函数:d――density(密度函数),p――分布函数,q――分位数函数,r――随机数函数。
比如,正态分布的这四个函数为dnorm,pnorm,qnorm,rnorm列出各分布后缀,前面加前缀d、p、q或r就构成函数名:norm:正态t:t分布f:F分布chisq:卡方(包括非中心) unif:均匀exp:指数weibull:威布尔gamma:伽玛beta:贝塔 lnorm:对数正态logis:逻辑分布 √cauchy:柯西binom:二项分布 √geom:几何分布hyper:超几何 nbinom:负二项pois:泊松 √signrank:符号秩, √wilcox:秩和 √tukey:学生化极差十一、简单统计量
sum, mean, var, sd, min, max, range, median, IQR(四分位间距)等为统计量
sort,order,rank与排序有关,其它还有ave,fivenum,mad,quantile,stem等//其中var是variant是方差的意思。
//其他包括,取均值,五分位数,中位数,茎叶图等。
十二、统计检验
R中已实现的有chisq.test,prop.test,t.test
十三、多元分析
cor,cov.wt,var:协方差阵及相关阵计算 √
biplot,biplot.princomp:多元数据biplot图 cancor:典则相关 princomp:主成分分析 hclust:谱系聚类 kmeans:k-均值聚类 cmdscale:经典多维标度 其它有dist,mahalanobis,cov.rob十四、时间序列
ts:时间序列对象
diff:计算差分 time:时间序列的采样时间 window:时间窗六、统计模型
lm,glm,aov:线性模型、广义线性模型、方差分析