给数据集拍个X片看看——R语言xray包介绍
---
title: "给数据集拍个X片看看——R语言xray包"
author: "wuliubingbing"
date: "2023-08-19"
output: html_document
---
```{r setup, include=FALSE}
knitr::opts_chunk$set(echo = TRUE)
library(xray)
```
把本文全部复制粘贴到Rmarkdown中编译
# xray包
R 包,用于在数据集上显示 X射线视觉。此包允许您分析数据集的变量,以评估数据的形状。当您拥有用于建模的数据时,将此视为第一步,您可以使用此包来分析所有变量,并检查是否有任何值得转换甚至完全避免该变量的奇怪之处。
#异常检测
xray::anomalies
分析所有列的异常情况,无论它们是 NA、零、无限等,如果检测到至少 80% 的行具有这些异常的变量,则会向您发出警告。当所有行具有相同的值时,它还会警告您。
```{r}
head(mtcars,10) %>% knitr::kable()
```
```{r}
anomalies(mtcars, anomaly_threshold=0.5)
```
#分布
xray::distributions尝试分析变量的分布,以便了解每个变量的统计结构。它还返回数值变量的百分位数表作为结果,该表可以通知您数据的形状。
```{r}
distributions(mtcars)
```
# 时间序列
xray::timebased还会调查您的分布,但会显示随时间的变化,因此,如果分布随时间发生任何变化(例如,变量停止或开始收集),您可以轻松地将其可视化。
```{r}
head(longley,10) %>% knitr::kable()
```
```{r}
data(longley)
longley$Year=as.Date(paste0(longley$Year,'-01-01'))
timebased(longley, 'Year')
```