欢迎光临散文网 会员登陆 & 注册

给数据集拍个X片看看——R语言xray包介绍

2023-08-19 21:25 作者:五柳冰冰  | 我要投稿

---
title: "给数据集拍个X片看看——R语言xray包"
author: "wuliubingbing"
date: "2023-08-19"
output: html_document
---

```{r setup, include=FALSE}
knitr::opts_chunk$set(echo = TRUE)
library(xray)
```


把本文全部复制粘贴到Rmarkdown中编译


# xray包

R 包,用于在数据集上显示 X射线视觉。此包允许您分析数据集的变量,以评估数据的形状。当您拥有用于建模的数据时,将此视为第一步,您可以使用此包来分析所有变量,并检查是否有任何值得转换甚至完全避免该变量的奇怪之处。

#异常检测

xray::anomalies

分析所有列的异常情况,无论它们是 NA、零、无限等,如果检测到至少 80% 的行具有这些异常的变量,则会向您发出警告。当所有行具有相同的值时,它还会警告您。

```{r}
head(mtcars,10) %>% knitr::kable()
```


```{r}

anomalies(mtcars, anomaly_threshold=0.5)
```

#分布

xray::distributions尝试分析变量的分布,以便了解每个变量的统计结构。它还返回数值变量的百分位数表作为结果,该表可以通知您数据的形状。

```{r}
distributions(mtcars)
```


# 时间序列

xray::timebased还会调查您的分布,但会显示随时间的变化,因此,如果分布随时间发生任何变化(例如,变量停止或开始收集),您可以轻松地将其可视化。

```{r}
head(longley,10) %>% knitr::kable()
```


```{r}
data(longley)
longley$Year=as.Date(paste0(longley$Year,'-01-01'))
timebased(longley, 'Year')
```


给数据集拍个X片看看——R语言xray包介绍的评论 (共 条)

分享到微博请遵守国家法律