Ver el principio y el fin de una base de datos en R

Ver el principio y el fin de una base de datos en R

Cuando tenemos grandes bases de datos, nos puede interesar echar un vistazo rápido a cómo son estos datos. De este modo, nos podemos hacer una idea de la información que contiene. Para ver el principio y el fin de una base de datos en R vamos a emplear dos funciones clave: head() y tail().

Ver el principio y el fin de una base de datos en R

Las funciones head() y tail() se encuentran dentro del paquete utils. Este paquete se carga normalmente al iniciar R. De modo predeterminado, estas dos funciones nos van a ofrecer 6 valores, que serán las 6 primeras o las 6 últimas filas, según la función utilizada.

Vamos a cargar los datos iris como ejemplo.

data(iris)

Vamos a ver el tamaño de este conjunto de datos iris. Es decir, vamos a ver cuántas filas y columnas tiene. Para ello, vamos a emplear la función dim().

dim(iris)
## [1] 150   5

Esto nos indica que iris está compuesto por 150 filas (observaciones) y 5 columnas (variables).

Función head() para ver el principio

Vamos a ver las primeras filas de iris. Como mencionamos anteriormente, la función head() nos devuelve de modo predeterminado 6 filas u observaciones.

head(iris)
##   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1          5.1         3.5          1.4         0.2  setosa
## 2          4.9         3.0          1.4         0.2  setosa
## 3          4.7         3.2          1.3         0.2  setosa
## 4          4.6         3.1          1.5         0.2  setosa
## 5          5.0         3.6          1.4         0.2  setosa
## 6          5.4         3.9          1.7         0.4  setosa

Función tail() para ver el final

Vamos a ver las últimas filas de iris. Como mencionamos anteriormente, la función tail() nos devuelve de modo predeterminado 6 filas u observaciones.

tail(iris)
##     Sepal.Length Sepal.Width Petal.Length Petal.Width   Species
## 145          6.7         3.3          5.7         2.5 virginica
## 146          6.7         3.0          5.2         2.3 virginica
## 147          6.3         2.5          5.0         1.9 virginica
## 148          6.5         3.0          5.2         2.0 virginica
## 149          6.2         3.4          5.4         2.3 virginica
## 150          5.9         3.0          5.1         1.8 virginica

Cambiar el número de filas a mostrar

Ahora bien, podemos cambiar el número de filas a mostrar en ambas funciones añadiendo un segundo argumento (n). Pongamos por ejemplo que queremos ver 5 filas del principio y 10 del final del conjunto de datos iris.

head(iris, n = 5)  # mostramos 5 filas
##   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1          5.1         3.5          1.4         0.2  setosa
## 2          4.9         3.0          1.4         0.2  setosa
## 3          4.7         3.2          1.3         0.2  setosa
## 4          4.6         3.1          1.5         0.2  setosa
## 5          5.0         3.6          1.4         0.2  setosa
tail(iris, n = 10) # mostramos 10 filas
##     Sepal.Length Sepal.Width Petal.Length Petal.Width   Species
## 141          6.7         3.1          5.6         2.4 virginica
## 142          6.9         3.1          5.1         2.3 virginica
## 143          5.8         2.7          5.1         1.9 virginica
## 144          6.8         3.2          5.9         2.3 virginica
## 145          6.7         3.3          5.7         2.5 virginica
## 146          6.7         3.0          5.2         2.3 virginica
## 147          6.3         2.5          5.0         1.9 virginica
## 148          6.5         3.0          5.2         2.0 virginica
## 149          6.2         3.4          5.4         2.3 virginica
## 150          5.9         3.0          5.1         1.8 virginica