6.4.2 데이터프레임 정보 추출과 대입
① 데이터프레임 합 계산
df.sum()으로 모든 열의 합을 구할 수 있다.
df.sum()
# 6.4.2 사고(건) 2433
# 6.4.2 사망(명) 98
# 6.4.2 부상(명) 4899
# 6.4.2 dtype: int64
df.sum(axis=0)은 축 axis=0에 따라 이동(위에서 아래로 수직으로)하며 합을 구한다. 코드 df.sum()과 같으며 모든 열의 합을 구할 수 있다.
df.sum(axis=0)
다음 df.sum(axis=1)은 axis=1에 따라 이동(왼쪽에서 오른쪽으로 수평으로)하며 합을 구한다. 즉, 모든 행의 합을 구할 수 있다.
df.sum(axis=1)
함수 cumsum()은 누적 합을 구하는 함수로, 다음 df.cumsum(axis=0)은 위에서 아래로 수직으로 누적 합을 구한다. 즉, 모든 열의 누적 합을 구할 수 있다. 예를 들어 ‘사고(건)’의 3행은 처음부터 3행까지의 합이 표시된다. 결국, 마지막 행은 2016년의 전체 합이 된 결과가 표시된다.
df.cumsum(axis=0)
다음 df.cumsum(axis=1)로 왼쪽에서 오른쪽으로 수평으로 누적 합을 구한다. 즉, 모든 행의 누적 합을 구할 수 있다. 예를 들어 ‘2016년1월’의 3열은 1열부터 3열까지의 합이 표시된다. 다음 테이블에서는 단위가 다르므로 의미가 크게 없다.
df.cumsum(axis=1)
② 데이터프레임 평균 계산
df.mean()으로 모든 열의 평균을 구할 수 있다.
df.mean()
# 6.4.2 사고(건) 202.750000
# 6.4.2 사망(명) 8.166667
# 6.4.2 부상(명) 408.250000
# 6.4.2 dtype: float64
df.mean(axis=0)은 axis=0에 따라 이동(위에서 아래로 수직으로)하며 평균을 구한다. df.mean()과 같으며 모든 열의 평균을 구할 수 있다.
df.mean(axis=0)
다음 df.mean(axis=1)은 axis=1에 따라 이동(왼쪽에서 오른쪽으로 수평으로)하며 평균을 구한다. 이 코드로 모든 행의 평균을 구할 수 있다.
df.mean(axis=1)
또한, 다음으로 전체 평균을 구할 수 있다.
df.mean(axis=None)
# 6.4.2 ```
#### ③ 데이터프레임 최대 최소 계산
`df.max()`는 모든 열의 최댓값을 구할 수 있다.
```python
df.max()
# 6.4.2 사고(건) 239
# 6.4.2 사망(명) 13
# 6.4.2 부상(명) 522
# 6.4.2 dtype: int64
df.max(axis=0)은 축 axis=0에 따라 이동(위에서 아래로 수직으로)하며 최댓값을 구한다. 다음 코드는 df.max()와 같으며 모든 열의 최댓값을 구할 수 있다.
df.max(axis=0)
다음 df.max(axis=1)은 axis=1에 따라 이동(왼쪽에서 오른쪽으로 수평으로)하며 최댓값을 구한다. 이 코드로 모든 행의 최댓값을 구할 수 있다.
df.max(axis=1)
또한, 다음으로 전체에서 최댓값을 구할 수 있다.
df.max(axis=None)
# 6.4.2 ```
`df.min()`으로 모든 열의 최솟값을 구할 수 있다.
```python
df.min()
# 6.4.2 사고(건) 168
# 6.4.2 사망(명) 4
# 6.4.2 부상(명) 328
# 6.4.2 dtype: int64
df.min(axis=0)은 축 axis=0에 따라 이동(위에서 아래로 수직으로)하며 최솟값을 구한다. 다음 코드는 df.min()과 같으며 모든 열의 최솟값을 구할 수 있다.
df.min(axis=0)
다음 df.min(axis=1)은 axis=1에 따라 이동(왼쪽에서 오른쪽으로 수평으로)하며 최솟값을 구한다. 이 코드로 모든 행의 최솟값을 구할 수 있다.
df.min(axis=1)
또한, 다음으로 전체에서 최솟값을 구할 수 있다.
```python df.min(axis=None)