6.2.4 2차원 행렬의 테이블 데이터 사용
다음 코드처럼 첫 인자에 1차원 리스트를 대입하면 하나의 열이 있는 데이터프레임을 만들 수 있다. 달리 지정하지 않으면 행과 열의 레이블은 기본인 RangeIndex(0인 정수 시퀀스)로 정해진다.
import pandas as pd
df = pd.DataFrame([10, 20, 30, 40, 50])
print(df)
다음 코드처럼 2차원 리스트를 data로 사용하고 index(행 레이블)를 지정할 수 있다. 여전히 열 레이블은 기본인 RangeIndex이다. 2차원 리스트가 그대로 행과 열이 된다.
import pandas as pd
df = pd.DataFrame([[1, 2, 3], [10, 20, 30], [100, 200, 300]],
index=list('abc'))
print(df)
다음 columns=['A', 'B', 'C']로 열 레이블을 직접 지정할 수 있다.
df = pd.DataFrame([[1, 2, 3], [10, 20, 30], [100, 200, 300]],
index=list('abc'), columns=['A', 'B', 'C'])
print(df)
데이터프레임의 index와 columns는 다음으로 참조할 수 있다.
print(df.index)
print(df.columns)
다음처럼 키워드 인자 data에 np.arange()를 대입해 2차원 데이터를 지정할 수 있다.
import numpy as np
import pandas as pd
df1 = pd.DataFrame(data = np.arange(12).reshape(3, 4))
print(df1)
다음처럼 키워드 인자 data가 없이 첫 인자에 기술해도 상관없다.
df1 = pd.DataFrame(np.random.randint(1, 46, (5, 6)))
print(df1)
다음처럼 5행 6열의 [0, 1) 사이의 난수를 가진 데이터프레임을 만들 수 있다.
df1 = pd.DataFrame(np.random.random((5, 6)))
print(df1)
서브목차