본문 바로가기
728x90
반응형

판다스13

[Pandas] 스태킹과 언스테이킹 스태킹과 언스태킹¶ 피벗함수와 유사한 .stack()과 .unstack()이 있습니다. 스태킹은 칼럼 레이블과 그 값을 로우 인덱스와 값으로 회전시킵니다. 언스테이킹은 로우 인덱스와 그 값이 칼럼 레이블과 값으로 회전 되도록 변경합니다. In [5]: import pandas as pd sensor_readings = pd.DataFrame({ "axis" : ['x', 'x', 'x', 'x', 'x', 'y','y','y','y','y'], "error" : [0,1,0,0,0,1,1,0,1,0]}, index = {0,1,2,3,4,5,6,7,8,9}) se.. 2022. 1. 17.
[Pandas] 데이터 피봇팅 데이터 피봇팅¶ 데이터 중 정보가 스택양식으로 로우에 연속적으로 표현된 경우가 있습니다. axis의 x,y에 대한 index별 status값이 로우에 연속적으로 저장된 행방향 데이터를 열 방향 데이터로 변경하는 것을 피봇(Pivot)이라고 합니다. In [1]: import pandas as pd sensor_readings = pd.DataFrame({"index" : [0,1,2,3,4,0,1,2,3,4], "axis" : ['x', 'x', 'x', 'x', 'x', 'y','y','y','y','y'], "status": [10,11,12,13,14,105.. 2022. 1. 16.
[Pandas] 데이터 결합/병합 .merge() 데이터 결합(병합) .merge()¶ 병합은 서로다른 데이터프레임 객체에 동일하게 존재하는 값을 통해 양쪽 데이터를 연관 지어 하나의 데이터프레임으로 모델링할 수 있는 유용한 방법입니다. In [114]: kospi = pd.read_csv("./^KS11.csv", index_col ='Date') kospi.head() Out[114]: Open High Low Close Adj Close Volume Date 2020-12-28 2820.949951 2834.590088 2799.560059 2808.600098 2808.600098 1006200 2020-12-29 2810.550049 2823.439941 2792.060059 2820.510010 2820.510010 104680.. 2022. 1. 8.
[Pandas] 데이터접합 방향설정 및 이름설정 데이터 접합 방향 설정 및 그룹이름 지정 (keys)¶ 연결하는 2개의 데이터프레임의 구조가 다른 경우 연결 시 정보가 없는 부분을 NaN으로 처리합니다. In [239]: df1 = pd.DataFrame(np.arange(0,10).reshape(2,5), columns=['c1', 'c2', 'c3', 'c4', 'c5']) df1 Out[239]: c1 c2 c3 c4 c5 0 0 1 2 3 4 1 5 6 7 8 9 In [238]: df2 = pd.DataFrame(np.arange(10,20).reshape(5,2), columns = ['c1', 'c6']) df2 Out[238]: c1 c6.. 2022. 1. 7.
[Pandas] 데이터 연결 (concat), 인덱스 연결 데이터의 접합/연결 (concat)¶ pandas에서 접합(concat)은 둘 이상의 pandas객체로부터 가져온 데이터를 연결해 새 객체로 만드는 과정을 말합니다. In [216]: df1 = pd.DataFrame(np.arange(10).reshape(5,2)) df1 Out[216]: 0 1 0 0 1 1 2 3 2 4 5 3 6 7 4 8 9 In [224]: df2 = pd.DataFrame(np.arange(10,20).reshape(5,2)) df2 Out[224]: 0 1 0 10 11 1 12 13 2 14 15 3 16 17 4 18 19 In [225]: pd.concat([df1, df2]) Out[225]: 0 1 0 0 1 1 2 3 2 4 5 3 6 7 4 8 9 0 10 1.. 2022. 1. 7.
[Pandas] 데이터 변경해서 새로운 컬럼생성 (MDD 컬럼) 데이터 변형¶ 데이터셋 대체하기¶ In [176]: kospi.head() Out[176]: Open High Low Close Adj Close Volume Date 2020-12-28 2820.949951 2834.590088 2799.560059 2808.600098 2808.600098 1006200 2020-12-29 2810.550049 2823.439941 2792.060059 2820.510010 2820.510010 1046800 2020-12-30 2820.360107 2878.209961 2809.350098 2873.469971 2873.469971 1074000 2021-01-04 2874.500000 2946.540039 2869.110107 2944.449951 2944.449.. 2022. 1. 7.
[Pandas] 중복 데이터 제거하기 중복 데이터 다루기 데이터프레임에는 중복 로우가 존재할 수 있습니다. 중복 데이터가 계산 결과에 영향을 주는 의미있는 데이터가 아니라면 중복 데이터를 적절하게 처리하는 것이 필요할 수 있습니다. df_duplicated = pd.DataFrame({'city': ['seoul']*3 + ['busan']*2, 'num' : ['02'] *3 + ['051']*2}) df_duplicated city num 0 seoul 02 1 seoul 02 2 seoul 02 3 busan 051 4 busan 051 도시 이름에 맞는 지역번호를 정보로 저장하는 데이터프레임으로 생성합니다. city 컬럼 정보를 이용하여 지역번호를 .. 2022. 1. 4.
728x90
반응형