본문 바로가기
반응형

pandas20

판다스 데이터프레임을 파일로 저장 판다스 데이터프레임을 파일로 저장판다스 데이터프레임을 파일로 저장하는 방법을 정리합니다. 판다스 라이브러리는 다양한 파일형태의 데이터를 읽고 쓸 수 있습니다. 자주사용하는 파일형태에 대해서 정리합니다.CSV데이터프레임을 파일로 저장 시 'to_csv'함수를 사용하고 파일에서 읽을 때 'read_csv'함수를 사용한다. 'index_col'인자를 이용하여 index로 정할 colume index를 전달한다.import pandas as pd# Write to the CSV filedf = pd.DataFrame({'name' : ["abc", "def"], 'age' : [10, 20]})display(df)df.to_csv('./person_info.csv', mode='.. 2024. 5. 23.
Python에서 날짜 다루기 - 날짜만 사용하기 Python에서의날짜 다루기 Python은 날짜와 시간을 다루는데 유용한 다양한 라이브러리와 내장 기능을 제공합니다. 이 글에서는 Python에서의 날짜 관리에 대한 기본 개념과 유용한 라이브러리를 소개하겠습니다. 기본적인 날짜 다루기 Python의 내장 모듈인 datetime은 날짜와 시간을 다루는 데 사용됩니다. 다음은 기본적인 사용 예제입니다. 기본 내장 모듈이기 때문에 라이브러설치가 필요없습니다. import datetime as dt # 현재 날짜와 시간 가져오기 current_datetime = dt.datetime.now() # 날짜와 시간 출력 print(current_datetime) 2024-03-12 07:22:25.688533 현재 시간을 확인할 수 있습니다. datetime 모듈은.. 2024. 3. 12.
[Pandas] Cleaning Data Cleaning Data 분석을 위해 읽어온 원본 데이터의 데이터 타입이 올바른지 확인하지 않으면 분석과정에 사용하는 다양한 통계적 지표나 필터결과가 오류를 발생시킨다. 원데이터를 datetime, "int", "category"데이터로 형식을 변화시키고 category와 int형 데이터의 describe()함수의 결과의 차이를 확인한다. # Cleaning data and difference btwn describe() of int, category data types import pandas as pd import datetime as dt df = pd.DataFrame({"year": ['1900','1901','1910','2021', &.. 2022. 12. 22.
[Pandas] Text파일의 데이터 읽기 Pandas 라이브러리로 text파일을 읽는 방법을 정리한다. 아래와 같은 형태의 text파일 읽는 경우를 가정한다. #으로 시작하는 라인은 주석으로 데이터를 읽을 때 무시하도록 한다. 아래와 같이 read_csv()함수를 이용하여 파일을 읽어올 때 데이터를 구분하는 구분자를 "\n"으로 설정하고 무시해야하는 주석의 시작 문자인 "#"을 전달한다. text파일에는 header가 없기 때문에 header=None으로 설정한다. # Using Numpy to import flat files import pandas as pd data = pd.read_csv('read_test.txt', sep="\n", header=None, comment='#', ) data 결과는 위외 같은 pandas 객체로 데이터.. 2022. 12. 20.
[Pandas] 스태킹과 언스테이킹 스태킹과 언스태킹¶ 피벗함수와 유사한 .stack()과 .unstack()이 있습니다. 스태킹은 칼럼 레이블과 그 값을 로우 인덱스와 값으로 회전시킵니다. 언스테이킹은 로우 인덱스와 그 값이 칼럼 레이블과 값으로 회전 되도록 변경합니다. In [5]: import pandas as pd sensor_readings = pd.DataFrame({ "axis" : ['x', 'x', 'x', 'x', 'x', 'y','y','y','y','y'], "error" : [0,1,0,0,0,1,1,0,1,0]}, index = {0,1,2,3,4,5,6,7,8,9}) se.. 2022. 1. 17.
[Pandas] 데이터 피봇팅 데이터 피봇팅¶ 데이터 중 정보가 스택양식으로 로우에 연속적으로 표현된 경우가 있습니다. axis의 x,y에 대한 index별 status값이 로우에 연속적으로 저장된 행방향 데이터를 열 방향 데이터로 변경하는 것을 피봇(Pivot)이라고 합니다. In [1]: import pandas as pd sensor_readings = pd.DataFrame({"index" : [0,1,2,3,4,0,1,2,3,4], "axis" : ['x', 'x', 'x', 'x', 'x', 'y','y','y','y','y'], "status": [10,11,12,13,14,105.. 2022. 1. 16.
[Pandas] 데이터 결합/병합 .merge() 데이터 결합(병합) .merge()¶ 병합은 서로다른 데이터프레임 객체에 동일하게 존재하는 값을 통해 양쪽 데이터를 연관 지어 하나의 데이터프레임으로 모델링할 수 있는 유용한 방법입니다. In [114]: kospi = pd.read_csv("./^KS11.csv", index_col ='Date') kospi.head() Out[114]: Open High Low Close Adj Close Volume Date 2020-12-28 2820.949951 2834.590088 2799.560059 2808.600098 2808.600098 1006200 2020-12-29 2810.550049 2823.439941 2792.060059 2820.510010 2820.510010 104680.. 2022. 1. 8.
[Pandas] 데이터접합 방향설정 및 이름설정 데이터 접합 방향 설정 및 그룹이름 지정 (keys)¶ 연결하는 2개의 데이터프레임의 구조가 다른 경우 연결 시 정보가 없는 부분을 NaN으로 처리합니다. In [239]: df1 = pd.DataFrame(np.arange(0,10).reshape(2,5), columns=['c1', 'c2', 'c3', 'c4', 'c5']) df1 Out[239]: c1 c2 c3 c4 c5 0 0 1 2 3 4 1 5 6 7 8 9 In [238]: df2 = pd.DataFrame(np.arange(10,20).reshape(5,2), columns = ['c1', 'c6']) df2 Out[238]: c1 c6.. 2022. 1. 7.
반응형