본문 바로가기
728x90
반응형

전체 글692

[Pandas] 리인덱싱 리인덱싱¶ Pandas에서 리인덱싱은 Series의 데이터가 가진 index를 변경하는 동작을 수행합니다. index를 새로 생성 시 기존의 index와 동일한 shape를 만족하지 않는 경우에도 동작하며 리인덱싱을 사용하면 좀 더 유연한 방법으로 새 인덱스를 만들 수 있다. In [ ]: s1 = pd.Series(np.random.rand(4), index = ['a', 'b', 'c', 'd']) s1 In [ ]: s2 = s1.reindex(['a','c','i']) s2 리인덱스를 이용하여 s2 series를 생성할 경우 기존에 s1 series가 가진 index인 'a', 'c'에 해당하는 값은 s2에 복사되었고 'i' index의 경우 s1에 값이 존재하지 않기 때문에 NaN값으로 저장되었.. 2022. 1. 1.
[Pandas] 불리언 선택 불리언 선택¶ 불리언 선택은 Series의 값 값에 필터링을 위한 논리식을 설정하고 이를 이용하여 새로운 Series객체를 생성하는 방식입니다. In [ ]: test_data = pd.Series(np.arange(0, 10), index = list(['a1','a2','a3','a4','a5','a6','a7','a8','a9','a10'])) In [ ]: test_data a1 ~ a10을 index로 하는 test_data series 객체를 생성하였습니다. test_data series객체는 0~9까지의 값을 가지고 있습니다. In [ ]: logic_filter = test_data >= 5 logic_filter test_data >= 5 의 비교문 수행한 결과를 logic_filter에.. 2021. 12. 31.
2021년 12월 자산군별 수익률 비교 (듀얼 모멘텀) 포트폴리오를 구성하기 위해서 자산군별 수익률을 비교하고 있습니다. 매월 자산군의 수익률을 비교하여 모멘텀이 높은 자산군으로 포트폴리오를 구성하는 작업은 하나의 자산군에 투자가 집중되어 발생하는 변동성 리스크를 줄일 수 있습니다. 특히 역의 상관관계를 가지는 자산군을 조합한다면 그 효과는 더욱 커질 수 있을 것 같습니다. 2021년 12월 자산군별 수익률을 확인하여 자신에 맞는 포트폴리오 리벨런싱 작업을 수행하시면 좋을 것 같아 각 자산군별 수익률을 비교해봤습니다. 제 공부를 위한 정리 자료이니 틀린 부분이 있을 수 있습니다. 중요한 부분은 꼭 다시 한번 확인하시길 바랍니다. 위의 표의 가중 평균 부분만 추가로 설명드립니다. 저의 경우 1개월와 3개월 수익률을 상황에 맞게 가중치를 적용하여 가중 평균을 계.. 2021. 12. 31.
[Pandas] 날짜범위 index 만들기 날짜 범위 index 만들기¶ In [25]: test1_df.head() Out[25]: Math Science Name 0 10 70 Mike 1 20 80 Alice 2 30 90 Bob 3 40 100 Jane 4 50 10 Tony 날짜 정보를 index로 넣는 경우 날짜 정보를 가진 series를 만들어야 합니다 이 때 data_range()함수를 사용할 수 있습니다. In [28]: dates = pd.date_range('2021-01-01', '2021-01-10') dates Out[28]: DatetimeIndex(['2021-01-01', '2021-01-02', '2021-01-03', '2021-01-04', '2021-01-05', '2021-01-06', '2021-01-07.. 2021. 12. 26.
[Pandas] 데이터 프레임으로 파일로딩 데이터 프레임으로 파일데이터 로딩¶ In [4]: kospi_df = pd.read_csv("./^KS11.csv") In [6]: kospi_df.head() Out[6]: Date Open High Low Close Adj Close Volume 0 2020-12-28 2820.949951 2834.590088 2799.560059 2808.600098 2808.600098 1006200 1 2020-12-29 2810.550049 2823.439941 2792.060059 2820.510010 2820.510010 1046800 2 2020-12-30 2820.360107 2878.209961 2809.350098 2873.469971 2873.469971 1074000 3 2021-01-04 28.. 2021. 12. 26.
[Pandas] DataFrame 만들기 및 index 변경하기 DataFrame 만들기 및 index 변경하기 코드를 수행하기 전에 아래의 필요한 라이브러리를 추가가 필요합니다. import numpy as np import pandas as pd import pandas_datareader as pdr import datetime from datetime import datetime, date import matplotlib.pyplot as plt Data Frame 만들기 In [21]: score_math = pd.Series([10,20,30,40,50]) score_math Out[21]: 0 10 1 20 2 30 3 40 4 50 dtype: int64 In [23]: score_sci = pd.Series([70,80,90,100,10]) score.. 2021. 12. 26.
[구글스프레드] 차트에 값 겹쳐서 표현하기 (계단식/누적계단식) 차트에 값 겹쳐서 표현하기 (계단식/누적계단식 영역차트) 데이터가 전체를 이루는 부분인 경우 각 데이터 index에 값을 누적하여 표현하거나 같이 표현하는 것이 유리한 경우가 있습니다. 예를 과 가 있으며 2개의 요소의 비율을 쉽게 보기 위해서는 계단식 영역차트가 좋은 것 같습니다. 계단식 영역차트 위의 표를 계단식 영역차트로 표현하기 위해서 - 를 선택하여 차트 편집기를 실행합니다. 구글스프레드 우측에 차트 편집기가 실행되면 을 "계단식 영역 차트"로 선택합니다. 계단식 영역차트를 선택하면 과 가 같은 위치에 표시되어 로 표현된 각 데이터들의 과 의 차이가 쉽게 나타납니다. 4번과 8번이 값의 차이가 작은 것이 잘 나타납니다. 누적 계단식 영역차트 차트 편집기에서 차트 유형을 변경하여 "누적 계단식 영.. 2021. 12. 26.
728x90
반응형