중복값 제거하는 방법
구글 스프레드에서 데이터를 입력하거나 다른 데이터를 복사해오는 경우 값들이 중복되어 저장되어 있는 경우가 있습니다. 이 경우 중복을 제거하여 표시해야하는 경우가 많습니다. 중복이 있는 데이터의 중복을 제거하고 중복된 값이 몇개가 있는 지 확인하는 방법을 알아보겠습니다.
아래와 같이 주어진 입력을 살펴보면 중복값이 많이 있다는것을 알 수 있습니다. "가나다", "설악산"등 중복된 값들이 많이 보입니다.
우선 중복값을 제거하기 전에 어떤 값이 중복되고 몇개가 중복되는 지 확인이 필요할 수 있습니다. 중복된 값들을 제거하고 나면 이 정보를 알 수 없으니 중복을 제거하기 전에 확인해야 합니다.
우선 중복값들의 정보를 확인할 행 또는 열을 선택합니다. 행과 열이 아닌 경우 필요한 부분만 선택하면 됩니다. 각 값들의 중복된 갯수를 알기 위해서 우선 중복을 제거한 고유값을 확인합니다. 원본데이터를 유지하기 위해 값을 복사하여 사용합니다.
위와 같이 C열에 원복 정보를 복사하였습니다. 복사한 데이터 영역을 선택한 후
아래와 같이 <데이터> - <데이터 정리> - <중복 항목 삭제>를 선택합니다.
중복 항목을 삭제하면 아래와 같이 C열에는 9개의 값만 남고 중복된 값들은 삭제됩니다. 이제 각 고유한 값들의 중복 빈도를 확인하기 위해서 countif()함수를 사용합니다.
countif는 지정된 범위에서 기준을 만족하는 값의 갯수를 결과로 리턴합니다. <설악산>의 중복 빈도를 확인하기 위해서 =count(A2:A15, C2)와 같이 함수를 입력합니다. "A2:A15"는 값을 확인할 범위이며 "C2"는 범위에서 갯수를 세기위한 기준을 입력합니다. 기준은 C2를 선택하였습니다.
따라서 A2~A14 범위에서 C2와 같은값이 있는 경우에 대한 갯수를 리턴합니다. 값은 2로 2개의 설악산값이 있는 것을 확인할 수 있습니다.
중복을 제거한 모든 값들에 대해서 함수를 수행하면 각 항목의 중복 갯수를 확인할 수 있습니다.
'Programming > google 스프래드시트' 카테고리의 다른 글
[구글스프레드] 웹사이트 정보가져오기 (importxml) (5) | 2021.12.25 |
---|---|
[구글스프레드] 조건에 따라 강조, 색바꾸기 또는 서식 바꾸기 (조건부서식) (0) | 2021.12.25 |
[구글스프레드] 조건에 맞는 범위의 합 구하기 (0) | 2021.12.25 |
[구글스프레드] 조건을 만족하는 항목 갯수 (countif, countifs) (0) | 2021.12.21 |
[구글스프레드] 조건에 맞는 범위를 가져오기 (filter) (0) | 2021.02.01 |