본문 바로가기
Programming/google 스프래드시트

[구글스프레드] 중복값 제거하기, 중복 갯수 확인하기

by 느리게 걷는 즐거움 2021. 12. 25.
728x90
반응형

중복값 제거하는 방법

구글 스프레드에서 데이터를 입력하거나 다른 데이터를 복사해오는 경우 값들이 중복되어 저장되어 있는 경우가 있습니다. 이 경우 중복을 제거하여 표시해야하는 경우가 많습니다. 중복이 있는 데이터의 중복을 제거하고 중복된 값이 몇개가 있는 지 확인하는 방법을 알아보겠습니다.

 

아래와 같이 주어진 입력을 살펴보면 중복값이 많이 있다는것을 알 수 있습니다. "가나다", "설악산"등 중복된 값들이 많이 보입니다.

우선 중복값을 제거하기 전에 어떤 값이 중복되고 몇개가 중복되는 지 확인이 필요할 수 있습니다. 중복된 값들을 제거하고 나면 이 정보를 알 수 없으니 중복을 제거하기 전에 확인해야 합니다.

우선 중복값들의 정보를 확인할 행 또는 열을 선택합니다. 행과 열이 아닌 경우 필요한 부분만 선택하면 됩니다. 각 값들의 중복된 갯수를 알기 위해서 우선 중복을 제거한 고유값을 확인합니다. 원본데이터를 유지하기 위해 값을 복사하여 사용합니다.

위와 같이 C열에 원복 정보를 복사하였습니다. 복사한 데이터 영역을 선택한 후

아래와 같이 <데이터> - <데이터 정리> - <중복 항목 삭제>를 선택합니다.

중복 항목을 삭제하면 아래와 같이 C열에는 9개의 값만 남고 중복된 값들은 삭제됩니다. 이제 각 고유한 값들의 중복 빈도를 확인하기 위해서 countif()함수를 사용합니다. 

countif는 지정된 범위에서 기준을 만족하는 값의 갯수를 결과로 리턴합니다. <설악산>의 중복 빈도를 확인하기 위해서 =count(A2:A15, C2)와 같이 함수를 입력합니다. "A2:A15"는 값을 확인할 범위이며 "C2"는 범위에서 갯수를 세기위한 기준을 입력합니다. 기준은 C2를 선택하였습니다. 

따라서 A2~A14 범위에서 C2와 같은값이 있는 경우에 대한 갯수를 리턴합니다. 값은 2로 2개의 설악산값이 있는 것을 확인할 수 있습니다.

중복을 제거한 모든 값들에 대해서 함수를 수행하면 각 항목의 중복 갯수를 확인할 수 있습니다.

728x90
반응형