본문 바로가기
Programming/google 스프래드시트

[구글스프레드] 중복값 제거하기, 중복 갯수 확인하기

by 느리게 걷는 즐거움 2021. 12. 25.
반응형

중복값 제거하는 방법

구글 스프레드에서 데이터를 입력하거나 다른 데이터를 복사해오는 경우 값들이 중복되어 저장되어 있는 경우가 있습니다. 이 경우 중복을 제거하여 표시해야하는 경우가 많습니다. 중복이 있는 데이터의 중복을 제거하고 중복된 값이 몇개가 있는 지 확인하는 방법을 알아보겠습니다.

 

아래와 같이 주어진 입력을 살펴보면 중복값이 많이 있다는것을 알 수 있습니다. "가나다", "설악산"등 중복된 값들이 많이 보입니다.

우선 중복값을 제거하기 전에 어떤 값이 중복되고 몇개가 중복되는 지 확인이 필요할 수 있습니다. 중복된 값들을 제거하고 나면 이 정보를 알 수 없으니 중복을 제거하기 전에 확인해야 합니다.

우선 중복값들의 정보를 확인할 행 또는 열을 선택합니다. 행과 열이 아닌 경우 필요한 부분만 선택하면 됩니다. 각 값들의 중복된 갯수를 알기 위해서 우선 중복을 제거한 고유값을 확인합니다. 원본데이터를 유지하기 위해 값을 복사하여 사용합니다.

위와 같이 C열에 원복 정보를 복사하였습니다. 복사한 데이터 영역을 선택한 후

아래와 같이 <데이터> - <데이터 정리> - <중복 항목 삭제>를 선택합니다.

중복 항목을 삭제하면 아래와 같이 C열에는 9개의 값만 남고 중복된 값들은 삭제됩니다. 이제 각 고유한 값들의 중복 빈도를 확인하기 위해서 countif()함수를 사용합니다. 

countif는 지정된 범위에서 기준을 만족하는 값의 갯수를 결과로 리턴합니다. <설악산>의 중복 빈도를 확인하기 위해서 =count(A2:A15, C2)와 같이 함수를 입력합니다. "A2:A15"는 값을 확인할 범위이며 "C2"는 범위에서 갯수를 세기위한 기준을 입력합니다. 기준은 C2를 선택하였습니다. 

따라서 A2~A14 범위에서 C2와 같은값이 있는 경우에 대한 갯수를 리턴합니다. 값은 2로 2개의 설악산값이 있는 것을 확인할 수 있습니다.

중복을 제거한 모든 값들에 대해서 함수를 수행하면 각 항목의 중복 갯수를 확인할 수 있습니다.

반응형