데이터 프레임에서 한글만 제거하기
데이터 프레임에서 특정 문자를 포함하는 경우에 대해 다루고 싶다면 정규표현식을 떠올려보자.
예시 코드
예를 들어 아래와 같은 데이터 프레임이 있다고 하자.
만약 숫자만 남기고 싶다면 정규식을 이용하면 된다.
df['col_1']=df['col_1'].str.replace(pat=r'[ㄱ-ㅣ가-힣]+', repl= r'', regex=True)
단 컬럼별로 해야 한다.
df['col_1']=df['col_1'].str.replace(pat=r'[ㄱ-ㅣ가-힣]+', repl= r'', regex=True)
df['col_2']=df['col_2'].str.replace(pat=r'[ㄱ-ㅣ가-힣]+', repl= r'', regex=True)
반응형