Language/Python

[python] 데이터 프레임에서 한글만 제거 - pandas

향식이 2021. 5. 13. 11:13

 데이터 프레임에서 한글만 제거하기

데이터 프레임에서 특정 문자를 포함하는 경우에 대해 다루고 싶다면 정규표현식을 떠올려보자.

 

예시 코드

예를 들어 아래와 같은 데이터 프레임이 있다고 하자.

한글 지우기 전

만약 숫자만 남기고 싶다면 정규식을 이용하면 된다. 

 

df['col_1']=df['col_1'].str.replace(pat=r'[ㄱ-ㅣ가-힣]+', repl= r'', regex=True)

 

단 컬럼별로 해야 한다.

 

df['col_1']=df['col_1'].str.replace(pat=r'[ㄱ-ㅣ가-힣]+', repl= r'', regex=True)
df['col_2']=df['col_2'].str.replace(pat=r'[ㄱ-ㅣ가-힣]+', repl= r'', regex=True)

 

한글 지우고 난 후

반응형