데이터 프레임에서 한글만 제거하기 데이터 프레임에서 특정 문자를 포함하는 경우에 대해 다루고 싶다면 정규표현식을 떠올려보자. 예시 코드 예를 들어 아래와 같은 데이터 프레임이 있다고 하자. 만약 숫자만 남기고 싶다면 정규식을 이용하면 된다. df['col_1']=df['col_1'].str.replace(pat=r'[ㄱ-ㅣ가-힣]+', repl= r'', regex=True) 단 컬럼별로 해야 한다. df['col_1']=df['col_1'].str.replace(pat=r'[ㄱ-ㅣ가-힣]+', repl= r'', regex=True) df['col_2']=df['col_2'].str.replace(pat=r'[ㄱ-ㅣ가-힣]+', repl= r'', regex=True)
데이터 프레임에 빈 행 추가하기 추가하는 개념을 생각했을 땐 append를 떠올리기 쉽다. 그러나 어떤 빈 값을 추가하면 안 되고 빈 시리즈나 빈 데이터 프레임 자체를 추가 해줘야 한다. 나는 인덱스에 특정 값을 넣은 상태에서 빈 행을 추가해야 하기 때문에 아래와 같이 작성했다. 예시 코드 df = df.append(pd.Series(name=idx_name)) name 이라는 파라미터에 넣고싶은 인덱스 변수를 넣으면 idx_name을 가진 빈행이 추가된다.
오류 메세지 무시하기 가끔 파이썬으로 엑셀파일을 열면 경고 메세지가 뜬다. (왜 뜨는지는 모르겠다 ㅠㅇ ㅠ) 오류는 아니기에 무시할 수 있지만 결과창에 메세지가 뜨기 때문에 디버깅 하는 데에 불편하다. 편의를 위해 무시해보자. 예시 코드 import warnings # 오류 경고 무시하기 warnings.filterwarnings(action='ignore') # 오류 메세지 다시 보이게 하기 warnings.filterwarnings(action='default') 이 코드를 추가하면 오류메세지를 없앨 수 있다.
situation 판다스로 작업한 후 csv파일로 저장하는 일이 종종 있다. 그럴 때 언어가 한글일 경우 깨지는 경우가 있는데 보통은 encoding = 'utf-8' 로 한다고 하지만 이렇게 해도 깨지는 경우가 있다. solution encoding='utf-8-sig' 혹은, 'ms-949'로 하면 해결 된다.