[python] 부분 문자열 대체하기 - pandas
result = result.replace('(.*)E(.*)', r'\1F\2', regex=True)
result = result.replace('(.*)E(.*)', r'\1F\2', regex=True)
최댓값 value를 갖는 key 찾기 최댓값을 찾을 때는 항상 max함수를 기억하자. 예시 코드 max_key = max(dict, key=dict.get) 이렇게 하면 value값이 최대인 key를 찾을 수 있다.
situation 판다스로 작업한 후 csv파일로 저장하는 일이 종종 있다. 그럴 때 언어가 한글일 경우 깨지는 경우가 있는데 보통은 encoding = 'utf-8' 로 한다고 하지만 이렇게 해도 깨지는 경우가 있다. solution encoding='utf-8-sig' 혹은, 'ms-949'로 하면 해결 된다.
df.rename(columns = {'A':'a', 'B':'b'}, inplace=True)
multi index 피하기 groupby를 쓰면 기본적으로 멀티인덱스가 생성된다. 이 멀티인덱스가 groupby한 후의 전처리를 방해하므로 추후 작업이 남아있다면 멀티인덱스를 생성하는 파라미터를 False로 지정해주는 게 좋다. 예시 코드 'as_index = False' 라는 파라미터를 추가해주자.
특정 문자열 포함하는 행 제거하기 전처리를 하다보면 특정 문자열을 포함하는 행 전체를 제거할 일이 많다. 문자열 관련 전처리는 dataframe.str 으로 대부분 해결 되는데 오늘은 str.contains 를 이용해보자. str.contains 사용하기 dfresult = df[~df['Time'].str.contains("2021-03-01", na=False, case=False)] "2021-03-01"