groupby

Develop/TroubleShooting

IndexError: Column(s) contents already selected 해결

pandas.groupby 실행 중 이러한 오류가 떴다면 contents에 해당하는 컬럼이 groupby 후 계산할 수 없는 컬럼일 확률이 높다. 따라서 type이 object일 경우, contents.fillna('')를 이용해 빈 행을 채워줘야 한다.

Language/Python

[python] groupy 문자열 합치기

groupby로 문자열 합치기 groupby는 보통 통계 낼 때 많이 쓰지만 문자열 자체를 합칠 때도 쓸 수 있다. 합칠 때 ,나 / 혹은 띄어쓰기로도 합칠 수 있으니 상황에 맞게 중간자를 선택하면 된다. 예시 코드 data.groupby(['hid','date'], as_index=False).agg(lambda x: ','.join(set(x)))

Language/Python

[python] groupby 에서 index 사용 안 하기 - pandas

multi index 피하기 groupby를 쓰면 기본적으로 멀티인덱스가 생성된다. 이 멀티인덱스가 groupby한 후의 전처리를 방해하므로 추후 작업이 남아있다면 멀티인덱스를 생성하는 파라미터를 False로 지정해주는 게 좋다. 예시 코드 'as_index = False' 라는 파라미터를 추가해주자.

향식이
'groupby' 태그의 글 목록