IndexError: Column(s) contents already selected 해결
pandas.groupby 실행 중 이러한 오류가 떴다면 contents에 해당하는 컬럼이 groupby 후 계산할 수 없는 컬럼일 확률이 높다. 따라서 type이 object일 경우, contents.fillna('')를 이용해 빈 행을 채워줘야 한다.
pandas.groupby 실행 중 이러한 오류가 떴다면 contents에 해당하는 컬럼이 groupby 후 계산할 수 없는 컬럼일 확률이 높다. 따라서 type이 object일 경우, contents.fillna('')를 이용해 빈 행을 채워줘야 한다.
준비물: github 계정, git bash 프로그램 1. github 사이트에서 new repository 생성 이 때 git 주소 미리 복사하기! 2. git bash을 키고 git을 연동하고자 하는 로컬주소로 이동 3. 'git clone git주소' 입력 이 때 git 주소는 1-1에서 복사해둔 주소 이렇게 하면 repository명으로 폴더와 폴더 내 .git 폴더와 README.md 생성됨 이렇게 하면 연동이 끝났다:) 그 후의 commit, push, pull 등은 다른 연동방법과 동일하게 진행하면 된다. git add . git status git commit -m '커밋메세지' git push [origin] [브랜치명]
오늘은 python을 이용하여 excel 여러 시트의 저장하는 방법을 알아보도록 하자. 시트별로 저장하는 기능은 pandas 라이브러리를 이용하면 쉽게 적용할 수 있다. 예제를 통해서 보면 간단하다. 하나의 엑셀 파일 내 여러 시트에 저장 import pandas as pd writer = pd.ExcelWriter(SAVE_DIR, engine='openpyxl') # SAVE_DIR: excel 파일을 저장하고자 하는 경로 # dfresult: 저장하고자 하는 데이터 dfresult1.to_excel(writer, sheet_name='dfresult1의 시트명') dfresult2.to_excel(writer, sheet_name='dfresult2의 시트명') dfresult3.to_excel(w..
먼저 큐라는 개념이 필요한데 큐는 선입선출(FIFO)의 자료구조라고 할 수 있다. Queue 라고도 하는데, Queue라는 단어 자체가 표 같은 것을 구매하기 위해 줄서는 것을 의미한다. 데이터가 들어오는 위치는 가장 뒤에 있고, 데이터가 나가는 위치는 가장 앞에 있어서, 먼저 들어오는 데이터가 먼저 나가게 된다. 이러한 큐를 양방향으로 쓸 수 있게 만든 자료구조가 데크(deque)이다. deque 특징 큐를 양방향으로 쓸 수 있게 만든 자료 구조 양 끝 element에 대해서 append와 pop 가능 스택과 큐를 동시에 사용 가능 무엇보다 데크를 사용해야 하는 이유는 속도에 있다. 리스트는 O(n)인데 데크는 O(1)이고 각각 n번씩 반복하면 리스트 구현은 O(n^2)지만 데크 구현은 O(n) 성능의..
오늘은 암호가 걸려 있는 엑셀 파일을 파이썬으로 해제하는 방법에 대해 알아보자. 데이터는 보안에 굉장히 유의해야 하기 때문에 유출을 방지하고자 암호가 걸려 있는 경우가 많다. 엑셀 암호를 해제해도 되고 몇 개 없다면 직접 들어가 암호를 제거 해주겠지만.. 그렇지 않다면? 그리고 데이터 양이 많을 경우 엑셀 파일 한 개를 열고 닫는데도 시간이 꽤 걸린다:( import os import msoffcrypto import pandas as pd # 암호화된 엑셀 파일 경로 raw_path = '' # 해당 파일명 file = '' # 저장하고자 하는 엑셀 파일 경로 new_path = '' f = msoffcrypto.OfficeFile(open(os.path.join(raw_path, file)), 'rb..
이번에는 각 프로세스의 결괏값들을 합쳐 멀티 프로세싱 이후 다른 작업을 해보도록 하자. 기본 멀티프로세싱 코드는 이전에 작성한 포스트에서 확인 가능하다:) 2022.07.28 - [IT/python] - [python] joblib을 이용하여 멀티프로세싱(multi processing) 적용하기 [python] joblib을 이용하여 멀티프로세싱(multi processing) 적용하기 오늘은 joblib 라이브러리로 멀티프로세싱 하는 방법을 알아보자. 멀티프로세싱 예제 코드를 검색하면 대부분 import multiprocessing로 작성하는 예제가 나오는데 필자는 joblib으로 코드를 익혀서 hyang2data.tistory.com 분명 저장하는 방법이 있을 거 같은데 구글링 해도 전부 import..