본문 바로가기
  • Hello_
728x90
반응형

Python66

[Python] Pandas로 암호화된 엑셀 파일 읽기 본 포스팅에서는 암호화된 엑셀 파일을 읽기 위해 전처리를 진행하고 pandas를 활용하여 읽어보고자 한다. 암호화된 엑셀파일 간혹 엑셀파일을 접하다 보면 암호화되어 밑에 그림과 같이 암호를 입력해야 열리는 파일들이 있다. 이 파일들은 pandas로 바로 읽으려고 하면 "XLRDError: Can't find workbook in OLE2 compound document"와 같은 오류가 발생하여 데이터를 로드하지 못한다. 이를 위해 새로운 라이브러리를 설치하여 암호화된 파일을 읽어보자. msoffcrypto-tool "msoffcrypto-tool"을 설치하여 암호화된 워드 파일 혹은 엑셀 파일을 읽을 수 있는 형태로 변환시켜 준다. 아래 링크는 msoffcrypto-tool 라이브러리의 github이다... 2023. 2. 9.
[Python] try except 활용하여 오류 모아보기 본 포스팅에서는 for 문과 try except를 사용해서 예외 처리를 함과 동시에 발생한 오류를 모아서 출력하는 알고리즘을 구성하고자 한다. try except 구문 try except 구문은 예외처리를 할 때 사용되며 try문 안에 실행하고자 하는 내용을 포함시키고 만일 try문에서 오류가 발생하면 except문으로 넘어간다. 즉 예외로 처리할 내용을 except문 안에 기입하면 된다. 간혹 대용량 데이터 처리를 하는 중 중간에 오류가 발생하여 실행되던 코드가 중단되는 경험은 한두 번씩 있을 것이다. 이럴 때 유용한 구문이 try except 구문으로 오류가 발생하더라도 우선은 모든 데이터를 처리한 뒤에 예외 데이터를 처리할 수 있도록 해준다. 다만 어떤 데이터가 예외 데이터이며 어떠한 오류로 인해 .. 2023. 2. 8.
[Python] numpy로 csv 파일 내용 가져오기 본 포스팅에서는 np.genfromtxt를 활용하여 csv 파일 내용을 로드하고자 한다. np.genfromtxt np.genfromtxt는 아래 설명과 같이 텍스트 파일에서 데이터를 로드하는 데 사용된다. 여러 가지 인자들이 입력 가능한데 이번 포스팅에서는 많이 사용될 몇 가지 예시만 들어볼 생각이다. np.genfromtxt 활용 아래와 같이 int형태의 숫자들로 이뤄진 int.csv 파일을 활용해 보겠다. np.genfromtxt는 반환되는 데이터의 형태는 "dtype"인자에 해당 데이터 형태를 입력시켜 준면 된다. import numpy as np np.genfromtxt('./dataset/int.csv') # default float # array([111., 112., 113., 544., .. 2023. 2. 6.
[Python_Error] TypeError: cannot concatenate object of type '<class 'dict'>'; only Series and DataFrame objs are valid 본 포스팅은 업무 중 발생했던 오류들을 예시를 통해 어떻게 해결을 하는지 작성했다. TypeError: cannot concatenate object of type ''; only Series and DataFrame objs are valid 해당 오류는 pandas.concat을 활용할 경우 안에 인자의 리스트 요소 중 데이터프레임이 아니고 dictionary인 경우 발생한 오류이다. 오류가 발생했던 코드이며, 가장 밑에 "df = pd.concat([ct_dict,xray_df])" 라인에서 오류가 나왔다. xray_excel_path = './new_annotation.xlsx' for i in range(10): ct_dict = {} ct_dict['name'] = 'ct_{}'.format(.. 2023. 2. 4.
728x90
반응형