본문 바로가기
  • Hello_
728x90
반응형

Python/Pandas5

[Python] Pandas를 활용하여 xls 파일 읽기 본 포스팅에서는 pandas를 활용하여 xls 파일을 읽는 법에 대해 얘기하고자 한다. pd.read_excel(xls) 오류 아래 그림에서 발생한 오류는 'xls' 엑셀 파일을 pd.read_excel로 읽으려고 할때 발생한 오류이다. 'xls'는 'xlsx' 확장자의 옛 버전으로 xlsx 파일을 읽고 쓰기 위해서는 openpyxl 라이브러리가 필요하지만 xls 파일을 열기위해서는 xlrd가 환경에 설치되어 있어야한다. 따라서 pandas로 xls 및 xlsx 파일 모두 자유롭게 읽고 쓰고 싶다면 openpyxl과 xlrd를 모두 설치하면 된다. xlrd 설치 xlrd는 아래와 같은 명령어를 통해 설치가 가능하다. # pip pip install xlrd # conda conda install -c a.. 2023. 2. 9.
[Python] Pandas로 암호화된 엑셀 파일 읽기 본 포스팅에서는 암호화된 엑셀 파일을 읽기 위해 전처리를 진행하고 pandas를 활용하여 읽어보고자 한다. 암호화된 엑셀파일 간혹 엑셀파일을 접하다 보면 암호화되어 밑에 그림과 같이 암호를 입력해야 열리는 파일들이 있다. 이 파일들은 pandas로 바로 읽으려고 하면 "XLRDError: Can't find workbook in OLE2 compound document"와 같은 오류가 발생하여 데이터를 로드하지 못한다. 이를 위해 새로운 라이브러리를 설치하여 암호화된 파일을 읽어보자. msoffcrypto-tool "msoffcrypto-tool"을 설치하여 암호화된 워드 파일 혹은 엑셀 파일을 읽을 수 있는 형태로 변환시켜 준다. 아래 링크는 msoffcrypto-tool 라이브러리의 github이다... 2023. 2. 9.
[Python] Pandas와 for 문으로 엑셀 데이터 밑으로 붙이기 본 포스팅에서는 "pandas.concat을 활용하여 데이터 프레임을 합치는 방법"과 "for문을 활용하여 엑셀 데이터를 위로 혹은 밑으로 계속 붙이는 방법"에 대해 설명하고자 한다. Dataframe 합치기 다음과 같이 두 가지 엑셀 파일이 있고 이 두 개를 각각 데이터프레임으로 로드하여 합쳐보자. csv 파일 혹은 xlsx 파일을 읽고 데이터프레임을 사용하는 방법은 아래 링크를 참고하면 된다. [Python] pandas로 xlsx 파일과 csv 파일 읽기 본 포스팅에서는 excel 파일의 확장자인 xlsx와 csv를 비교해 보고 padas로 각각 읽는 법에 대해 얘기하겠다. 'xlsx' vs 'csv' xlsx 파일은 이진파일로 구성이 되어 있으며 편집을 하는데 제한이 있다. 또한 baembaemb.. 2023. 2. 4.
[Python] pandas로 xlsx 파일과 csv 파일 읽기 본 포스팅에서는 excel 파일의 확장자인 xlsx와 csv를 비교해 보고 padas로 각각 읽는 법에 대해 얘기하겠다. 'xlsx' vs 'csv' xlsx 파일은 이진파일로 구성이 되어 있으며 편집을 하는데 제한이 있다. 또한 메모리 사용량이 많지만 대용량 파일을 조작하는데 쉽다. 개발자가 프로그래밍으로 조작하기에는 상대적으로 어렵다. 반대로 csv 파일은 단순 텍스트 파일이다. 이러한 특징으로 인해 여러 텍스트 편집기에서 열 수 있고 메모리 사용량이 적다. 물론 텍스트 파일이기에 프로그래밍으로 조작하기에 용이하다. 다만 대용량 파일을 조작하는 데는 제한이 많다. 형식 편집기 메모리 사용량 대용량 파일 조작 프로그래밍 조작 유연성 EXCEL (.xlsx) 이진 형식 제한적 많음 쉬움 어려움 CSV (.. 2023. 2. 2.
728x90
반응형