본문 바로가기
  • Hello_
728x90
반응형

전체 글98

[Python] re를 활용하여 문자열을 리스트로 변환하기 본 포스팅에서는 리스트 구성의 문자열을 리스트 형태로 변환하는 법에 얘기하고자 합니다. re 모듈 만약 아래와 같이 유관으로는 리스트지만 형식은 문자열일 때, 이 문자열 내부의 요소들을 그대로 가져와 리스트로 구성해보고자 합니다. '(-73.53,210.48,-94.70)' # type -> str '[92.41,20.49,12.45]' # type -> str '[-92.41,-20.49,-12.45]' # type -> str 이때 유용하게 사용할 수 있는 모듈이 바로 're'입니다. Python에서 "re" 라이브러리는 "regex" (정규 표현식) 라이브러리입니다. 문자열에서 패턴을 검색하고 그 패턴에 따라 문자열에 대한 연산을 수행할 수 있게 해 줍니다.. 정규 표현식은 텍스트 처리에 대한 강력.. 2023. 2. 12.
[Python] 리스트 (List) vs 넘파이 (Numpy) 어레이 차이 본 포스팅에서는 리스트와 넘파이 어레이의 차이점에 대해 얘기하고자 합니다. 선언 우선 list_ex와 numpy_ex로 리스트와 넘파이 어레이의 예시를 구성해 봅시다. 넘파이 어레이 선언은 리스트를 np.array()로 감싸주면 쉽게 선언이 가능합니다. import numpy as np list_ex = [[0,1],[2,3],[4,5]] numpy_ex = np.array([[0,1],[2,3],[4,5]]) print(list_ex, type(list_ex)) # [[0, 1], [2, 3], [4, 5]] print(numpy_ex, type(numpy_ex)) # [[0, 1], [2, 3], [4, 5]] 출력해 보면 형태는 동일하지만 배열의 형태는 다릅니다. 여기서 한 가지 짚고 넘어가야 할 .. 2023. 2. 12.
[Python] sys.modules, __getattr__, __setattr__ 활용하기 본 포스팅에서는 sys.modules, __getattr__, __setattr__을 활용하여 모듈의 속성을 다뤄보고자 한다. sys.modules[__name__] 우선 현재 사용하고 있는 모듈을 객체(object)로 가져와보자. import sys now_module = sys.modules[__name__] print(now_module) # __name__은 파이썬에서 현재 모듈의 이름을 문자열로 반환하는 내장 변수이며, sys.modules[__name__]은 파이썬에서 현재 모듈에 대한 참조이다. sys.modules dict에 __name__ 값으로 접근하면 현재 모듈의 모듈 객체에 대한 참조를 얻을 수 있다. 이는 모듈의 속성을 추가하거나 수정하거나 모듈 내에서 다른 모듈을 가져오는 등의 .. 2023. 2. 11.
[Python] Pandas를 활용하여 xls 파일 읽기 본 포스팅에서는 pandas를 활용하여 xls 파일을 읽는 법에 대해 얘기하고자 한다. pd.read_excel(xls) 오류 아래 그림에서 발생한 오류는 'xls' 엑셀 파일을 pd.read_excel로 읽으려고 할때 발생한 오류이다. 'xls'는 'xlsx' 확장자의 옛 버전으로 xlsx 파일을 읽고 쓰기 위해서는 openpyxl 라이브러리가 필요하지만 xls 파일을 열기위해서는 xlrd가 환경에 설치되어 있어야한다. 따라서 pandas로 xls 및 xlsx 파일 모두 자유롭게 읽고 쓰고 싶다면 openpyxl과 xlrd를 모두 설치하면 된다. xlrd 설치 xlrd는 아래와 같은 명령어를 통해 설치가 가능하다. # pip pip install xlrd # conda conda install -c a.. 2023. 2. 9.
[Python] Pandas로 암호화된 엑셀 파일 읽기 본 포스팅에서는 암호화된 엑셀 파일을 읽기 위해 전처리를 진행하고 pandas를 활용하여 읽어보고자 한다. 암호화된 엑셀파일 간혹 엑셀파일을 접하다 보면 암호화되어 밑에 그림과 같이 암호를 입력해야 열리는 파일들이 있다. 이 파일들은 pandas로 바로 읽으려고 하면 "XLRDError: Can't find workbook in OLE2 compound document"와 같은 오류가 발생하여 데이터를 로드하지 못한다. 이를 위해 새로운 라이브러리를 설치하여 암호화된 파일을 읽어보자. msoffcrypto-tool "msoffcrypto-tool"을 설치하여 암호화된 워드 파일 혹은 엑셀 파일을 읽을 수 있는 형태로 변환시켜 준다. 아래 링크는 msoffcrypto-tool 라이브러리의 github이다... 2023. 2. 9.
[Python] try except 활용하여 오류 모아보기 본 포스팅에서는 for 문과 try except를 사용해서 예외 처리를 함과 동시에 발생한 오류를 모아서 출력하는 알고리즘을 구성하고자 한다. try except 구문 try except 구문은 예외처리를 할 때 사용되며 try문 안에 실행하고자 하는 내용을 포함시키고 만일 try문에서 오류가 발생하면 except문으로 넘어간다. 즉 예외로 처리할 내용을 except문 안에 기입하면 된다. 간혹 대용량 데이터 처리를 하는 중 중간에 오류가 발생하여 실행되던 코드가 중단되는 경험은 한두 번씩 있을 것이다. 이럴 때 유용한 구문이 try except 구문으로 오류가 발생하더라도 우선은 모든 데이터를 처리한 뒤에 예외 데이터를 처리할 수 있도록 해준다. 다만 어떤 데이터가 예외 데이터이며 어떠한 오류로 인해 .. 2023. 2. 8.
728x90
반응형