본문 바로가기
728x90
반응형

Python/Python DataAnalysis14

[Python Data Analysis] 2. Python 정규표현식(REGEX) 지난 포스팅에서 문서 내 특정 문자 또는 패턴이 들어간 내용만 별도로 추출할 수 있도록 도와주는 Python의 re 모듈에 대해 알아보았다. re 모듈을 조금이나마 테스트 해 보신 분들이라면 알겠지만, 이 모듈의 능숙한 사용을 위해서 정규표현식 문법에 어느정도 익숙해 질 필요가 있다. 따라서 이번 포스팅에서는 문서 내 추출하고 싶은 문자열의 패턴을 정규표현식으로 작성하는, 정규표현식 문법에 대해 알아보려 한다. 정규표현식에서 패턴 검색에 사용하는 문자열은 대부분 특수문자 또는 이스케이프 문자를 많이 사용한다. 이들 문자를 사용하면 숫자/숫자가 아닌 문자, 공백/공백이 아닌 문자 등등을 연속적으로 배치하여 찾고자 하는 내용만 매우 쉽게 뽑아낼 수 있다. 이번 포스팅에서는 가장 기본적으로 사용되나, 익히면 .. 2021. 9. 12.
[Python Data Analysis] 1. Python의 re 모듈 Python은 다양한 분야에서 활용될 수 있는 프로그래밍 언어이다. 기존에 많이 사용하던 Java나 C와는 달리 문법 자체가 워낙 익히기 쉬운 구조라, 일반적인 프로그램 코딩은 물론이거나와, RasberryPi 코딩, 머신 러닝 등 폭 넓게 이용되는 언어다. 특히 기존의 프로그래밍언어로는 작업이 어려웠던 자료의 수집과 수집된 자료의 분석, 분석 결과의 저장 작업, 즉 통계를 위한 수집과 분석 작업에도 사용 빈도가 높아짐에 따라, 국내 기사 자격증 중 하나인 빅데이터 분석기사의 실기에서도 R과 함께 주요 프로그래밍 언어로 지정되어 있다. 필자 역시, 빅데이터 분석기사 취득을 위한 실기 시험 준비 뿐만 아니라 최근에 회사 업무에서 대용량의 데이터를 처리할 일이 많아지는 바람에 Python을 이용한 데이터 분.. 2021. 8. 3.
728x90
반응형