본문 바로가기

BeautifulSoup

(4)
fxcop warnings 데이터 가져오기 스크립트 C# 정적시험을 하기 위하여 fxcop을 사용하기로 하였다. 어떤 warning list를 가지고 있는지 조사하려고 웹사이트를 찾았으나 보기 좋게 excel로 전체 데이터는 제공되지 않았다. 간단히 python을 이용하여 warning 정보를 긁어오는 스크립트를 만들어 보았다. html 파싱을 위하여 BeautifulSoup4 모듈을 사용하였고, Excel로 저장하기 위하여 xlwt 모듈을 사용하였다.BeautifulSoup의 Encoding 문제가 발생하여 지체되었으나 대충 4시간 정도 걸린거 같다. BeautifulSoup의 Encoding 문제 해결은 링크를 확인한다.Cause, HowToFix 등 필드에 있는 Tag 들은.. 그냥 엑셀의 바꾸기로 바꿨다.ㅋㅋㅋ(귀찮아!) 아래의 스크립트를 수행하면..
BeautifulSoup 4 어느 순간인가 BeautifulSoup 4 가 나왔다. 다운로드 : http://www.crummy.com/software/BeautifulSoup/bs4/download/문서 : http://www.crummy.com/software/BeautifulSoup/bs4/doc/ pip을 사용하여 설치하자.pip install beautifulsoup4 설치된 버전을 확인해 보자.
python :: BeautifulSoup Encoding 에러 BeautifulSoup로 다음과 같이 읽어드리면 utf-8로 자동 인코딩이 된다. In [1]: file_name = "d:\\sdd_word\\result\\xml\\class_c_c_i_status_manager.xml" In [2]: f = open(file_name, 'r') In [3]: contents = f.read() In [4]: from BeautifulSoup import Beau BeautifulSoup BeautifulSOAP BeautifulStoneSoup In [4]: from BeautifulSoup import BeautifulSoup In [5]: soup = BeautifulSoup(contents) In [6]: soup.originalEncoding Out[6]:..
BeautifulSoup 설치 1. http://www.crummy.com/software/BeautifulSoup/ 에서 최신 BeautifulSoup.tar.gz 다운로드 받는다. 2. 압축을 해제하고 BeautifulSoup.py를 PYTHON_PATH에 잡힌 아무곳이나 복사를 한다. -_- (python이 설치된 디렉토리의 Lib\site-packages 에 복사한다.) ps) BeautifulSoup3 설치에 대한 글이다. pip로 설치하는 것을 추천한다.pip 설치 : http://ppiazi.tistory.com/entry/pip-%EC%84%A4%EC%B9%98BeautifulSoup4 설치하기 : http://ppiazi.tistory.com/entry/BeautifulSoup-4