본문 바로가기

아래아한글 자동화/python+hwp 중급182

hwp의 API는 왜 이렇게 복잡할까? 오늘 어떤 구독자 분의 질문메일에 "한/글 문서를 PNG포맷으로 저장할 수 있나요?"라는 질문이 있었다. 이건 사실 간단한 질문인데, hwp에서 제공하는 API 중에 이미지로 저장하는 CreatePageImage라는 메서드가 있기 때문이다. 물론 사용법도 간단하다. 근데 조금만 살펴보면 문제가 있다. 우선, 위의 메서드는 GIF와 BMP포맷만을 제공한다. PNG포맷으로 출력하려면 PrintToImage라는 메서드를 사용해야 하는데 이런 종류의 메서드는 파라미터를 파이썬문법처럼 괄호 안에 넣는 게 아니라 GetDefault로 메서드를 초기화(?)하고 모든 파라미터를 HParameterSet을 통해 별도 입력 후 Execute 메서드로 실행해야 한다. (사실 모든 메서드는 이런 구조다. 단축키 개념의 간편한.. 2020. 4. 1.
selenium으로 크롤링할 때 frame과 object 태그 차이 html 안에 html을 삽입해놓은 웹사이트가 많이 있다. 한 개의 html 안에 수천 수만줄의 태그와 js를 유지관리하기도 힘드니, 어찌 보면 개발자 입장에서 당연할 수 있다. 이 때 삽입하는 방법은 주로 iframe태그를 넣거나, object 태그를 넣는 방법 중 하나로 하는데 각각을 크롤링하는 방법에 작은 차이가 있다. 우선 iframe이 삽입되어 있는 경우는(주로 동영상 플레이어나, 메뉴바, 사이드바와 본문내용이 구분되는 경우에 사용) driver.find_element_~가 아니라 driver.switch_to.frame(프레임name이나 id)로 접근하고, 상위프레임으로 이동해야 할 때 다시 driver.switch_to.parent_frame 이나 driver.switch_to.default.. 2020. 3. 31.