본문 바로가기

to_excel2

[HDMI] 진짜 본격적으로 header.xml 파헤쳐보기 자, 이제 모든 준비가 끝났...다고는 말할 수 없지만 본격적으로 header.xml을 분석해보겠습니다. 왜 아직 모든 준비가 끝나지 않았냐면, 한/글의 xml 파일들은 "네임스페이스"라는 일종의 축약어를 사용하는데, 예를 들면, header.xml의 시작부분은 아래와 같습니다. 뾰족괄호와 콜론(:) 사이의 "hh"가 네임스페이스인데요. head 태그 안에 보면 xmlns:hh="http://www.hancom.co.kr/hwpml/2011/head" 라는 문구가 있습니다. xmlns 는 xmlNameSpace의 약자로, 이 문서 내 는 모두 실제 태그이름이 로 치환됩니다. iter() 메서드나 findall() 메서드 이용시 "hh:태그"로는 탐색이 되지 않기 때문에 1. 직접 저렇게 길게 입력하거나 .. 2022. 12. 7.
[QnA] 교정부호 시작/끝 위치를 파악해서 엑셀로 저장하는 프로그램 안녕하세요. 저는 한글 문서 분석을 공부하고 있는데 다음과 같은 기능이 필요합니다. * 설정 영역의 시작과 끝의 위치 정보(교정 부호나 메모 등) 예를 들어 교정 부호 사용시 시작 부분은 찾을 수 있으나 끝 부분은 찾을 수가 없네요. 확인 부탁합니다. 이상입니다. 질문 주신 분이 이런 기능을 어떻게 활용하실지는 잘 모르겠습니다. 그래도, 어떤 문제를 겪고 계신지는 공감이 됩니다. 왜냐면 한/글 문서 내에서 교정부호를 비롯한 다수의 컨트롤이 시작위치는 ctrl.GetAnchorPos(1)로 파악이 가능한 반면 끝위치는 도무지 찾을 방법이 없기 때문입니다. 하지만, (다소 조잡하긴 하지만) 몇 가지 메서드를 조합하면 이런 기능도 직접 구현이 가능한데요. 아래 문서를 예제로 사용하겠습니다. 튜토리얼을 따라해 .. 2022. 11. 8.