본문 바로가기

아래아한글 자동화/python+hwp 중급182

[HDMI] 빈 문서1.hwpx를 분해해보면 안녕하세요? 일코입니다. HDMI(Hangul Document Manipulation and Information, 이름 참 잘 지었다!) 시리즈 예전에도 이와 관련한 포스팅을 한 번 올린 적은 있었습니다. 한/글 없이 hwpx 파일의 표를 pd.DataFrame으로 추출하는 방법 (tistory.com) 한/글 없이 hwpx 파일의 표를 pd.DataFrame으로 추출하는 방법 안녕하세요? 일상의 코딩, 일코입니다. hwpx 포맷이 만들어진지 벌써 10년도 훌쩍 넘었습니다. 한컴오피스에서는, 데이터 추출이 번거로운 기존의 hwp 포맷 대신 machine-readable한 hwpx 포맷을 사용해 martinii.fun 솔직히 말ㅆ므드리면 그 뒤로 틈틈이 파이썬의 xml 모듈 문서를 읽어보거나 튜토리얼을 .. 2022. 12. 7.
[hwpx 분석하기] HDMI 시리즈를 시작하며 잠시 과거회상 업무자동화 공부를 시작한지도 벌써 6년이 넘었습니다. 사실 업무 중에 가장 많은 시간을 썼던 코드는 아래아한글이 아니라 파이썬-셀레늄으로 브라우저(회사 그룹웨어) 작업을 자동화하는 거였어요. 이게 나름 해킹하는 느낌의 재미가 있어서 파고들게 되었습니다. 해킹이라는 표현은 좀 오바 같지만, 공기업의 그룹웨어가 이렇게 취약점이 많을 줄은 몰랐거든요. 재직 당시 보안팀에 제보했던 수십 개의 취약점 중에 굵직한 걸 꼽으라면 그룹웨어 로그인 비밀번호 입력 무력화, 로그인할 때 휴대폰 2차인증 패스, 다른 사우 사번으로 그룹웨어 및 메신저 로그인하기, 타 부서 기록물, 비공개문서 열람하기, 비밀번호 "1"로 바꾸기 등등 서비스 대부분이 주로 클라이언트 측에서 자바스크립트로 이뤄지는 구조라서 소스코드만.. 2022. 12. 7.
[QnA] 문단 위, 문단 아래 간격이 적용이 안되고 0이 돼요.. 혹시. 문단모양에서 문단 위 간격, 문단 아래 간격 값을 지정하는 방법을 알 수 있을까요? # 문단모양 설정 def para_style(align, LineSpace, prevSpace, nextSpace, breakline_div, min_space): # 정렬방식(왼쪽, 가운데, 오른쪽) / 줄간격 / 문단위 / 문단아래 / 줄나눔기준(어절, 글자) / 최소공백 act = hwp.CreateAction("ParagraphShape") # 액션생성 pset = act.CreateSet() # 파라미터셋 생성 act.GetDefault(pset) # 파라미터셋에 현재 상태값 넣기 pset.SetItem("AlignType", hwp.HAlign(align)) # 정렬("Justify", "Left", ".. 2022. 12. 6.
[QnA] 문서간 스타일서식 맞바꾸기 보호되어 있는 글 입니다. 2022. 12. 6.
문서 중 특정 컨트롤을 모두 삭제하는 아주 간단한 코드 문서 안에서 쪽번호 위치나 새쪽번호, 감추기 같은 조판부호들은 일일이 찾기도 쉽지 않을뿐더러 본문이 긴 경우에는 페이지 밖으로 사라져 있기도 합니다. 문서가 긴 경우에는 이런 컨트롤들을 일일이 찾아서 삭제하는 것도 정말 시간을 많이 잡아먹는 일입니다. 다행히 한/글에서는 특정 조판부호를 모두 삭제하는 기능을 제공하고 있습니다. 아래 움짤은 문서 내 모든 고정폭빈칸 컨트롤을 삭제하는 예시입니다. 다행히 이 코드는 매크로 녹화가 되어서, 파이썬 코드로도 쉽게 고칠 수 있습니다. 녹화한 스크립트매크로는 아래와 같습니다. HAction.GetDefault("DeleteCtrls", HParameterSet.HDeleteCtrls.HSet); with (HParameterSet.HDeleteCtrls) { Cre.. 2022. 12. 5.
문서 중 짝수(또는 홀수)페이지를 전부 삭제하는 파이썬코드 코드를 먼저 보여드립니다. 간단한 주석을 옆에 달아놓았습니다. 이 코드는 한/글 2014 이하 버전에서는 작동하지 않습니다. act = hwp.CreateAction("DeletePage") # DeletePage 액션 생성 pset = act.CreateSet() # 파라미터셋 생성 act.GetDefault(pset) # 파라미터셋에 현재값 대입 pset.SetItem("Range", 2) # 삭제범위 설정. {2:RangeCustom에서 지정한 페이지만 삭제, 0:현재 쪽 삭제(RangeCustom 무시), 1:선택한 모든 쪽 삭제} pset.SetItem("RangeCustom", ", ".join([str(i) for i in range(1, hwp.XHwpDocuments.Item(0).XHw.. 2022. 12. 5.
[QnA] 파이참에서 한/글 API 코드 자동완성을 하고 싶어요! 파이참이나 VSCode에서 코딩을 해보면 자동완성 기능 덕분에 메서드를 빠르게 찾는 등 코드를 쾌적하게 짤 수 있는데, win32com으로 아래아한글 자동화를 할 때에는 자동완성이나 파라미터 정보 등이 하나도 뜨지 않아서 막막합니다. 좋은 방법이 없을까요? 예. 좋은 방법이 없는 것 같습니다. 솔직히 저도 사실 왜 IDE에서 한/글 API 코드의 자동완성이나 파라미터 정보가 안 뜨는지 잘 모르겠습니다. 아래 예시화면처럼 자동완성을 잘 잡아주면 참 좋을텐데요. 한/글 자동화 코드를 짤 때는 아래처럼 장님 코끼리 만지듯 허우적허우적 코딩하는 게 참 번거롭습니다. 모두 외울 수도 없는 노릇이고 수시로 API문서를 뒤적거리면서 코딩해야 하니까요. 그래도 나름 경험적으로 알게 된 몇 가지 팁이 있는데요. 업무자동.. 2022. 12. 5.
[QnA] pythonwin.exe로 한/글의 TypeLibrary 생성하기 이번 포스팅에서는 아래아한글 자동화 작업 때 메서드 인자명을 확인할 수 있는 타입라이브러리 파일 생성방법을 알려드리겠습니다. 대략 아래와 같이 생긴 파이썬 파일입니다. # -*- coding: mbcs -*- # Created by makepy.py version 0.5.01 # By python version 3.10.1 (tags/v3.10.1:2cd268a, Dec 6 2021, 19:10:37) [MSC v.1929 64 bit (AMD64)] # From type library 'HwpObject.tlb' # On Tue Sep 20 21:31:28 2022 'HwpObject 1.0 Type Library' makepy_version = '0.5.01' python_version = 0x30a.. 2022. 12. 4.
[QnA] 스타일문서를 임의로 변경한 경우 복원하기 안녕하세요. 한글자동화를 이용해 문서의 서식을 바꾸는 코드를 만들고 싶어 문의드립니다. 회사에서 보고서 작업을 하는데 동일한 문서에서 서식을 다르게 하여 수정 후 내용을 첨가하여 제출하는 경우가 많습니다. "서식 유지한 채로 스타일을 모두 "바탕글"로 바꾸는 코딩" 에서 일부 수정하면 될 것 같은데 "스타일_조회"함수에서 "Act = hwp.CreateAction("Style")"에서 object가 추출되지 않아서 Nonetype object로 되고 그로 인해 "Set = Act.CreateSet()" 부분이 작동하지 않아 오류가 발생합니다. 그래서 "hwp" 자식 클래스를 "dir" 함수로 살펴보는데 "CreateAction"는 있으나 그 하부에는 "Style"이라는 자식 클래스가 없습니다. 설치 과정.. 2022. 12. 4.