본문 바로가기

필드7

[pyhwpx] 삽입할 필드가 너무 많을 때 : hwp.set_field_by_bracket() 아래아한글 문서를 자동화할 때 가장 많이 사용하는 기법은 역시 "필드삽입"이다. 누름틀이나 셀필드를 미리 삽입해 두고 엑셀문서나 데이터프레임에서 필드를 일괄삽입하는 방식으로 hwp 문서를 자동화할 수 있는데, 문제는 필드가 너무 많을 때에는 필드 삽입작업도 너무 귀찮다는 것. 예를 들어 아래의 문서를 자동화하려면 저 빈 칸에 전부 필드를 삽입해야 한다고 생각하면 자동화를 위한 준비작업조차 빡센 상황이 된다... 실제로는 이런 경우에는 필드삽입보다 한 행만 남겨놓고, 나머지 행을 삭제한 후 소스(엑셀파일)에 맞춰 동적으로 행을 추가해 가는 방식이 더 적절할 것 같기는 하다. 나중에 다뤄볼 것. 이런 경우에는 set_field_by_bracket을 사용해보자. 필드가 매겨질 곳에 대괄호 두겹으로 필드명을 써.. 2024. 2. 10.
2-2. 필드 생성하기 보호되어 있는 글 입니다. 2022. 10. 31.
2-1. 누름틀 생성하기 보호되어 있는 글 입니다. 2022. 10. 31.
정부부처 보도자료에 필드가 적용되어 요약 언어모델 데이터셋 만들기 쉬워졌다 과기정통부와 행안부 보도자료를 살펴보다가 재미있는 점을 두 가지 발견했습니다. 하나는, 보도자료에 machine-readable한 hwpx 포맷으로 바뀌어가고 있다는 점이며 다른 하나는 올해 초, 1월 말 경부터 한/글 문서에 필드와 누름틀이 매겨지고 있다는 점입니다. 이 두 가지는 항상 양질의 데이터에 배고픈 요즘 시대에 아주 큰 강점이 됩니다. 예를 들어보겠습니다. 1. 뉴스기사 크롤링할 때 얼마 전부터 KoGPT나 KoBART 등 한국어 대규모 언어모델이 개발되고 있는데, 학습데이터셋 대부분은 웹에 공개된 언론 뉴스기사나 위키자료 등이죠. 크롤링으로 대규모의 자료를 스크랩해오더라도 데이터셋의 전/후처리가 쉽지 않은데, 그 이유는 언론사마다 제각각인 시맨틱 태그, 맥락없이 중간중간 삽입된 사진설명, .. 2022. 9. 22.
[QnA] 문서 내의 특정 그림을 삭제하는 방법(누름틀) 안녕하세요 화사원코딩님..! 파이썬 한/글에 대해서는 거의 국내.. 유일하신 듯 합니다. 덕분에 많이 공부하고 있습니다. 감사합니다. 오늘 방명록 남긴건 다름이 아니라 한/글 파일 중에서도 그림을 특정해서 지우고 싶은데 그 방법을 모르겠어서 입니다. ㅠ HeadCtrl 사용해서 while문 돌려서 순차적으로 찾는 건 되는데, 파일이 300페이지 이상에, 그림도 너무 많아서 while문 사용해서 특정하는 건 너무 비효율 + 어려울 것 같구, 저는 그림을 "특정"하고 싶거든요..? 누름틀을 사용해서 누름틀 아이디를 먼저 부여한 다음에 거기다가 그림을 얹어놓고 그 부분에 있는 그림만 삭제하고 새로운 그림을 넣고 싶습니다. 그래서 MoveToFiled하고 FindCtrl하고 DeleteCtrl(Delete도 해.. 2022. 8. 31.
파이썬으로 한/글 파일에 텍스트를 입력하는 방법 파이썬으로 한/글을 실행하는 방법을 모른다면? 파이썬으로 아래아한글 실행하는 방법 1. python.org에서 파이썬을 다운받아 설치한다. 2. 커맨드프롬프트에서 "pip install pywin32"를 실행해서 win32com 모듈을 설치한다. 3. 파이썬을 실행하고 아래 코드를 실행한다. import win32com.client as.. martinii.fun 1. InsertText 액션을 이용하여 텍스트 입력 파이썬으로 한/글을 열었을 때 텍스트를 입력하는 가장 기본적인 방법은 아래와 같이 InsertText 액션을 정의하고 실행하는 것입니다. hwp.HAction.GetDefault("InsertText", hwp.HParameterSet.HInsertText.HSet) hwp.HParamete.. 2022. 5. 9.
한/글에 누름틀이 있다면 엑셀에는 이것이 있다!? 안녕하세요? 이번 포스팅은 엑셀의 "이름지정"에 대해 알려드리려고 합니다. 제 유튜브채널이나 블로그에 문의 주시는 다양한 댓글 중 가장 빈번한 테마는 역시 "엑셀에서 한/글로 데이터 이동"입니다. 혹은 "엑셀에서 데이터 추출 후 파이썬에서 가공하고 한/글 보고서에 삽입하여 완성" 입니다. 재미있는 점은, 댓글 주신 분들 대부분이 데이터를 잘 다루시고, 구조화에 익숙하셔서 그런지 엑셀 소스파일을 굉장히 깔끔하게 정리해 두십니다. 예를 들면, 이런 서식이라든지, 이같은 서식이라든지, 이를테면 엑셀파일을 일종의 DB처럼 활용하고 있는 상태죠. 그런데 항상 위와 같은 케이스는 아니고요, 어떤 분은 데이터를 이런 식으로도 활용하고 계십니다. 데이터 특성에 따른 차이일 수 있지만, 이런 데이터를 구조화해서 한/글 .. 2021. 6. 6.