본문 바로가기

누름틀6

2-1. 누름틀 생성하기 보호되어 있는 글 입니다. 2022. 10. 31.
정부부처 보도자료에 필드가 적용되어 요약 언어모델 데이터셋 만들기 쉬워졌다 과기정통부와 행안부 보도자료를 살펴보다가 재미있는 점을 두 가지 발견했습니다. 하나는, 보도자료에 machine-readable한 hwpx 포맷으로 바뀌어가고 있다는 점이며 다른 하나는 올해 초, 1월 말 경부터 한/글 문서에 필드와 누름틀이 매겨지고 있다는 점입니다. 이 두 가지는 항상 양질의 데이터에 배고픈 요즘 시대에 아주 큰 강점이 됩니다. 예를 들어보겠습니다. 1. 뉴스기사 크롤링할 때 얼마 전부터 KoGPT나 KoBART 등 한국어 대규모 언어모델이 개발되고 있는데, 학습데이터셋 대부분은 웹에 공개된 언론 뉴스기사나 위키자료 등이죠. 크롤링으로 대규모의 자료를 스크랩해오더라도 데이터셋의 전/후처리가 쉽지 않은데, 그 이유는 언론사마다 제각각인 시맨틱 태그, 맥락없이 중간중간 삽입된 사진설명, .. 2022. 9. 22.
그간 잘못된 정보를 알려드려 죄송합니다. 몇 가지 오류 정정 안녕하세요? 길다면 긴 기간 동안 아래아한글 자동화를 공부하면서 유튜브 영상으로, 블로그 포스팅으로 이것저것 남겨 왔는데, 현 시점에서 수정하고 싶은 부분이 몇 개 있습니다. (일종의 포스팅 정오표 같은 것...) 읽으셔도 크게 도움 되지 않겠지만, 한 번은 정리해야겠다 싶었는데 오늘에야 포스팅으로 남깁니다. 1. "누름틀에 예약어가 있다?" - 누름틀에는 예약어가 없다. 제 첫 유튜브 영상의 오류입니다. https://youtu.be/1pC_UXhiJH8 해당 영상에 고정댓글로 달아놓기는 했는데, 누름틀에는 예약어가 없습니다. 다만, 동일한 누름틀이 문서에서 여러 개 존재하는 경우, 의도한 대로 입력되지 않을 수 있습니다. (물론 한/글 API에는 동일명의 누름틀 중 몇 번째 누름틀에 텍스트를 채울지 .. 2022. 8. 31.
[QnA] 문서 내의 특정 그림을 삭제하는 방법(누름틀) 안녕하세요 화사원코딩님..! 파이썬 한/글에 대해서는 거의 국내.. 유일하신 듯 합니다. 덕분에 많이 공부하고 있습니다. 감사합니다. 오늘 방명록 남긴건 다름이 아니라 한/글 파일 중에서도 그림을 특정해서 지우고 싶은데 그 방법을 모르겠어서 입니다. ㅠ HeadCtrl 사용해서 while문 돌려서 순차적으로 찾는 건 되는데, 파일이 300페이지 이상에, 그림도 너무 많아서 while문 사용해서 특정하는 건 너무 비효율 + 어려울 것 같구, 저는 그림을 "특정"하고 싶거든요..? 누름틀을 사용해서 누름틀 아이디를 먼저 부여한 다음에 거기다가 그림을 얹어놓고 그 부분에 있는 그림만 삭제하고 새로운 그림을 넣고 싶습니다. 그래서 MoveToFiled하고 FindCtrl하고 DeleteCtrl(Delete도 해.. 2022. 8. 31.
파이썬으로 한/글 파일에 텍스트를 입력하는 방법 파이썬으로 한/글을 실행하는 방법을 모른다면? 파이썬으로 아래아한글 실행하는 방법 1. python.org에서 파이썬을 다운받아 설치한다. 2. 커맨드프롬프트에서 "pip install pywin32"를 실행해서 win32com 모듈을 설치한다. 3. 파이썬을 실행하고 아래 코드를 실행한다. import win32com.client as.. martinii.fun 1. InsertText 액션을 이용하여 텍스트 입력 파이썬으로 한/글을 열었을 때 텍스트를 입력하는 가장 기본적인 방법은 아래와 같이 InsertText 액션을 정의하고 실행하는 것입니다. hwp.HAction.GetDefault("InsertText", hwp.HParameterSet.HInsertText.HSet) hwp.HParamete.. 2022. 5. 9.
한/글에 누름틀이 있다면 엑셀에는 이것이 있다!? 안녕하세요? 이번 포스팅은 엑셀의 "이름지정"에 대해 알려드리려고 합니다. 제 유튜브채널이나 블로그에 문의 주시는 다양한 댓글 중 가장 빈번한 테마는 역시 "엑셀에서 한/글로 데이터 이동"입니다. 혹은 "엑셀에서 데이터 추출 후 파이썬에서 가공하고 한/글 보고서에 삽입하여 완성" 입니다. 재미있는 점은, 댓글 주신 분들 대부분이 데이터를 잘 다루시고, 구조화에 익숙하셔서 그런지 엑셀 소스파일을 굉장히 깔끔하게 정리해 두십니다. 예를 들면, 이런 서식이라든지, 이같은 서식이라든지, 이를테면 엑셀파일을 일종의 DB처럼 활용하고 있는 상태죠. 그런데 항상 위와 같은 케이스는 아니고요, 어떤 분은 데이터를 이런 식으로도 활용하고 계십니다. 데이터 특성에 따른 차이일 수 있지만, 이런 데이터를 구조화해서 한/글 .. 2021. 6. 6.