본문 바로가기

파이썬185

[3/5, HwpEqn] 컨트롤 탐색방법(feat. 파이썬) 지난 포스팅은... [2/5, HwpEqn] HWP문서 수식을 텍스트로 추출하는 방법 (1) 안녕하세요 ~ 저는 유튜브 회사원코딩 구독자입니다. 올려주신 영상들 잘 시청하고 있습니다. 문의드릴 사항으로는 한글 파일을 이미지로 변환하여 저장하고, 한글파일내의 텍스트의 위치 www.martinii.fun 지난 포스팅에서는 수식을 선택해놓은 상태에서, 어떻게 하면 수식의 텍스트를 추출할 수 있는지를 보여주었다. 파이썬으로 해당 텍스트를 가져오기만 하면, 그 다음은 LaTeX로 변환해서 저장하든, 웹에 업로드를 하든 자유롭게 활용할 수 있을 것이기 때문이다. 그러면 이번 포스팅에서는, 추출하기 전에 수식을 차례로 선택하는 과정을 파이썬 코드로 진행해 보겠다. 지난 포스팅에서 언급한 바와 같이, GetAnchor.. 2020. 12. 18.
[2/5, HwpEqn] HWP문서 수식을 텍스트로 추출하는 방법(feat. 파이썬) (1) 안녕하세요 ~ 저는 유튜브 회사원코딩 구독자입니다. 올려주신 영상들 잘 시청하고 있습니다. 문의드릴 사항으로는 한글 파일을 이미지로 변환하여 저장하고, 한글파일내의 텍스트의 위치 정보와 텍스트값(수식 포함, latex)을 추출하고 싶은데, 이것이 win32com 파이썬 모듈로 개발 가능한것인지 궁금합니다. 만약 가능하다면 대략 어떠한 flow로 처리해야할지 궁금합니다. 항상 건승하시길 바랍니다. 감사합니다. (2) 마티니님, 알려주신 내용을 기반으로 텍스트 값 및 위치를 먼저 추출해보려고 하였으나, 수식이 포함된 텍스트를 text = hwp.GetText() 로는 추출이 안되어 진행 방향을 못잡고 있습니다 ;; (테스트해본 한글파일은 첨부파일과 같습니다.) 혹시, 어떤 API들을 써야하는지 알수 .. 2020. 12. 18.
[1/5, HwpEqn 서론] LaTeX 수식을 한/글 수식편집기에 넣을 수 있다? 아래아한글의 장점 중 하나는 깔끔한 수식. Visual String 을 이용한 간편한 수식삽입도 가능하며, LaTeX나 MathML과는 다소 상이한, 이를테면 이런 식이다. 위 식의 한컴수식 문자열은 아래와 같다. a ^{m} ÷a ^{n} = {cases{a ^{m-n} ~~&(m>n)#1&(m=n)#{1} over {a ^{n-m}}&(m 2020. 12. 16.
[4/4] 파이썬으로 정관.HWP 서식잡기 종합 지난 포스팅은... [3/4] 정관문서 서식잡기(장이름 중앙정렬, 위아래 빈라인 삽입) 3번 질문============== 정관 제 1 장 총칙 제 1조 제 2조.. 제 3조... 제 2 장 주식과 주권 제 4조.... 제 5조.. 제 3 장 임원 제 6조 등과 같을 때. 장의 위치를 페이지 가운데로 위치하고 싶고, 또한 각 장 www.martinii.fun 중앙정렬과 각 조항 위아래 빈 줄을 추가하는 것을 끝으로 정관이나 법령 서식 교정하기 콘텐츠는 마무리를 지으려 한다. 이번 포스팅에서는 추가 정보를 제공하는 것보다는, 1. 입맛대로 개별의 코드를 하나의 파일로 모아서, 한 번에 실행할 수 있다는 걸 보여주고 싶고, 2. 아래에서 보여줄 예제처럼, 모든 함수를 한 파일에 우겨넣으면 파일이 굉장히 비대.. 2020. 12. 16.
[한/글자동화 예제] 글자크기를 임의로 바꾸는 간단한 방법 앞 포스팅에서는 글자 속성을 적용하는 여러가지 방법에 대해 알아보았다. 2020/12/14 - [파이썬-아래아한글 자동화 기초] - [한/글자동화 예제]현재 선택영역에 글자속성 적용하기 [한/글자동화 예제]현재 선택영역에 글자속성 적용하기 반말체를 쓰니까, 포스팅 작성속도가 월등히 올라가길래 그렇게 할 예정. 우선, 특정 영역에 찾아가거나 선택하는 방법은 다양하다. "찾기Ctrl-F"를 사용하거나, "탐색GetText" 메서드를 사용하거나, www.martinii.fun 재미있는 것은, 글자 크기도 속성이므로, 동일한 방법으로 현재 글자크기 정보를 얻거나, 크기를 조정할 수도 있다. 가장 아날로그한 방법부터 알아보자. 1. Shift-Alt-E를 사용하는 방법 hwp.Run("CharShapeHeight.. 2020. 12. 15.
[한/글자동화 예제]현재 선택영역에 글자속성 적용하기 반말체를 쓰니까, 포스팅 작성속도가 월등히 올라가길래 그렇게 할 예정. 우선, 특정 영역에 찾아가거나 선택하는 방법은 다양하다. "찾기Ctrl-F"를 사용하거나, "탐색GetText" 메서드를 사용하거나, 아날로그하게 캐럿위치를 "아래로 몇줄 우측으로 세 번째 단어" 식으로 옮길 수도 있으며, 특정 좌표를 찍고 바로 캐럿을 옮길 수도 있다. 필자가 애용하는 방법은 "찾기"와 "GetText"이며, 특정 상황에는 미리 만들어놓은 누름틀(Field)을 사용하는 게 캐럿이동이나 블록선택에 가장 효율적일 수 있다. 하여튼 [특정영역 선택]은 다른 포스팅에서 자세히 다루기로 하고, 특정영역을 선택했다고 치자. 이 영역에 특정 글자속성(이 예제에서는 "이탤릭")을 적용하고 싶다면? 1. 한/글API 중에 이런 명령.. 2020. 12. 14.
자동화를 활용했으면 하는 세대는 20대 초중반인데.. 회사원을 대상으로 자동화 튜토리얼을 진행하고 있다. 재미있는 점은, 업무자동화, 보고서 자동화 같은 매크로 활용 작업을 배웠으면 하는 (혹은 필요할 거라고 생각되는) 세대는.. 지극히 개인적으로는 20대 중반 젊은세대, 혹은 막 신입사원 티를 벗은 주임이나, 대리급 직원 혹은 업무지원직, 서무경리, 회계지원 이런 분들인데.. 내 유튜브 채널 통계는 의외의 숫자를 보여준다. 물론 구독자가 소수라서 편향이 있겠지만 부족한 대로 두 가지 정도가 눈에 띈다. 1. 남성100% !? 2. 시청자 평균 40대!? 둘 다 항상 의외라고 생각했는데 가끔은 썸네일이나 타이틀을 젊은이 타겟으로 바꿔봐야 하나 싶다가도... 이런 통계를 어떻게 활용할 수 있나 하는 생각도 든다. 예를 들면 40대 회사원(대부분은 아빠)을 대.. 2020. 12. 13.
대부분의 업무자동화는 코드가 너무 복잡하던데(?) 대충 5년 가량 파이썬과 VBA로 엑셀 자동화, 아래아한글 자동화를 종종 다뤄본 입장에서 깨달았던, 가장 공유하고 싶은 인사이트는 바로... 업무자동화가 코딩 입문이나 기초과정보다는 훨씬 어렵다는 것이다. (물론 엄청나게 간단하면서 효율적인 스크립트도 참 많기는 하다.) 혼자 몇 년 찬천히 삽질할 때는 잘 못 느꼈는데, 몇 번 다른 사람에게 가르쳐주려다 보니까 새삼 깨닫는다. 오랜 삽질도 자산이었다. 순식간에 지나가는 쌔한 느낌을 간과하면 항상 버그가 나타났다. 결국 잠깐 업무자동화 코드 짜려고 파이참 켰다가 한 시간 있다 보면 디버깅과 테스트, 온갖 익셉션을 다루고 있다. 오죽하면 요즘은 (말도 안 된다고 생각했던) TDD라는 개념도 배워보고 있다. 혹시 도움이 될까봐서.. 결국 하다 보면 어느 지점에.. 2020. 12. 12.
[3/4] 정관문서 서식잡기(장이름 중앙정렬, 위아래 빈라인 삽입) 지난 포스팅은... [2/4] 정관문서 서식잡기(장이름, 조제목만 굵게) 부탁 드렸던 방법은 제가 회사의 정관을 많이 손 보아야 하는 직업이라. 수년전 한글내에서 매크로로 겨우 조항 제목 문자 굵게 만들고, 2번 질문====================== 제 1조(상호) 제 2조(목적)을 다 www.martinii.fun 3번 질문============== 정관 제 1 장 총칙 제 1조 제 2조.. 제 3조... 제 2 장 주식과 주권 제 4조.... 제 5조.. 제 3 장 임원 제 6조 등과 같을 때. 장의 위치를 페이지 가운데로 위치하고 싶고, 또한 각 장 줄의 위와 아래에 빈 줄을 삽입해 넣고 싶습니다. 즉, 빈줄 정관 빈줄 제 1 장 총칙 빈줄 제 1조 제 2조.. 제 3조... 빈줄 제 2 장.. 2020. 12. 12.