본문 바로가기

개요3

[HDMI] 비슷한 문자열 매치 (by difflib.SequenceMatcher) 지난 포스팅까지, 스타일 이름을 가져오는 과정을 마쳤습니다. 이번에는 유사하지만 미묘하게 다른 단어들끼리 매칭할 때 많이 사용되는 파이썬 내장모듈인 difflib의 SequenceMatcher를 활용하는 방법을 알려드리겠습니다. 지금까지 이 고생을 해서 스타일 이름을 가져온 이유를 다시 상기해보면, 취합문서의 스타일 이름이 템플릿문서 대비 전부 미묘하게 바뀌어 있고 특히 템플릿의 스타일과 취합문서의 스타일 순서가 뒤죽박죽이 되어버렸기 때문입니다. (극단적인 예를 들었습니다.) 위 엑셀파일에는 취합문서 스타일의 이름이 템플릿 문서의 스타일과 전부 다릅니다. 여기 SequenceMatcher를 도입하면 어떨까? 그럼 SequenceMatcher의 사용법에 대해 간략히 보여드리겠습니다. 사실 SequenceM.. 2022. 12. 7.
[QnA] 스타일문서를 임의로 변경한 경우 복원하기 안녕하세요. 한글자동화를 이용해 문서의 서식을 바꾸는 코드를 만들고 싶어 문의드립니다. 회사에서 보고서 작업을 하는데 동일한 문서에서 서식을 다르게 하여 수정 후 내용을 첨가하여 제출하는 경우가 많습니다. "서식 유지한 채로 스타일을 모두 "바탕글"로 바꾸는 코딩" 에서 일부 수정하면 될 것 같은데 "스타일_조회"함수에서 "Act = hwp.CreateAction("Style")"에서 object가 추출되지 않아서 Nonetype object로 되고 그로 인해 "Set = Act.CreateSet()" 부분이 작동하지 않아 오류가 발생합니다. 그래서 "hwp" 자식 클래스를 "dir" 함수로 살펴보는데 "CreateAction"는 있으나 그 하부에는 "Style"이라는 자식 클래스가 없습니다. 설치 과정.. 2022. 12. 4.
[0/8] 문서 이미지 일괄저장시 파일명에 제목 넣기(인트로) 개요 대체로 주무부서에서는 소속팀이나 기관에 뿌렸던 문서를 취합 후 가공, 병합하여 보고서로 만드는 일이 많습니다. 이번 튜토리얼에서는 취합한 hwp 문서들의 이미지를 일괄로 추출하여 저장하되 이미지명에 해당 문단의 제목(예: "□ 제목"), 파일명(예: 부서이름), 페이지를 넣고, 제목 이름의 폴더들을 생성하여 그 안에 이미지를 저장하는 일련의 과정을 진행해보겠습니다. 예를 들자면 이런 식입니다. 아래와 같은 문서서식이 있습니다. 세 개의 팀(알파, 베타, 감마)으로부터 아래와 같은 문서를 취합하였습니다. 문서에는 각각 "나무사진", "꽃사진", "풀사진" 이라는 제목 아래에 1x2 크기의 표에 이미지가 각각 두 장씩 들어 있습니다. 위와 같은 문서에 삽입된 이미지를 아래와 같이 저장하고자 합니다. 우.. 2022. 10. 24.