반응형
저는 ㅇㅇㅇ이라고 합니다.
회사에서 두개의 텍스트를 검증할 일이 빈번해서 회사원님의 유튜브를 시청하고
파이썬 쥬피터를 통해서 제업무에 적용해보았습니다.
8강 소스코드에서 예제와 동일하게 코드를 테스트 하던중
IndexError Traceback (most recent call last)
<ipython-input-6-d24047290ede> in <module>
91 for copy_statement in copy_full_text:
92 coupled_dict[difflib.SequenceMatcher(None, original_statement.split(' ', 1)[1],
---> 93 copy_statement.split(' ', 1)[1]).ratio()] = copy_statement
94 max_ratio = max(k for k, v in coupled_dict.items())
95 cb.copy(coupled_dict[max_ratio].strip()) # 유사도가 제일 높은 문장을 찾아 복사하고,
IndexError: list index out of range
위와 같은 리스트 오류가 나왔습니다.
업로드 되어있던 "별헤는 밤" 파일 등을 동일하게 적용하였습니다. 한글은 2014를 사용중입니다.
혹시 어떻게 수정해야 하는지 답변을 부탁드리겠습니다.
감사합니다~
우선 아래의 파일을 다운로드해서 실행해보세요.
두 유사문서간 비교를 통해 가장 유사한 문장을 짝짓고(조작본은 순서가 뒤죽박죽)
원본과 차이가 있는 조작본 문장의 글자색을 빨갛게 바꿔주는 코드입니다.
별헤는밤_원본.hwp
0.05MB
별헤는밤_조작.hwp
0.05MB
비교표.hwp
0.01MB
문서비교.py
0.01MB
문서비교.py는 아래의 코드와 동일합니다.
설명은 주석과 영상으로 대신합니다.



2019년?에 노션블로그에 올렸던 내용인데, 메일로 질문 주신 분이 계셔서 업데이트해보았습니다.
행복한 하루 되세요!
반응형
'아래아한글 자동화 > python+hwp 중급' 카테고리의 다른 글
[QnA]각각의 페이지를 한 개의 hwp파일로 저장하고, 제목은 표 안에서 추출하는 코드를 작성/컴파일해서 실행파일 보내주세요. (3) | 2021.05.19 |
---|---|
[QnA]한/글 교정부호(메모고침표) 자동삽입으로 깔끔한 주석 추가 (1) | 2021.05.18 |
[QnA] 한/글에서 녹화해 둔 매크로를 파이썬에서 변환없이 실행하는 방법은 없을까요? (16) | 2021.04.15 |
댓글