본문 바로가기
대구MBC NEWS대구MBC NEWSDESK대구MBC NEWSDESK, TODAY 리포트 안동‧포항MBC NEWS대구MBC 생활 문화생활 문화 일반지역대구MBC 뉴스데스크 생활문화대구MBC 뉴스투데이 생활문화

"기록유산, AI와 만나다" 한자 인식 서비스 '첫선'

 ◀앵커▶
한국국학진흥원이 한문으로 쓰여져서 읽기 어려웠던 우리 기록유산을, 휴대폰으로 쉽게 번역할 수 있는 기술을 개발하고 있습니다.


이 기술이 상용화되면, 국내 국학자료의 디지털화 작업 속도를 훨씬 더 높일 수 있을 걸로 기대됩니다.

김서현 기자가 취재했습니다.

◀기자▶
1616년 음력 8월 15일. 

"가동에서 합제를 지냈는데, 영해의 외조부모도 함께 제사를 지냈다"

조선 중기 학자 김택룡의 '조성당일기', 추석 명절, 친가와 외가 구분 없이 함께 제사를 지냈던 양반의 유연한 태도를 확인할 수 있는 기록입니다.

이렇게 선조들의 옛 자취가 뚜렷한 일기와 유교책판 등 방대한 양의 국학 자료가 국내에 현존하고 있지만, 그중 이미지로 디지털화된 자료는 아직 절반이 채 안 되고, 문자로 디지털화된 건 5%에도 못 미치는 걸로 추정됩니다.

국학 자료 디지털화가 여전히 사람 손으로 복사해서 컴퓨터로 옮기는 방식으로 진행되고 있어, 막대한 예산과 인력이 들기 때문입니다.

그런데 한국국학진흥원이 인공지능 기술로 디지털화와 번역 작업 시간을 획기적으로 단축하는 프로그램을 자체 개발 중인데, 그 첫 결과물이 공개됐습니다.

'고도서 한자 인식 프로그램' 누리집 서비스로 한문으로 된 고문서 사진이나 이미지를 이 누리집에 등록하면, 자동으로 한자를 인식해 텍스트로 바꿔줍니다.

인식한 한자가 들어간 또 다른 고문서 자료도 연동해서 찾아볼 수 있습니다.

◀박나연 한국국학진흥원 전임연구원▶
"집 안에 있는 일기류라든지 편지류, 집 안에 있는 문서들도 휴대폰으로 촬영해서 손쉽게 이미지, 텍스트화된 결과를 얻을 수 있습니다."

현판과 고문서에 적힌 한문도, 휴대전화로 찍어서 프로그램에 등록할 수 있습니다.

검은 배경에 흰색으로 쓰인 해서체는 인식 정확도가 90%가 넘습니다.

"이렇게 문화재 현장에서 발견한 한문도 인식 프로그램을 통해 휴대폰으로 쉽게 검색할 수 있습니다."

한국국학진흥원은 필기체의 일종인 행서와 초서체까지 인식할 뿐만 아니라 장기적으로는 자동 한문 번역 프로그램 개발까지 추진하고 있습니다.

현재 디지털화 속도로는 국내 국학 자료를 모두 이미지 디지털화하는 데 20년, 문자는 380년 넘게 걸리는데, 이 프로그램이 상용화되면 지금보다 작업 속도를 30배는 더 앞당길 수 있을 걸로 예상됩니다.

◀배성길 한국국학진흥원 부원장▶
"한국국학진흥원이 전국에서 가장 많은 60만 점이라는 국학 자료를 갖고 있는데, 이 사업이 완성도가 더 높아지면 일반인도 (국학자료에) 쉽게 접근할 수 있어서···"

첨단기술과 만난 우리 기록유산, 기록 보전뿐만 아니라 콘텐츠 개발 등 유산의 가치를 재발견하는 계기가 될 걸로 기대를 모으고 있습니다.

MBC 뉴스 김서현입니다. (영상취재 최재훈, CG 황현지)

김서현

추천 뉴스

최신뉴스