현재 클라우드 캣툴의 결정적인 폐혜
클라우드 캣툴이 번역회사 측에는 매우 유용하지만, 번역가들에게는 결정적으로 불리한 이유를 뒤늦게 깨달았다.
초기에는 클라우드 캣툴의 기능이 지나치게 제한적이어서 일이 많을 때는 아예 거절하기도 하였으나 세월이 흐르면서 무게 중심이 오프라인에서 온라인으로 이동함에 따라 크라우드 캣툴의 사용을 거부할 수 없는 상태가 되었다. 대략 3, 4년 전부터 출몰하기 시작한 클라우드 캣툴을 이제 대세로 자리잡았다. 물론 비싼 캣툴을 구매해야 하는 부담을 덜어준 것은 사실이나, 작업 속도 면에서는 흠... 모르겠다. 경우에 따라서는 30% 이상 시간이 더 소요되는 것 같다.
아무튼... 시장의 흐름에 따라 클라우드 캣툴에서의 작업량이 대세가 되었고(현재는 거의 90%에 이르는 것 같다) 이들의 기능 또한 전통적인 캣툴의 수준에 근접하기도 하였거니와 손에 익기도 하여 그냥 쓰고 있는 터...
그간은 기능 향상으로 일종의 착시 현상이 있었다는 걸 오늘 깨달았다.
지난 주에도 작업하였던 IT 기업의 웹사이트 번역 건을 하면서 깨닫게 된 중요한 사실이라 할 수 있겠다.
지금도 지긋지긋해서 이렇게 비교해보자. 나이를 상당히 먹은 바, 커피숍이나 이런 곳에서 초기 데이트하는 젊은 남녀들을 보면 저 커플이 제대로 될 건지 안 될 건지 바로 알 수 있다. 여자의 표정을 보면 단박에 알 수 있다. 어떻게 설명할까는 모르겠으나 영어 표현을 빌자면 여자의 ENGAGEMENT, 몰입도가 맞을까, 아무튼 그걸 보면 저 커플의 발전 가능성이 한눈에 들어온다. 뒤로 처져있다거나, 아무튼 갑갑해 하는 표정 말이다.
이놈의 IT 번역, 사실 이미 오픈된 문건인데다가 기계번역이 내가 하는 것보다 못할 것이 전혀 없어서 그리 어렵지도 않다. 그런데 시간이 데따 걸린다. 계속 주제의 문제라고 생각하던 터...
그런데 하도 오래 갑갑해 하다 보니 단지 그게 아니다.
이놈의 클라우드 캣툴 때문이다.
자세히 설명해보자.
과거 트라도스나 전통적인 다른 도구를 사용하면 마침표 끝나는 데서 세그먼테이션을 하기 때문에 한 문장씩 볼 수 있는데...
이 망할 클라우드들은 몇 문장씩 한 세그먼트로 잡는다. ㅅㅂ 여지껏 몰랐던 게 욕 나온다. 스마트링의 문제라고 생각했는데, 지금 작업하는 툴도 마찬가지다. 그리고 스마트캣도 그렇다.
자, 한 세그먼트에 여러 문장이 들어감으로써 생기는 문제다.
1. UI가 보통 후져서 문장이 많으니 젠장 안 보일 정도로 폰트 안 줄이면 여러 문장 전체를 표시하지 못하며 그 세그먼트에서 위, 아래 이동하는 거 정말 짜증난다. 오래 하면 컴 집어 던져버리고 싶다.
2. 더 큰 문제는 위 아래로 오르내릴 일이 엄청 많다는 것이다.
문장이 여러 개이고 특히 긴 문장이 서넛 있으면 돌아버린다. 일정 부분 번역하고 원문으로 돌아가서 다음 자리 찾는 것조차 어려워지니 실제로 골치가 아파진다. 이 자리 찾기가 얼마나 어려운지는 꼭 내 나이 탓만은 아니다.
이러니, 이런 문장이 지속되다 보면 한 시간쯤 하면 부아가 끌어오르고 녹초가 된다.
그러고 보니 스마트캣도 여러 문장을 한 세그먼트에 잡는다. 이것의 문제점은 TM 매치로도 연결된다. 과거 TM이 한 문장씩으로 구성됐을 경우, 100% 매치 잡을 때도 70%만 나온다. 그리고 새로 여러 문장을 한 세그먼트에서 번역하면 기존 TM도 드러워진다.
왜 이것을 여태 몰랐을까?
개구리 죽는 지도 못하고 냄비 안에서 죽는 꼴 아닌가 싶다.
클라우드 캣툴이 워낙 후졌다가 점점 나아지니까 그냥 받아 들인 것이다.
왜 클라우드 캣툴은 여러 문장씩 끊는 걸까?
곰곰히 생각해보니 파일 포맷인 듯하다. XLIFF 파일(XML 파일 기반) 탓인 듯하다. XML 파일이 대세가 되어 MS 파일도 세부 파일 포맷(아래 1 참고)을 들어가 보면 언제부턴가 XML이란 단어가 보인다. 꽤 됐다. 2009 트라도스를 쓰다보니 2, 3년전부터인가 최근 오피스로 저장한 파일이 안 열려서 검색해서 배운 방법이다.
ML 붙는 꼴 보니 HTML 문서 가져오는 방식이 아닌가 생각된다. 물론 근거없는 추정이다.
그리고 보니 스마트캣 워드 문서 빨아들여서 작업할 때는 마침표로 세그먼트 잘 끊는다. 십중팔구 파일의 문제이다.
모르겠으나 에이전시 측이 쓰는 캣툴 모듈에는 분명 이걸 구분하는 세그먼테이션 기능이 있어야 마땅한데, 왜 이따위로 번역가들에게 던지는지 모르겠다(물론 PDF 던지는 저급한 에이전시도 있는 마당에 한 세그먼트에 문장 서너 개씩 구겨넣는 것은 양반이겠으나). 아니면 아예 자기네들 편한 방식으로 웹에서 파일 내리는 바람에 세그먼테이션 룰 자체가 바뀌었고 그런 툴이 에이전시 쪽에 없는 것일 수도 있으리라. 그러나 경험에 비춰보건대 툴 자체가 하도 기능이 많아서 그걸 사용하는 에이전시나 PM이나 역량이 안 되어 모르고 있을 수도 있겠다. 외국 카페 한 번 뒤져볼 일이나... 아무튼... 요즘 열의가없다.
클라우드 캣툴은 이전에도 언급했거니와 에이전시 측에선 번역가보다 더 필수적인 툴이다. 일단 이멜로 잃어버리는 시간을 엄청 줄이고 관리가 용이하기 때문에 오프라인 툴을 벗어날 수밖에 없게 되어 있다. 간단히 말하자면 클라우드 캣툴은 전적으로 최종 사용자 중 한 쪽이자 툴 공급자인(제3자 제품이든 자체 개발 제품이든) 애아전시에 의해 주도된다.
다만 최종 사용자 중 번역가는 얻는 것이 그리 많지 않다. 물론 러닝커브가 크게 줄어 트라도스 없이도 번역할 수 있다는 것, 그리고 파일 잃어버리지 않는다는 것, 무식한 PDF나 오프라인 캣툴에서 잡을 수 없는 형식의 문서를 피할 수 있다는 것 정도다.
젠장... 그간 별 생각 없이 번역만 한 것 같다.
기술의 향상, 번역가는 얻는 것도 있지만, 잃는 게 많다. UI 좋아졌으나 한 세그먼트에 서너 문장 몰아넣으면 생산성은 급감한다. 이 경우만 놓고 보면 캣툴 팔아서 투자 유치받는 자, 그거 시대의 흐름 따라가서 장사하는 사업자가 기술 발전의 열매는 대부분 따먹고, 최종 사용자인 번역가들에겐 별 효용 없는 것이다. 요즘 시대는 과실의 대부분은 상위 계층만 가져가는 것이 맞는 거 같다. 필자는 미국에서도 극좌파 대학을 나왔는데 벌써 40년전부터 프랜차이스를 금지하는 시 조례가 있었는데, 그건 소규모 자영업자를 보호하는 법안이었다. 그땐 그런가 보다 정도로만 생각했는데 심오한 뜻이 있었던 셈이다. 이후 10여 년에 한 번쯤 캠퍼스를 찾아가면 눈에 띄는 것이 스타벅스, 바나나 리퍼블릭, 갭 등 프랜차이스들 늘고 있는 것이 보였다. 나름 아쉬웠는데... 어디를 가도 똑같은 세상, 국내에도 젠트리피케이션이란 쉽지 않은 단어가 들어오고 있는 지금... 그리고 번역계도 합종 연횡이 시작되는 지금... 번역계에도 갑을 관계가 형성된 지 오래이다. 먹이사슬의 최하단에 있는 번역가들의 앞날도 밝지많은 않은 것은 분명한 사실... 뭐 새롭게... 얘기하다보니 여기까지 왔다.
좌우간, 이 파일 문제는 우회로가 없을 것 같다. 한 번 찾아는 봐야겠다. XLIFF 파일 세그먼테이션을 마침표에서 끊는 방법 말이다. 그런데 이건 노력 대비 효율이 떨어질 것 같다. 어차피 찾는다 하더라도 XLIFF 파일을 다운로드하게 해주는 클라우드 캣툴이 현재로서는 많지 않으니까...
모니터 부수는 대신 블로그질로 스트레스 풀고... 젠장 오늘은 번역 이만하고 자야겠다. 내일(아니 오늘 오후) 바쁘겠다.
참고:
DOCX가 트라도스 최신 버전에서 안 열리면 이렇게 작업한다.
1. 내가 열고자 하는 DOCX나 XLS 확장자를 ZIP으로 바꾸면 ZIP 파일이 된다.
2. ZIP으로 바꾼 파일을 ZIP 프로그램으로 열어 그 파일들을 새 폴더에 EXTRACT한다
3. 폴더를 보면 "DOC PROPS"란 게 있고 그 안에 보면 APP(XML인가) 파일이 있는데, 그 파일을 노트패드로 열어서 보면 VERSION 15(기타, 16, 17)이라고 있는데 그걸 아마 14인가(안 되면 13)로 고쳐준다. 저장한다.
4. 다시 나와서 모든 폴더와 파일을 ZIP한다. 그러면 ZIP 파일이 생성된다.
5. ZIP한 파일의 확장자를 DOCX로 바꿔준다(이름 바꾸기를 사용함).
6. 그러면 트라도스가 이 파일이 자신이 열 수 있는 버전인 줄 오해하고 연다.
이 기법은 가령 2003 버전의 오피스를 갖고 있는 사람이 요즘 워드 파일을 받므면 못 열 때도 아마 사용할 수 있는 기법일게다. 물론 오피스야 범용 버전이어서 보낸 사람에게 다시 보내달라고 하는 게 더 편하겠으나... 혹시 그런 옵션이 없을 때...
따지고 보면 최근 버전에서도 문제가 있을 땐데 업그레이드 시키는 가장 효과적인 방법 중 하나인지라. 구버전 오피스 파일은 지원하지 않아 버리는 것이다. 여기에 버티며 싸우는 외국 번역가들이 있어서 배운 편법이기도 하다.
이것도 열정이 있던 시절에 하던 짓... 뭐 먹을 게 있다고... ㅋㅋㅋ
초기에는 클라우드 캣툴의 기능이 지나치게 제한적이어서 일이 많을 때는 아예 거절하기도 하였으나 세월이 흐르면서 무게 중심이 오프라인에서 온라인으로 이동함에 따라 크라우드 캣툴의 사용을 거부할 수 없는 상태가 되었다. 대략 3, 4년 전부터 출몰하기 시작한 클라우드 캣툴을 이제 대세로 자리잡았다. 물론 비싼 캣툴을 구매해야 하는 부담을 덜어준 것은 사실이나, 작업 속도 면에서는 흠... 모르겠다. 경우에 따라서는 30% 이상 시간이 더 소요되는 것 같다.
아무튼... 시장의 흐름에 따라 클라우드 캣툴에서의 작업량이 대세가 되었고(현재는 거의 90%에 이르는 것 같다) 이들의 기능 또한 전통적인 캣툴의 수준에 근접하기도 하였거니와 손에 익기도 하여 그냥 쓰고 있는 터...
그간은 기능 향상으로 일종의 착시 현상이 있었다는 걸 오늘 깨달았다.
지난 주에도 작업하였던 IT 기업의 웹사이트 번역 건을 하면서 깨닫게 된 중요한 사실이라 할 수 있겠다.
지금도 지긋지긋해서 이렇게 비교해보자. 나이를 상당히 먹은 바, 커피숍이나 이런 곳에서 초기 데이트하는 젊은 남녀들을 보면 저 커플이 제대로 될 건지 안 될 건지 바로 알 수 있다. 여자의 표정을 보면 단박에 알 수 있다. 어떻게 설명할까는 모르겠으나 영어 표현을 빌자면 여자의 ENGAGEMENT, 몰입도가 맞을까, 아무튼 그걸 보면 저 커플의 발전 가능성이 한눈에 들어온다. 뒤로 처져있다거나, 아무튼 갑갑해 하는 표정 말이다.
이놈의 IT 번역, 사실 이미 오픈된 문건인데다가 기계번역이 내가 하는 것보다 못할 것이 전혀 없어서 그리 어렵지도 않다. 그런데 시간이 데따 걸린다. 계속 주제의 문제라고 생각하던 터...
그런데 하도 오래 갑갑해 하다 보니 단지 그게 아니다.
이놈의 클라우드 캣툴 때문이다.
자세히 설명해보자.
과거 트라도스나 전통적인 다른 도구를 사용하면 마침표 끝나는 데서 세그먼테이션을 하기 때문에 한 문장씩 볼 수 있는데...
이 망할 클라우드들은 몇 문장씩 한 세그먼트로 잡는다. ㅅㅂ 여지껏 몰랐던 게 욕 나온다. 스마트링의 문제라고 생각했는데, 지금 작업하는 툴도 마찬가지다. 그리고 스마트캣도 그렇다.
자, 한 세그먼트에 여러 문장이 들어감으로써 생기는 문제다.
1. UI가 보통 후져서 문장이 많으니 젠장 안 보일 정도로 폰트 안 줄이면 여러 문장 전체를 표시하지 못하며 그 세그먼트에서 위, 아래 이동하는 거 정말 짜증난다. 오래 하면 컴 집어 던져버리고 싶다.
2. 더 큰 문제는 위 아래로 오르내릴 일이 엄청 많다는 것이다.
문장이 여러 개이고 특히 긴 문장이 서넛 있으면 돌아버린다. 일정 부분 번역하고 원문으로 돌아가서 다음 자리 찾는 것조차 어려워지니 실제로 골치가 아파진다. 이 자리 찾기가 얼마나 어려운지는 꼭 내 나이 탓만은 아니다.
이러니, 이런 문장이 지속되다 보면 한 시간쯤 하면 부아가 끌어오르고 녹초가 된다.
그러고 보니 스마트캣도 여러 문장을 한 세그먼트에 잡는다. 이것의 문제점은 TM 매치로도 연결된다. 과거 TM이 한 문장씩으로 구성됐을 경우, 100% 매치 잡을 때도 70%만 나온다. 그리고 새로 여러 문장을 한 세그먼트에서 번역하면 기존 TM도 드러워진다.
왜 이것을 여태 몰랐을까?
개구리 죽는 지도 못하고 냄비 안에서 죽는 꼴 아닌가 싶다.
클라우드 캣툴이 워낙 후졌다가 점점 나아지니까 그냥 받아 들인 것이다.
왜 클라우드 캣툴은 여러 문장씩 끊는 걸까?
곰곰히 생각해보니 파일 포맷인 듯하다. XLIFF 파일(XML 파일 기반) 탓인 듯하다. XML 파일이 대세가 되어 MS 파일도 세부 파일 포맷(아래 1 참고)을 들어가 보면 언제부턴가 XML이란 단어가 보인다. 꽤 됐다. 2009 트라도스를 쓰다보니 2, 3년전부터인가 최근 오피스로 저장한 파일이 안 열려서 검색해서 배운 방법이다.
ML 붙는 꼴 보니 HTML 문서 가져오는 방식이 아닌가 생각된다. 물론 근거없는 추정이다.
그리고 보니 스마트캣 워드 문서 빨아들여서 작업할 때는 마침표로 세그먼트 잘 끊는다. 십중팔구 파일의 문제이다.
모르겠으나 에이전시 측이 쓰는 캣툴 모듈에는 분명 이걸 구분하는 세그먼테이션 기능이 있어야 마땅한데, 왜 이따위로 번역가들에게 던지는지 모르겠다(물론 PDF 던지는 저급한 에이전시도 있는 마당에 한 세그먼트에 문장 서너 개씩 구겨넣는 것은 양반이겠으나). 아니면 아예 자기네들 편한 방식으로 웹에서 파일 내리는 바람에 세그먼테이션 룰 자체가 바뀌었고 그런 툴이 에이전시 쪽에 없는 것일 수도 있으리라. 그러나 경험에 비춰보건대 툴 자체가 하도 기능이 많아서 그걸 사용하는 에이전시나 PM이나 역량이 안 되어 모르고 있을 수도 있겠다. 외국 카페 한 번 뒤져볼 일이나... 아무튼... 요즘 열의가없다.
클라우드 캣툴은 이전에도 언급했거니와 에이전시 측에선 번역가보다 더 필수적인 툴이다. 일단 이멜로 잃어버리는 시간을 엄청 줄이고 관리가 용이하기 때문에 오프라인 툴을 벗어날 수밖에 없게 되어 있다. 간단히 말하자면 클라우드 캣툴은 전적으로 최종 사용자 중 한 쪽이자 툴 공급자인(제3자 제품이든 자체 개발 제품이든) 애아전시에 의해 주도된다.
다만 최종 사용자 중 번역가는 얻는 것이 그리 많지 않다. 물론 러닝커브가 크게 줄어 트라도스 없이도 번역할 수 있다는 것, 그리고 파일 잃어버리지 않는다는 것, 무식한 PDF나 오프라인 캣툴에서 잡을 수 없는 형식의 문서를 피할 수 있다는 것 정도다.
젠장... 그간 별 생각 없이 번역만 한 것 같다.
기술의 향상, 번역가는 얻는 것도 있지만, 잃는 게 많다. UI 좋아졌으나 한 세그먼트에 서너 문장 몰아넣으면 생산성은 급감한다. 이 경우만 놓고 보면 캣툴 팔아서 투자 유치받는 자, 그거 시대의 흐름 따라가서 장사하는 사업자가 기술 발전의 열매는 대부분 따먹고, 최종 사용자인 번역가들에겐 별 효용 없는 것이다. 요즘 시대는 과실의 대부분은 상위 계층만 가져가는 것이 맞는 거 같다. 필자는 미국에서도 극좌파 대학을 나왔는데 벌써 40년전부터 프랜차이스를 금지하는 시 조례가 있었는데, 그건 소규모 자영업자를 보호하는 법안이었다. 그땐 그런가 보다 정도로만 생각했는데 심오한 뜻이 있었던 셈이다. 이후 10여 년에 한 번쯤 캠퍼스를 찾아가면 눈에 띄는 것이 스타벅스, 바나나 리퍼블릭, 갭 등 프랜차이스들 늘고 있는 것이 보였다. 나름 아쉬웠는데... 어디를 가도 똑같은 세상, 국내에도 젠트리피케이션이란 쉽지 않은 단어가 들어오고 있는 지금... 그리고 번역계도 합종 연횡이 시작되는 지금... 번역계에도 갑을 관계가 형성된 지 오래이다. 먹이사슬의 최하단에 있는 번역가들의 앞날도 밝지많은 않은 것은 분명한 사실... 뭐 새롭게... 얘기하다보니 여기까지 왔다.
좌우간, 이 파일 문제는 우회로가 없을 것 같다. 한 번 찾아는 봐야겠다. XLIFF 파일 세그먼테이션을 마침표에서 끊는 방법 말이다. 그런데 이건 노력 대비 효율이 떨어질 것 같다. 어차피 찾는다 하더라도 XLIFF 파일을 다운로드하게 해주는 클라우드 캣툴이 현재로서는 많지 않으니까...
모니터 부수는 대신 블로그질로 스트레스 풀고... 젠장 오늘은 번역 이만하고 자야겠다. 내일(아니 오늘 오후) 바쁘겠다.
참고:
DOCX가 트라도스 최신 버전에서 안 열리면 이렇게 작업한다.
1. 내가 열고자 하는 DOCX나 XLS 확장자를 ZIP으로 바꾸면 ZIP 파일이 된다.
2. ZIP으로 바꾼 파일을 ZIP 프로그램으로 열어 그 파일들을 새 폴더에 EXTRACT한다
3. 폴더를 보면 "DOC PROPS"란 게 있고 그 안에 보면 APP(XML인가) 파일이 있는데, 그 파일을 노트패드로 열어서 보면 VERSION 15(기타, 16, 17)이라고 있는데 그걸 아마 14인가(안 되면 13)로 고쳐준다. 저장한다.
4. 다시 나와서 모든 폴더와 파일을 ZIP한다. 그러면 ZIP 파일이 생성된다.
5. ZIP한 파일의 확장자를 DOCX로 바꿔준다(이름 바꾸기를 사용함).
6. 그러면 트라도스가 이 파일이 자신이 열 수 있는 버전인 줄 오해하고 연다.
이 기법은 가령 2003 버전의 오피스를 갖고 있는 사람이 요즘 워드 파일을 받므면 못 열 때도 아마 사용할 수 있는 기법일게다. 물론 오피스야 범용 버전이어서 보낸 사람에게 다시 보내달라고 하는 게 더 편하겠으나... 혹시 그런 옵션이 없을 때...
따지고 보면 최근 버전에서도 문제가 있을 땐데 업그레이드 시키는 가장 효과적인 방법 중 하나인지라. 구버전 오피스 파일은 지원하지 않아 버리는 것이다. 여기에 버티며 싸우는 외국 번역가들이 있어서 배운 편법이기도 하다.
이것도 열정이 있던 시절에 하던 짓... 뭐 먹을 게 있다고... ㅋㅋㅋ