네이버 유사문서 판독 시스템 오류 및 웹문서 검색 강화 문제점

 네이버검색의 유사문서 판독 시스템 신뢰성에 대한 문제점 및 웹문서 검색 결과에 대한 의문점을 제시하고자 합니다.

 

네이버는 원본글을 우선 노출하고 복사글의 검색 노출을 방지하기 위해 유사문서 판독 시스템을 도입하고 있기 때문에 복사된 글은 검색 결과에서 노출되지 않고 숨겨지게 됩니다.

그러다보니 각종 정부정책이나 보도자료를 블로그에 인용할 경우 이또한 유사문서로 판독되어 아예 검색결과에서는 제외되는 일이 생기기도 합니다.

 

그런데 이번에 제 블로그의 글이 대량으로 다른 사이트에 제목, 원문 그대로 복사되었는데 믿었던 네이버검색의 유사문서 판독 시스템이 전혀 걸러내지 못하고 있는 것을 보고 충격을 받았습니다. (이번 일을 겪으면서 혼자생각이지만, 혹시 유사문서 판독 시스템은 블로그만 집중적으로 관리하는 것이 아닌가 하는 의심이 생겼습니다.)

 


먼저 이번에 타 커뮤니티 사이트로 복사된 제 글의 갯수는 거의 160개 정도로 제 블로그 유입숫자가 가장 많은 글을 대부분 가져갔습니다. 해당 사이트에는 강력하게 항의를 해놓은 상태지만 아직도 글이 지워지지 않고 있어서 오늘 중으로 조치를 취할 생각입니다.

 

아무튼 타 사이트에서 가져간 글들은 제목까지 그대로 가져갔기 때문에 네이버 검색에서 제목을 그대로 입력하여 검색을 해보았습니다.

'인터넷 랙, 핑테스트 빠르고 강하게 끝내기'

 

네이버 검색결과 최상단에는 웹문서 검색결과가 나타나는데 타 사이트에서 복사한 제 글제목과 요약글이 제 블로그 검색 결과에 똑같이 보여지고 있습니다.

더 놀라운 것은 똑같은 사이트에 똑같은 글 목록으로 최상단 검색결과를 도배하고 있다는 것입니다. 막상 해당 주소를 클릭하면 글은 같은 사이트의 게시판 한 곳에 등록돼 있을 뿐입니다.

 

웹문서 검색 강화의 놀라운 결과라고나 할까요?

제 블로그의 원문은 맨 밑에 블로그 검색 결과에 나타나고 있습니다만 이 상태에서 볼 때 상단의 글이 원문처럼 보이고 제 블로그 검색 결과는 웬지 복사글로 보여지는 것은 저만의 느낌은 아닐 것입니다.

 

 더 심각한 결과도 있습니다. 2007년에 작성한 제 블로그의 글도 타 사이트로 복사되었는데요, 해당 글 제목으로 검색하니 역시나 최상단에 웹문서 영역에 복사글이 먼저 표시되고 있고 제 블로그 글은 맨 밑에 블로그 영역에 나타나고 있습니다.

 

그런데 웹문서 영역 중간에 또다른 사이트의 글이 표시되고 있는데 해당 주소를 클릭하니 웹하드 광고페이지로 연결돼 있었습니다. 해당 페이지에는 글 제목만 있을뿐 글은 없었습니다.

이런 것은 당연히 네이버검색에서 걸러내야 할 것 같은데 그것도 아닌 모양입니다.

 

 

네이버 웹문서 강화 노력이 또 엉뚱한 결과를 나타내기도 하는데요, 유튜브 보조채널 수익... 이 글은 제가 블로그에 2015년 4월 10일에 올렸고 바로 그 다음날 4월 11일에 타 사이트에서 복사해서 또 올렸습니다.

 

하지만, 유사문서 판독 시스템은 이번에도 무용지물로 전락하고 말았는데 역시나 타 사이트의 복사글이 검색 결과 맨 상단에 노출되고 있습니다. 즉, 글이 발행된지 오래 된 것이니 최신 것이나 네이버 유사문서 검색결과는 마찬가지라는 것입니다.

 

 

위에서 몇 개의 글 제목으로 네이버 검색 결과를 확인했는데 실제 타 사이트에서 가져간 제 글 160개를 네이버에서 제목 그대로 검색하면 대부분 같은 결과를 나타내고 있습니다.

 

아래 보이는 그림들은 제 그글을 가져간 타 사이트의 게시판 글 제목입니다. 해당 게시판의 글 전체 갯수가 대략 180개 정도 되는데 제 글이 160개 정도라 보면 해당 사이트의 카테고리 한 개를 거의 제 글로 채웠다고 보면 되겠습니다.

 

 

그렇다면 이와 같은 문제가 발생했을 때 원본글 작성자가 할 수 있는 일이 무엇있을까요?

일단 네이버와 다음은 아래 그림에 보이는 것처럼 원본반영 요청을 하여 유사문서를 검색결과에서 나타나지 못하게 신청할 수 있습니다.

 

저처럼 침해당한 글 갯수가 많을 경우 일일이 글 주소를 적어서 신고하는 것이 매우 귀찮고 시간도 많이 걸리겠지만 일단 상대방과 다투지 않고 혼자 처리할 수 있는 가장 간단한 방법입니다.

 

 

물론, 그보다 가장 좋은 방법은 타 사이트에 올려진 글을 해당 사이트 관리자 또는 복사해간 당사자가 글을 모두 삭제하는 것이겠지요. 그래서 저도 아직까지는 별다른 움직임 없이 해당 사이트 관리자에게 도움을 요청한 상태입니다.

 

끝내 이것도저것도 해결이 안 된다면 최후의 방법은 역시 법대로 하는 것이겠지만 거기까지 가기 전에 해결되겠지요.

 

댓글(2)

티스토리 툴바