TGC 사이트는 좋은 콘텐츠 덕분에 성장한다. 커뮤니티커넥트레 딧 등 우리와 대화를 나눈 많은 UGC 회사는 악의적인 콘텐츠 때문에 머리를 알고 있는데, 이런 콘텐츠를 처리하려면 지속적인 분석과 상당한 기술 투자가 필 요하다. 알고리즘과 휴리스틱 기법을 사용할 뿐만 아니라 구글이나 페이스북 같은 회사는 범죄성 콘텐츠나 악성 콘텐츠를 걸러내기 위해 상근직 인력을 고용 하고 있는데, 이런 일은 대단히 힘든 일이다." 제레미 에드버그에 의하면 비 레딧 사이트를 시작하고 나서 첫 18개월 동안은 사용자 투표만으로도 모든 스팸 을 막기에 충분했기 때문에 스팸 방지 기능이 전혀 없었지만 지금은 레딧 개발 시 간의 50%를 스팸과 사기성 투표를 막는 데 쏟고 있다고 추산한다.
스팸을 올리는 사람들은 종종 일회성 계정을 만드는데, 이런 계정은 찾아내기 쉽다. 그렇지만 사용자 계정을 도용하는 경우는 찾기 어렵다. 그러나 대부분의 UGC 사이트에는 사용자들이 스팸 콘텐츠를 표시하는 기능이 있어서 콘텐츠를 검토하는 일이 수월하다. 그러나 커뮤니티의 자정 노력에도 불구하고 사용자들을
통해 나쁜 콘텐츠를 찾아내는 것은 좋은 방법이 아니다. 레딧에서 나쁜 콘텐츠로 표시된 글의 대부분은 사실 스캔을 올리는 사람들이 자기 콘텐츠를 띄우려고 다 른 사람들의 콘텐츠를 나쁘다고 표시한 것이다. 레딧에서 "우리는 각 사용자의 스 팸 고발 품질을 분석하는 시스템 (몇 건의 스팸 고발이 오히려 스팸으로 판명되는 지)을 구축할 수밖에 없었습니다'라고 말한다.
레딧에서는 관리자들과 더불어 자동화된 필터가 대부분의 스팸을 찾아낸다. 2011년에는 사용자가 올린 콘텐츠의 절반 가량이 스팸이었다. 제레미는 이렇게 말한다. "이 50%의 스팸은 50%에 훨씬 못 미치는 수의 사용자들이 올린 것입니 다. 부정행위를 방지하는 방법도 이와 비슷한 방식으로 개발했습니다. 즉, 우리는 어린 성공적인 부정행위자의 사례를 찾아 어떻게 이런 사람들이 성공적으로 부정 행위를 저질렀는지 분석한 다음 데이터에서 다른 사례를 찾은 후 그런 유형의 부 정행위를 발견하는 모델을 개발했습니다. 그런 식으로 모든 부정행위를 방지하는 방법을 개발했습니다."
나중에 가서 레딧은 스팸 성향을 이용한 광고 매출 모델을 고안했다. "우리는 스 패머들이 속임수를 써서 자신의 링크를 알리고 싶어 한다는 사실을 알게 되었습 •니다. 그렇다면 이들에게 돈을 받고 링크를 실어주고 그 사실을 공개하는 것도 좋 겠다고 생각했습니다." 제레미는 말한다. "현재 우리 사이트의 스폰서 링크는 스 타일이나 실행 면에서 2008년 무렵 구글이 스폰서 링크를 강조해서 표시하던 방 식과 거의 흡사합니다.
요지
여러분의 사이트가 점점 인기를 얻으면 상당한 시간과 돈을 스팸 퇴치에 쏟게 될 것이다. 처음부터 어떤 것이 좋은 콘텐츠이고 어떤 것이 나쁜 콘텐츠인지, 어떤 사용자가 나쁜 콘텐츠를 잘 가려내는지 판단하기 시작해봐야 한다. 효과적인 알 고리즘의 핵심은 알고리즘을 학습시키는 데이터 집합이다. 콘텐츠 품질은 사용자 만족의 선행지표이므로 품질이 낮아지지는 않았는지 주시하고 이 때문에 커뮤니 티가 약해지지 않도록 신속히 이 문제를 처리하라.
← 피드로 돌아가기
기획 노트·제품에 대한 소고
