스팸덧글

!@#… 자고로 인터넷에서 혁신은 예상치 못한 곳에서 나올 가능성이 많다 – 마치 포르노가 배너광고 개념을 개척했듯. 그런데 앞으로 가장 중요한 돌파구 중 하나인 언어 생성 / 자동 번역의 진정한 완성은, 스팸 광고들이 완성해내고 말 것 같다.

요새 캡콜닷넷의 Akismet 스팸함에 들어오는 리플들, 장난 아니다. 나름 세계적으로 널리 쓰는 워드프레스 엔진이다보니 세계 전역 스패머들의 놀이터인데, 갈수록 스패밍 인공지능이 쩔어주신다. 예를 들어 이런 식이다:

Bong-hwa
cheapautocarinsurancequotes.com/
splashdotr@hotmail.com
124.157.191.95
감사합니다! 매우 도움이 게시물!

Bong-chol
cheapautocarinsurancequotes.com/
peyzaj.133@gmail.com
124.157.191.95
하지만 난이 게시물 날 정말 이렇게 강제로 말을하고 싶습니다! 정말 좋은 게시할 수있습니다.

Bong-chol
caraccidentlawyerattorney.com/
smilearoundtheworld@gmail.com
124.157.191.95
Submitted on 2010/03/05 at 3:11am
감사합니다! 매우 도움이 게시물!

본 사이트의 주요 언어를 인식한 후(UTF8이니, 단순히 문자코드만으로 감지하는 것도 아니다), 그걸 바탕으로 리플 작성자로 한국식 이름을 골라잡는다. 그것도 같은 이의 반복을 피하려는건지 조합형 이름이다. 그리고 광고 링크, 쓰레기메일주소를 입력하곤, 리플 본문에는 뻔한 스팸용 낚시멘트를 번역기로 돌려 한국어화한 메시지를 삽입. 아직 문장이 좀 길면 어색하지만, 짧은 경우는 자세히 읽지 않으면 이미 꽤 그럴듯하다. 잘 모르는 외국어로 되어 있는 리플은 무조건 스팸으로 간주하고 필터링하는 관행을 넘어서기 위한 술수겠지.

!@#… 여튼 사이트 본 콘텐츠를 인식하고 거기에 맞춤형으로 스팸을 달아놓는 기술에 잠시 경탄했다. 그 응용처는 실로 무궁무진. 이 기술이 조금만 더 발전하면, 더 이상 모 거대정당은 인터넷 댓글알바를 모으고 일당 주고 비밀 유지하고 수고할 필요가 없다. 본문의 언어를 진단하고 스팸리플을 정하듯, 본문의 특정 키워드를 진단해서 자동으로 그에 대응하는 악플을 자동생성하면 되거든(나름 시장파괴적 기술). 네이버 정치뉴스 댓글들이나 주요 찌질블로거들 댓글란에 이어지는 마라톤 바보쑈 수준을 볼 때, 자동화된 코드가 인간과 구분이 안되는 지경은 생각보다 빨리 올 것 같기도 하고.

…뭐 좀 더 착한 개발자들이라면, 그런 기술을 블로그 내외의 관련글 자동으로 찾아주기 등 평범하게 훌륭한 방향을 위해 써먹겠지만.

Copyleft 2010 by capcold. 이동/수정/영리 자유 —    [ <--부디 이것까지 같이 퍼가시길]

Trackback URL for this post: http://capcold.net/blog/5619/trackback
18 thoughts on “스팸덧글

Trackbacks/Pings

  1. Pingback by 마하반야

    뚫으려는 자의 기술 개발.. 놀랍구나. capcold님의 블로그님 – 스팸덧글 http://capcold.net/blog/5619

  2. Pingback by Nakho Kim

    [캡콜닷넷업뎃] 스팸덧글 http://capcold.net/blog/5619 | 인터넷의 다음 혁신은 스팸에서 나올 것 같다.

  3. Pingback by 김원철

    덜덜덜…;; 펌: @capcold: [캡콜닷넷업뎃] 스팸덧글 http://capcold.net/blog/5619 | 인터넷의 다음 혁신은 스팸에서 나올 것 같다.

  4. Pingback by 모기불통신

    인공지능 악플…

    캡콜드사마의 스팸덧글 이 흥미롭다. 인공지능 스팸덧글에 관한 이야긴데 거기서 모당에서는 굳이 알바를 풀 필요가 없이 인공지능을 활용하면 된다는 이야기를 하셨다. 그런데 사실 나도 비슷한 생각을 했다. 다만 모당의 인터넷 알바가 아니라 악플 뻘플을 다는 악플러 뻘플러들이 사실은 인공지능이 아닐까 하는 의문을 품었던 것이다. 그러니까 이렇게 되는 것이다. 1. 인터넷상의 글을 무작위로 읽어들이다가 이미 지정된 단어들을 만나면 자동으로 몇가지 단어를 추…

  5. Pingback by friedpotato's me2DAY

    지하생활자의 생각…

    자고로 인터넷에서 혁신은 예상치 못한 곳에서 나올 가능성이 많다 – 마치 포르노가 배너광고 개념을 개척했듯. 그런데 앞으로 가장 중요한 돌파구 중 하나인 언어 생성 / 자동 번역의 진정한 완성은, 스팸 광고들이 완성해내고 말 것 같다. (스팸덧글)…

Comments


  1. 저는 Byung-soon씨의 덧글을 받았는데, 자기가 덧글을 다는 포스트의 키워드까지 반영해서 URL을 뽑더군요. 전산언어학 전공 예정자로서 웃어야 할지 울어야 할지 모르겠습니다. -_-

  2. !@#… frozenfire님/ 기계댓글의 수준은 올라가고 사람댓글의 수준은 낮아지니 조만간 중간에서 만날겁니…;;;

    거북님/ 아아 실로 적절한 만화 링크군요 (승리의 원사운드 작가).

    Bong_Curtis님/ 천만에요 매우 환영을 답글!

  3. 여담이지만 알바 얘기가 나와서 말인데, 예전에는 정말 그럴까도 했지만 학원강사(메가스터디)인 대학후배가 자신의 평판유지를 위해 알바를 고용했다는 말을 듣고 충분히 믿을 수 있게 되더군요. 알고보니 그런 사람 흔하더라는…

  4. !@#… 지나가던이님/ 법적으로 금지하거나 경제적 손실이 막심한 것이 아니라면, 자신에게 유리한 건 무엇이든 해놓고 보는 것이 인간이죠(…)

  5. 텍스트 큐브같은 댓글 승인 기능이 정말이지 고맙습니다.
    근데 트랙백 스팸은 해결책을 모르겠습니다..;

  6. !@#… mafuyou님/ 그건 해결책이 없습니다(…) 워프는 Akismet 필터가 그나마 꽤 우수해서 잘 막아주는 편인데, 거꾸로 제대로 된 한국어 트랙백을 스팸분류하는 경우도 많죠.

    새벽안개님/ 뭐랄까 물고기에서 다리가 생겨 뭍에 올라오기 시작한 것 같은 느낌입니다;;

  7. !@#… 의리님/ 사실은 이미;;; 다만 가끔 정치/사회뉴스를 보면 알 수 있듯, 적잖이 버그투성이죠.

  8. 낙태(임신 중절) 때문에 고민하고 계십니까?
    중국 청도로 오십시요 최고 의료 진이 저렴한 가격을 해결해 드립니다.
    상세한 문의는
    전화:010-2895-3618
    메일:55816533@hanmail.com
    MSN:kynhh1974@hotmail.com
    연락인 :김 선생

  9. !@#… 위의 것은 스팸덧글인데, 왠지 스팸덧글 포스팅에 붙은 스팸덧글이라 재밌어서 남겨둠.