1. 한국인 트위터 사용자 통계

    현재 한국인 트위터 사용자 통계 사이트 작업을 진행중에 있습니다. 아직 완료된 것은 아니고 점진적으로 추가해 나갈 계획입니다. 참고하세요.

    http://tki.oiko.cchttp://twkr.oiko.cc로 접속하면 됩니다.

     
  2. 알림

    서버 이전으로 기존에 http://tki.oiko.cc로 제공했던 한국인 트위터 정보는 더 이상 제공하지 않습니다. 조만간 새로워진 모습으로 다시 공개할 예정입니다. 일정이 늦춰지고 있지만 통계 정보 뿐만 아니라 다양한 정보를 제공할 예정입니다.

     
  3. 성장요인

    월별 가입자수가 궁금해 한번 뽑아 봤습니다.

    아래 그래프를 보면 아시겠지만 역시 김연아씨의 등장이 눈길을 끄네요. 김연아씨의 등장으로 트위터에 대한 관심도가 높아진 것이 사실입니다. 대중적인 지지도의 전파로 많은 사람들이 트위터를 쓰기 시작한 것을 볼 수 있습니다. 물론 추정입니다. 하지만, 김연아씨의 Followers수치로 어느 정도 객관적인 시선이라고 해도 무방할 듯 합니다. 미국에 오프라 이펙트가 있다면 한국에는 김연아 이펙트가 있습니다. 뿐만 아니라 비슷한 시기에 유명인들의 합세로 그 상승세를 더하고 있는 것을 알 수 있습니다. 다들 아는 이야기이지만 데이터를 같이 놓고 보니 딱 맞아 떨어지네요.

    (알림: 현재 TKI에 등록된 한국인 추정 트위터 사용자의 가입일은 가장 빠른 사람이 2006년 9월부터 시작합니다. 그래프는 TKI DB의 내용에 기반하므로 실제와 다를 수 있습니다. 지속적인 한국 사용자 데이터 수집으로 오차를 좁혀갈 것입니다.)

    월별 가입 누적 그래프

    유명인 가입시기

     
  4. 왜 갑자기 수치가 늘었나?

    안녕하세요, OikoLab입니다.

    매주 발표하는 TKI500의 수치가 갑자기 1만 명 이상 증가된 것에 대해 궁금해 하시는 분들이 많아 간단하게 설명을 드리겠습니다. TKI500은 올해 8월부터 실험적으로 한국인 트위터 사용자를 수집해 Follower등의 지표를 통한 순위 500명을 산정해 발표하고 있습니다.

    TKI에서 다음과 같은 기준으로 임의의 트위터 사용자를 한국인으로 분류합니다.

    1. 한글 사용 여부
    2. 위치 정보에 한국과 관련된 지명이 있을 경우
    3. 최근 트윗에 4글자 이상의 한글이 있는지 여부

    (참고로 영어만 사용하는 유명인의 경우 수동으로 추가했습니다.)

    파일럿 단계

    2009년 8월 초기 데이터는 파일럿 단계였기 때문에 시행착오도 있었고 과다하게 외국인이 많이 걸러지는 등의 오류가 있었던 단계입니다. 아래 그래프를 보면 초기에 5만 3천까지 갔던 경우가 있었는데 대부분 오류로 잘못 분류된 사람들을 필터링해 수치는 4만 아래로 내려갑니다.

    안정 단계

    최근까지는 TKI 상위에 랭크된 1,000명 위주로 스캐닝하였고 주 단위 업데이트를 위해 2~3일간 단기 스캐닝만을 실시하였습니다. 그런 이유로 증가세가 일정한 것을 볼 수 있습니다. 이것은 대규모의 스캐닝을 할 수 없는 여건 때문이기도 했고 상위 그룹에 새로운 사용자들이 많이 합류하기 때문에 주요 스캐닝 그룹이 된 것 입니다.

    현재

    주 단위의 업데이트는 동일하나 수집을 항시 체제로 전환했고 TKI 상위 1,000명의 친구들을 스캐닝하는 것에서 벗어나 TKI에 한국인으로 등록된 모든 트위터 사용자들의 친구를 대상으로 스캐닝을 하고 있습니다. 또한, 가입은 했으나 트윗이 하나도 없는 노트윗의 경우도 편입시켰습니다. 이전에는 무시해 했던 경우입니다.

    -EOF-

     
  5. Effective Followers

    특정인의 followers수치가 인기도를 반영하는 중요한 척도로 사용되고 있다. 하지만, bot이나 실제 사용하지 않는 사용자들의 허수가 상당히 많은 것도 사실이다. 아래 공식은 실제 최소한 하루에 한 개 이상의 트윗팅을 하는 사용자를 진성 followers로 보고 그것을 합산해 총 유효 Followers를 구하는 공식이다.

    최소한 하루에 한 개의 트위팅을 하는 활동성이 있는 사용자가 유효한 사용자로 카운팅이 된다는 의미이다. 이러한 활동성은 자신이 추종하는 사람과의 교감이나 또는 다른 이들과의 교류를 통해 트위터를 더 활용하도록 하는 기폭제 역할을 할 개연성이 있기 때문에 이를 바탕으로 하는 유효성은 유의미하다고 본다.

    (향후 시스템 확장시 적용해 볼 예정임)

    (잠깐 생각난 것을 스케치한 공식이기 때문에 바뀔 수 있습니다.)

     
  6. SNS에 대한 분석관련 이론과 실제에 대해서 포스팅할 예정입니다.
    많은 관심 부탁드립니다.

     
  7. 이곳은 OikoLab의 공식 블로그입니다.