Ars에서 오페라의 새 연구자료인 MAMA에 대해서 다루었습니다(역자 주 : 발음이 엄마라는 뜻의 '마마'와 같아 재미있어 하는 것 같습니다). 연구 결과에 따르면 웹의 4.13%만이 표준에 호환된다고 합니다.

MAMA는 메타데이터 분석과 어플리케이션 마이닝(Metadata Analysis and Mining Application, MAMA)의 약자로 웹을 수집해서 거의 350만에 달하는 페이지로부터 마크업을 인덱싱하고 데이터를 스크립팅하는 도구입니다. 오페라에서 이러한 작업을 하는 것은 보기 좋군요.

Ian Hickson씨가 구글 인덱스를 이용해 개발자들이 HTML을 어떻게 쓰는지에 대해 연구했습니다.

몇 가지 보고서는 이렇습니다:

The URL set

MAMA의 분석량은 어마어마한 전체의 1퍼센트에도 훨씬 못미치는 미미한  것입니다. 무엇이든 350만 정도가 의미있다고 하기엔 뭔가 이상합니다. 잠깐만이라도 그렇지 않다고 가정을 해볼까요. 우리는 모든 웹 페이지를 살펴볼 수 없어서, 살펴볼 URL의 소그룹을 선택하고 이것이 전체 웹의 대표격이라고 정해야 했습니다. 한가지 옵션은 무작위로 URL 셋을 선택하는 것입니다. 저는 Rene Saarsoo씨(코딩 습관에 대한 멋진 연구를 하셨던 분입니다)와 대화를 나누었습니다. 그는 웹의 구조와 URL 셋의 선택에 많은 훌륭한 부분들을 제시해주었습니다. 그 중 몇 개는 여기에 적어보겠습니다.

Markup Validation Report

웹 표준은 웹에 좋습니다! 이 사이트의 방문자 대부분은 이 말이 왜 진실인지에 대해서 이해할 것입니다. 유지보수의 편리함, 크로스 플랫폼 호환성, 장애인들의 접근, 그 밖에도 여러가지가 있습니다!

하지만 어떻게 웹의 현실을 이런 이상과 맞출 수 있을까요? 확실히 공개된 웹 표준으로 코딩해야할 정말 많은 이유들이 있지만, 주요 사이트들은 웹 표준에 유효할까요? 그렇지는 않습니다. 오페라의 MAMA 프로젝트는 극소수의 사이트들만이 실제로 유효한 마크업을 사용하고 있다는 정말 충격적인 통계를 보여주었습니다.

Key Findings Report

분석자료가 보여주는 것:

  • 웹 서버 사용률: Apache: 67.72%, IIS: 25.91%
  • 문서 구조와 크기
  • Flash 검출
  • CSS 스타일 사용
  • 스크립트
  • XMLHttpRequest 객체 사용

물론, 몇가지 지적할 점이 있긴 합니다. 페이지에서 "XMLHttpRequest"를 찾는 것은 XHR이 예제처럼 사용되기도 하는 요즘 현실을 반영하지 못합니다.

Doron Rosenberg씨가 이런 몇 가지 이슈에 대해 지적했습니다:

극소수 웹사이트만이 표준에 완벽히 호환된다는 것이 놀랍지는 않지만, 그들의 방법론은 허점이 있어보입니다. 웹 사이트는 페이지가 로드된 후에 이러한 통계에 영향을 줄 수 있을 점점 더 동적인 JavaScript를 사용하고 있습니다. 또한 주요 자바스크립트 라이브러리들은 CDN을 통해 링크되어있어 XMLHttpRequest 사용 통계가 그다지 유용하지는 않을 것 같습니다.

하지만 저는 중국 웹사이트가 플래시를 사랑한다는 것에는 정말 동의합니다. 전 아직도 AOL China를 Gecko 테스트하던 때의 악몽을 가지고 있습니다. 플래시로 만들어진, 스크롤되는, 떠다니는 광고는 끔찍했습니다.

그래도 몇가지 훌륭한 데이터들이 있으며, 우리에게 얘기할 거리를 주었습니다. 저는 Google, Microsoft, Yahoo! 그 외 웹을 인덱스할 수 있는 다른 회사에서도 이런 형태의 결과가 나왔으면 좋겠습니다.

from MAMA, who is using Web standards?

Posted by 행복한고니 트랙백 0 : 댓글 0