2011-02-28 2 views
1

SQL 데이터베이스에 대한 액세스를 IIS 6.0에 5 개 이상 (매일 400MB 이상) 삽입하려고합니다. 나를 놀라게하는 것은 크기입니다. 중복되는 많은 정보 (예 : 사이트 이름, URL, 참조 자, 브라우저)가 있으며 색인 및 룩업 테이블로 정규화 할 수 있습니다.IIS 액세스 로그에서 SQL 표준화로

다른 도구를 사용하는 대신 자신의 데이터베이스를 찾고있는 이유는 5 개의 서버이며 각각에 대한 사용자 지정 통계 및 보고서가 필요합니다. 또한 (특히 오픈 소스) 소프트웨어를 설치하는 것은 학살입니다 (기능이 125 % 필요하고 몇 달이 걸릴 수 있습니다).

내가 가장 효과적인 방법은 무엇일까요? 누군가가 그것에 관한 예나 기사를 보았습니까?

+0

지금까지 해보신 것은 무엇입니까? 도움이 필요한 것은 무엇입니까? Google을 사용해 보셨습니까? –

답변

0

난 당신이 주장하는 경우에 혼자가는 괜찮은 로그 분석 도구를 구입 제안하는 동안, SQL에 하나,

http://www.microsoft.com/downloads/en/details.aspx?FamilyID=890cd06b-abf8-4c25-91b2-f8d975cf8c07&displaylang=en

당신이 무거운 목록의 일부를 할 수 있도록 로그 파서에서 살펴 또는 아마 당신이 직접적으로 얻은 결과를 얻을 수 있습니다.

+0

나는이 파서를 좋아한다, 그것은 1 개의 서버를 위해 잘 작동했다, 나는 5 개를 얻었다. –

+0

또한 나의 질문은 정규화에 관한 것이다. SQL은 로그를 가져 오거나 분석하는 툴이 아니다. –

0

한편으로는 서버 IP 주소, 사용자 에이전트 및 참조 자와 같은 항목에 인공 키를 사용하여 디스크 공간을 많이 줄입니다. 저장 한 공간 중 일부는 색인으로 손실되지만 하루 400MB (5 배 서버)의 전체 디스크 절감량은 여전히 ​​상당해야합니다.

물론, 정보를보고하기 위해 조인을 다시 사용해야 할 필요성이 있습니다.

나의 열정은 하나의 열의 값을 2 열 조회 테이블의 인공 키로 대체하면 "정규화"라고해서는 안됩니다. 기능 의존성을 확인하지 않고도이 작업을 수행 할 수 있습니다. (나는 당신이 그것을 제안하고 있다고 확신하지는 않지만 그것처럼 들린다.)

원시 데이터에서 한 달에 약 12 ​​기가를보고있는 것이 맞습니까? 데이터웨어 하우징 관점에서 접근 해 보셨습니까? (OLTP 관점 대신)

관련 문제