테이블의 데이터 패턴을 식별하는 일종의 오픈 소스 라이브러리가 있습니까?

좋아, 상황은 다음과 같습니다. 약 50 개의 열 (데이터베이스 테이블 조인으로 작성)과 수천 개의 행이 있습니다. 우리는 그 데이터의 여러 가지 알려진 오류 기록에서 패턴을 식별해야합니다. 여기에 정말로 끓인 예제가 있습니다. 주어진 표 :테이블의 데이터 패턴을 식별하는 일종의 오픈 소스 라이브러리가 있습니까?

----------------------- 
| id | title | date | 
----------------------- 
| 01 | c  | 2009-01| 
| 02 | a  | 2009-02| 
| 03 | a  | 2009-02| 
| 04 | b  | 2009-03| 
| 05 | b  | 2009-03| 
| 06 | a  | 2009-04| 
-----------------------

그리고 라이브러리에 나와있는 행 1,4,5가 어떻게 관련되어 있는지 묻습니다. 또는 다른 행과 다른 점은 무엇입니까? 이 라이브러리는 말할 것입니다 :

선택된 모든 행
모든 선택된 행 '는'

는 아마도 라이브러리가 피벗의 일련의 반복되는 = 제목이없는

홀수 달 수 있습니다 엑셀의 테이블 그룹. 재미있는 그룹화 및 계산 조합을 찾을 때마다 알려줍니다.

실제 상황 (이상한 경우에만 해당) : 정확한 상황은 데이터 변경이 어떻게 든 '실행 취소'되었음을 알게 된 것입니다. 변경 사항을 '다시 실행'하고 막대기가되기를 기대하는 대신, 왜 발생했는지 파악하려고 노력하고 있습니다. 여기에 실제 열 가능한 데이터 패턴의 일부는 다음과 같습니다

----------------------------------------------------- 
| id | user | created_on| facility | review_status | 
----------------------------------------------------- 
| 01 | tom | 2009-01 | Bay  | Locked  | 
| 02 | berry | 2009-02 | Inner |    | 
| 03 | jan | 2009-02 | Hamming | Submited  | 
| 04 | bernie| 2009-03 | Youth | Accepted  | 
| 05 | jack | 2009-03 | Johnson | Locked  | 
| 06 | frank | 2009-04 | Baber St.|    | 
-----------------------------------------------------

우리의 문제는 '잠'만 아니었다으로 검토 상태 (5 열) 모두가 표시되어 있어야한다는 것입니다.

누구나 이런 종류의 패턴 검색 라이브러리를 알고 있습니까? 아래의 긴 대답은 머리에 못을 박았다. DATA MINING 소프트웨어는 돈이 맞는 것 같지만 솔루션은 오픈 소스 또는 "맥주처럼 자유"솔루션이어야합니다. 감사합니다. 모두들!

P. Petitio principii 답변 또는 초기 질문에 대답하지 않으려는 답변은 고려되지 않습니다 (실제로는 예상 한 방식이 아닌 것으로 간주됩니다).

출처

2009-08-12 btelles

알 수없는 패턴을 찾으십니까? 어떤 패턴? – markus

정확히 무엇을 찾고 있습니까, 무엇이 결함이 있습니까? 어떻게 결함이 있습니까? – markus

물론 ... ... 위의 명확한 설명이 추가되었습니다 – btelles