좋아, 상황은 다음과 같습니다. 약 50 개의 열 (데이터베이스 테이블 조인으로 작성)과 수천 개의 행이 있습니다. 우리는 그 데이터의 여러 가지 알려진 오류 기록에서 패턴을 식별해야합니다. 여기에 정말로 끓인 예제가 있습니다. 주어진 표 :테이블의 데이터 패턴을 식별하는 일종의 오픈 소스 라이브러리가 있습니까?
-----------------------
| id | title | date |
-----------------------
| 01 | c | 2009-01|
| 02 | a | 2009-02|
| 03 | a | 2009-02|
| 04 | b | 2009-03|
| 05 | b | 2009-03|
| 06 | a | 2009-04|
-----------------------
그리고 라이브러리에 나와있는 행 1,4,5가 어떻게 관련되어 있는지 묻습니다. 또는 다른 행과 다른 점은 무엇입니까? 이 라이브러리는 말할 것입니다 :
- 선택된 모든 행 모든 선택된 행 '는'
는 아마도 라이브러리가 피벗의 일련의 반복되는 = 제목이없는
실제 상황 (이상한 경우에만 해당) : 정확한 상황은 데이터 변경이 어떻게 든 '실행 취소'되었음을 알게 된 것입니다. 변경 사항을 '다시 실행'하고 막대기가되기를 기대하는 대신, 왜 발생했는지 파악하려고 노력하고 있습니다. 여기에 실제 열 가능한 데이터 패턴의 일부는 다음과 같습니다
-----------------------------------------------------
| id | user | created_on| facility | review_status |
-----------------------------------------------------
| 01 | tom | 2009-01 | Bay | Locked |
| 02 | berry | 2009-02 | Inner | |
| 03 | jan | 2009-02 | Hamming | Submited |
| 04 | bernie| 2009-03 | Youth | Accepted |
| 05 | jack | 2009-03 | Johnson | Locked |
| 06 | frank | 2009-04 | Baber St.| |
-----------------------------------------------------
우리의 문제는 '잠'만 아니었다으로 검토 상태 (5 열) 모두가 표시되어 있어야한다는 것입니다.
누구나 이런 종류의 패턴 검색 라이브러리를 알고 있습니까? 아래의 긴 대답은 머리에 못을 박았다. DATA MINING 소프트웨어는 돈이 맞는 것 같지만 솔루션은 오픈 소스 또는 "맥주처럼 자유"솔루션이어야합니다. 감사합니다. 모두들!
P. Petitio principii 답변 또는 초기 질문에 대답하지 않으려는 답변은 고려되지 않습니다 (실제로는 예상 한 방식이 아닌 것으로 간주됩니다).
알 수없는 패턴을 찾으십니까? 어떤 패턴? – markus
정확히 무엇을 찾고 있습니까, 무엇이 결함이 있습니까? 어떻게 결함이 있습니까? – markus
물론 ... ... 위의 명확한 설명이 추가되었습니다 – btelles