2014-03-07 4 views
0

.xls 파일의 일부 데이터 처리를 자동화하고 싶습니다. 데이터 형식은 소스에 따라 다릅니다.약간 다른 형식으로 데이터를 처리하는 방법은 무엇입니까?

데이터의 수동 처리는이 형식으로 파일 출력 :

ID (번호) | NAME (문자열) | PRICE (플로트)

I는 정보가 일반적으로 상기 된 바와 같이 열에 있지만 행에있을 수 있거나 하나만 처리해야하는 두 개의 테이블이있을 수 있습니다. 전략 패턴을 사용

  1. :

    나는 세 가지 방법을 고려했다. 단점 : 어쨌든 각 사례를 코드화해야합니다.
  2. ETL 도구 사용. 단점 : 나는 그것이 내가 필요로하는 것 이상이라고 생각한다.
  3. 선형 회귀 또는 신경망 또는 다른 기계 학습 알고리즘을 사용하여 예제가 쌍 (.xls 원시 파일, .xls 처리 파일)이됩니다. 단점 : 목적 함수에 대한 측정 항목이 무엇인지 알지 못합니다 (두 Excel 파일 간의 유사점은 무엇입니까?)

도움이나 도움을 주셔서 감사합니다!

+1

너무 구체적이지 않은 질문입니다. 경험이 부족한 프로그래머가 아니라는 점은 분명합니다. 그러나 가능한 다양한 입력 형식에 대해 자세히 설명하지는 않습니다. (3 ~ 300 ?) "최상의"전략을 제안하는 것은 어려울 것입니다. –

+0

다른 포맷의 수는 약 70 개입니다. 어쨌든 대부분이 꽤 비슷하기 때문에 전략 패턴을 사용하는 것 또는 각 포맷을 처리하는 메소드가있는 클래스가 가장 적절하다고 생각하는 것입니다. – MithPaul

답변

0

저는 선형 회귀 또는 신경망 사용에 익숙하지 않습니다.

이것은 데이터 형식이 다양하기 때문에 어려운 상황 중 하나입니다. 프로젝트에서 관찰 한 것은 ETL 도구 (ssis)를 사용할 때마다 코드를 작성하는 것입니다. 선형 회귀 또는 신경망을 사용하는 것은 어렵고 모델링에 대한 훌륭한 기술과 이해가 필요합니다.

관련 문제